ByteCoding

Created2019-09-29|MiddlewareMQKafka

主机监控主机监控：监控Kafka集群Broker所在的节点机器的性能常见的主机监控指标机器负载 CPU使用率内存使用率，包括空闲内存和已使用内存磁盘IO使用率，包括读使用率和写使用率网络IO使用率 TCP连接数打开文件数 inode使用情况 JVM监控重点指标 Full GC发生频率和时长活跃对象大小应用线程总数设置堆大小经历一次Full GC后，堆上存活的活跃对象大小为S，可以安全地将老年代堆大小设置为1.5S或者2S 从0.9.0.0版本开始，社区将默认的GC收集器设置为G1，而G1的Full GC是由单线程执行的，速度非常慢一旦发现Broker进程频繁Full GC，可以开启G1的**-XX:+PrintAdaptiveSizePolicy，获知引发Full GC的原因** 集群监控查看Broker进程是否启动，端口是否建立在容器化的Kafka环境，容器虽然启动成功，但由于网络配置有误，会出现进程已经启动但端口未成功监听的情形查看Broker端关键日志 Broker端服务器日志server.log – 最重要控制器日志controlle...

Kafka -- KafkaAdminClient

Created2019-09-28|MiddlewareMQKafka

背景命令行脚本只能运行在控制台上，在应用程序、运维框架或者监控平台中集成它们，会非常困难很多命令行脚本都是通过连接ZK来提供服务的，这会存在潜在的问题，即绕过Kafka的安全设置运行这些命令行脚本需要使用Kafka内部的类实现，也就是Kafka服务端的代码社区是希望用户使用Kafka客户端代码，通过现有的请求机制来运维管理集群基于上述原因，社区于0.11版本正式推出Java客户端版的KafkaAdminClient 功能主题管理主题的创建、删除、查询权限管理具体权限的配置和删除配置参数管理 Kafka各种资源（Broker、主题、用户、Client-Id等）的参数设置、查询副本日志管理副本底层日志路径的变更和详情查询分区管理创建额外的主题分区消息删除删除指定位移之前的分区消息 Delegation Token管理 Delegation Token的创建、更新、过期、查询消费者组管理消费者组的查询、位移查询和删除 Preferred领导者选举推选指定主题分区的Preferred Broker为领导者工作原理 Kaf...

Kafka -- 常用脚本

Created2019-09-27|MiddlewareMQKafka

脚本列表12345678connect-distributed kafka-consumer-perf-test kafka-reassign-partitions kafka-verifiable-producerconnect-standalone kafka-delegation-tokens kafka-replica-verification trogdorkafka-acls kafka-delete-records kafka-run-class zookeeper-security-migrationkafka-broker-api-versions kafka-dump-log kafka-server-start zookeeper-server-startkafka-configs ...

Kafka -- 重设消费者组位移

Created2019-09-26|MiddlewareMQKafka

背景 Kafka和传统的消息引擎在设计上有很大的区别，Kafka消费者读取消息是可以重演的像RabbitMQ和ActiveMQ等传统消息中间件，处理和响应消息的方式是破坏性一旦消息被成功处理，就会从Broker上被删除 Kafka是基于日志结构（Log-based）的消息引擎消费者在消费消息时，仅仅是从磁盘文件中读取数据而已，是只读操作，因为消费者不会删除消息数据同时，由于位移数据是由消费者控制的，因此能够很容易地修改位移值，实现重复消费历史数据的功能 Kafka Or 传统消息中间件传统消息中间件：消息处理逻辑非常复杂，处理代价高、又不关心消息之间的顺序 Kafka：需要较高的吞吐量、但每条消息的处理时间很短，又关心消息的顺序重设位移策略位移维度直接把消费者的位移值重设成给定的位移值时间维度给定一个时间，让消费者把位移调整成大于该时间的最小位移维度策略含义位移维度 Earliest 把位移调整到当前最早位移处 Latest 把位移调整到当前最新位移处 Current 把位移调整到当前最新提交位移处 Specified...

Kafka -- 动态配置

Created2019-09-25|MiddlewareMQKafka

背景 Kafka安装目录的config路径下，有server.properties文件通常情况下，会指定server.properties来启动Broker 如果要设置Broker端的任何参数，必须要显式修改server.properties，然后重启Broker，让参数生效但在生产环境，不能随意重启Broker，因此需要能够动态修改Broker端参数社区于1.1.0正式引入了动态Broker参数动态指的是修改参数后，无需重启Broker就能立即生效，而之前server.properties中配置的参数称为静态参数并非所有Broker端参数都可以动态调整的，官方文档中有Dynamic Update Mode一列 read-only 与原来的参数行为一样，只有重启Broker，才能令修改生效 per-broker 动态参数，修改之后，只会在对应的Broker上生效 cluster-wide 动态参数，修改之后，会在整个集群范围内生效使用场景动态调整Broker端各种线程池大小，实时应对突发流量 – 比较常用动态调整Broker端连接信息或安全配置信息动态更新...

Java性能 -- 高性能SQL

Created2019-09-24|JavaPerformance

慢SQL诱因无索引、索引失效锁等待 InnoDB支持行锁，MyISAM支持表锁 InnoDB支持行锁更适合高并发场景，但行锁有可能会升级为表锁一种情况是在批量更新时行锁是基于索引加的锁，如果在更新操作时，条件索引失效，那么行锁会升级为表锁基于表锁的数据库操作，会导致SQL阻塞等待，影响执行速度在写大于读的情况下，不建议使用MyISAM 行锁相对于表锁，虽然粒度更细，并发能力提升，但也带来了新的问题，那就是死锁不恰当的SQL SELECT * SELECT COUNT(*) 大表中使用LIMIT M,N 对非索引字段进行排序 SQL诊断EXPLAIN id：每个执行计划都有一个id，如果是一个联合查询，会有多个id select_type SIMPLE：普通查询，即没有联合查询、子查询 PRIMARY：主查询 UNION：UNION中后面的查询 SUBQUERY：子查询 table：当前执行计划查询的表，如果表有别名，则显示别名 partitions：分区表信息 type 从表中查询到行所执行的方式由好到坏：_**system > const > eq...

Kafka -- 主题管理

Created2019-09-23|MiddlewareMQKafka

日常管理创建主题1$ kafka-topics --bootstrap-server localhost:9092 --create --topic t1 --partitions 1 --replication-factor 1 从Kafka 2.2版本开始，推荐使用--bootstrap-server代替--zookeeper（标记为已过期）原因使用--zookeeper会绕过Kafka的安全体系，不受认证体系的约束使用--bootstrap-server与集群交互是未来的趋势查询主题列表12345$ kafka-topics --bootstrap-server localhost:9092 --list__consumer_offsets_schemast1transaction 查询单个主题1234567$ kafka-topics --bootstrap-server localhost:9092 --describe --topic __consumer_offsetsTopic:__consumer_offsets PartitionCount:50 Repl...

Java性能 -- 生产者消费者模式 + 装饰器模式

Created2019-09-22|JavaPerformance

生产者消费者模式实现方式Object的wait/notify/notifyAll 基于Object的wait/notify/notifyAll与对象监视器（Monitor）实现线程间的等待和通知这种方式实现的生产者消费者模式是基于内核实现的，可能会导致大量的上下文切换，性能不是最理想的 Lock中Condition的await/signal/signalAll 相对于Object的wait/notify/notifyAll，更推荐JUC包提供的Lock && Condition实现的生产者消费者模式 Lock && Condition实现的生产者消费者模式，是基于Java代码层实现的，在性能和扩展性方面更有优势 BlockingQueue 简单明了限流算法漏桶算法通过限制容量池大小来控制流量，而令牌桶算法则通过限制发放令牌的速率来控制流量漏桶算法请求如果要进入业务层，就必须经过漏桶，而漏桶出口的请求速率是均衡的如果漏桶已经满了，请求将会溢出，不会因为入口的请求量突然增加而导...

Java性能 -- 并发设计模式

Created2019-09-21|JavaPerformance

线程上下文模式线程上下文指的是贯穿线程整个生命周期的对象中的一些全局信息，如Spring中的ApplicationContext 可以使用ThreadLocal实现上下文 ThreadLocal是线程本地变量，可以实现多线程的数据隔离，每个线程只能访问各自内部的副本变量 Thread-Per-Message模式一个消息一个线程在Socket通信中，一个线程监听IO事件，每当监听到一个IO事件，就交给另一个处理线程执行IO操作如果遇到高并发，就会出现严重的性能问题，因为线程在操作系统中也是昂贵的资源，不能无限制地创建如果针对每个IO请求都创建一个线程来处理，在有大量请求同时进来时，就会创建大量线程每次请求都需要创建和销毁线程，性能开销很大可以使用线程池来代替线程的创建和销毁 ServerHandler1234567891011121314151617181920212223242526272829303132333435363738@AllArgsConstructorpublic class ServerHandler implements Runnable {...

Kafka -- 高水位 + Leader Epoch

Created2019-09-20|MiddlewareMQKafka

高水位水位的定义经典教科书在时刻T，任意创建时间（Event Time）为T'，且T'<=T的所有事件都已经到达，那么T就被定义为水位《Streaming System》水位是一个单调增加且表征最早未完成工作的时间戳上图中标注为Completed的蓝色部分代表已经完成的工作，标注为In-Flight的红色部分代表正在进行中的工作两者的边界就是水位线在Kafka中，水位不是时间戳，而是与位置信息绑定的，即用消息位移来表征水位 Kafka中也有低水位（Low Watermark），是与Kafka删除消息相关联的概念高水位的作用两个作用定义消息可见性，即用来标识分区下的哪些消息可以被消费者消费的帮助Kafka完成副本同步上图是某个分区Leader副本的高水位图，在分区高水位以下的消息被认为是已提交消息，反之为未提交消息消费者只能消费已提交消息，即位移小于8的所有消息暂不讨论Kafka事务，Kafka的事务机制会影响消费者所能看到的消息的范围，不只是简单依赖高水位来判断而是依靠LSO（Log Stable Offset）的位移...