Java性能 -- 并发设计模式
线程上下文模式 线程上下文指的是贯穿线程整个生命周期的对象中的一些全局信息,如Spring中的ApplicationContext 可以使用ThreadLocal实现上下文 ThreadLocal是线程本地变量,可以实现多线程的数据隔离,每个线程只能访问各自内部的副本变量 Thread-Per-Message模式 一个消息一个线程 在Socket通信中,一个线程监听IO事件,每当监听到一个IO事件,就交给另一个处理线程执行IO操作 如果遇到高并发,就会出现严重的性能问题,因为线程在操作系统中也是昂贵的资源,不能无限制地创建 如果针对每个IO请求都创建一个线程来处理,在有大量请求同时进来时,就会创建大量线程 每次请求都需要创建和销毁线程,性能开销很大 可以使用线程池来代替线程的创建和销毁 ServerHandler1234567891011121314151617181920212223242526272829303132333435363738@AllArgsConstructorpublic class ServerHandler implements Runnable {...
Kafka -- 高水位 + Leader Epoch
高水位水位的定义 经典教科书 在时刻T,任意创建时间(Event Time)为T',且T'<=T的所有事件都已经到达,那么T就被定义为水位 《Streaming System》 水位是一个单调增加且表征最早未完成工作的时间戳 上图中标注为Completed的蓝色部分代表已经完成的工作,标注为In-Flight的红色部分代表正在进行中的工作 两者的边界就是水位线 在Kafka中,水位不是时间戳,而是与位置信息绑定的,即用消息位移来表征水位 Kafka中也有低水位(Low Watermark),是与Kafka删除消息相关联的概念 高水位的作用 两个作用 定义消息可见性,即用来标识分区下的哪些消息可以被消费者消费的 帮助Kafka完成副本同步 上图是某个分区Leader副本的高水位图,在分区高水位以下的消息被认为是已提交消息,反之为未提交消息 消费者只能消费已提交消息,即位移小于8的所有消息 暂不讨论Kafka事务,Kafka的事务机制会影响消费者所能看到的消息的范围,不只是简单依赖高水位来判断 而是依靠LSO(Log Stable Offset)的位移...
Java性能 -- 原型模式 + 享元模式
原型模式 原型模式:通过给出一个原型对象来指明所创建的对象的类型,然后使用自身实现的克隆接口来复制这个原型对象 使用这种方式创新的对象的话,就无需再通过new实例化来创建对象了 Object类的clone方法是一个Native方法,可以直接操作内存中的二进制流,所以相对new实例化来说,性能更佳 实现原型模式12345678910111213141516171819202122232425262728class Prototype implements Cloneable { @Override public Prototype clone() { Prototype prototype = null; try { prototype = (Prototype) super.clone(); } catch (CloneNotSupportedException e) { e.printStackTrace(); } ...
Kafka -- 控制器
控制器 控制器(Controller)是Kafka的核心组件,主要作用是在ZK的帮助下管理和协调整个Kafka集群 集群中任一Broker都能充当控制器的角色,但在运行过程中,只能有一个Broker成为控制器,行使管理和协调的职责 12345678910111213[zk: localhost:2181(CONNECTED) 1] get /controller{"version":1,"brokerid":0,"timestamp":"1571311742367"}cZxid = 0xd68ctime = Thu Oct 17 19:29:02 CST 2019mZxid = 0xd68mtime = Thu Oct 17 19:29:02 CST 2019pZxid = 0xd68cversion = 0dataVersion = 0aclVersion = 0ephemeralOwner = 0x1000209974b0000dataLength = 54numChildren = 0 Zo...
Java性能 -- 单例模式
饿汉模式class1234567891011// 饿汉模式public final class Singleton { private static Singleton instance = new Singleton(); private Singleton() { } public static Singleton getInstance() { return instance; }} 使用了static修饰了成员变量instance,所以该变量会在类初始化的过程中被收集进_类构造器<clinit>_ 在多线程场景下,JVM会保证只有一个线程能够执行该类的<clinit>方法,其它线程将会被阻塞等待 等到唯一的一次<clinit>方法执行完成后,其它线程将不会再执行<clinit>方法,转而执行自己的代码 因此,static修饰的成员变量instance,在多线程的情况下能保证只实例化一次 在类初始化阶段就已经在堆内存中开辟了一块内存,用...
Kafka -- 重平衡
触发重平衡 组成员数量发生变化 – 最常见 订阅主题数量发生变化 订阅主题的分区数发生变化 通知 重平衡过程是通过消费者的心跳线程通知到其它消费者实例的 Kafka Java消费者需要定期地发送心跳请求到Broker端的协调者,表明它还活着 在Kafka 0.10.1.0之前,发送心跳请求是在消费者主线程完成的,即调用poll方法的那个线程 弊端 消息处理逻辑是也在主线程完成的 一旦消息处理消耗了很长时间,心跳请求将无法及时发送给协调者,导致协调者误以为消费者已死 从Kafka 0.10.1.0开始,社区引入了单独的心跳线程 重平衡的通知机制是通过心跳线程来完成的 当协调者决定开启新一轮重平衡后,会将REBALANCE_IN_PROGRESS封装进心跳请求的响应中 当消费者实例发现心跳响应中包含REBALANCE_IN_PROGRESS,就知道重平衡要开始了,这是重平衡的通知机制 heartbeat.interval.ms的真正作用是控制重平衡通知的频率 消费者组状态机 状态 描述 Empty 组内没有任何成员,但消费者组可能存在已提交的位移数据,而且这些位移尚未过期 ...
Kafka -- 处理请求
请求协议 Kafka自定义了一组请求协议,用于实现各种各样的交互操作 PRODUCE请求用于生产消息,FETCH请求用于消费消息,METADATA请求用于请求Kafka集群元数据信息 Kafka 2.3总共定义了45种请求格式,所有请求都通过TCP网络以Socket的方式进行通讯 处理请求方案顺序处理实现简单,但吞吐量太差,只适用于请求发送非常不频繁的场景 1234while (true) { Request request = accept(connection); handle(request);} 单独线程处理为每个请求都创建一个新的线程异步处理,完全异步,但开销极大,只适用于请求发送频率很低的场景 12345while (true) { Request request = accept(connection); Thread thread = new Thread(() -> { handle(request); }); thread.start();} Reactor模式 Reac...
Kafka -- 副本
副本机制的优点 提供数据冗余 即使系统部分组件失效,系统依然能够继续运转,增加了整体可用性和数据持久性 提供高伸缩性 支持横向扩展,能够通过增加机器的方式来提升读性能,进而提高读操作吞吐量 改善数据局部性 允许将数据放入与用户地理位置相近的地方,从而降低系统延时 Kafka只能享受副本机制提供数据冗余实现的高可用性和高持久性 副本定义 Kafka主题划分为若干个分区,副本的概念上是在分区层级下定义的,每个分区配置若干个副本 副本:本质上是一个_只能追加写消息的提交日志_ 同一个分区下的所有副本保存有相同的消息序列,这些副本分散保存在不同的Broker上,提高了数据可用性 实际生产环境中,每台Broker都可能保存有各个主题不同分区的不同副本 副本角色 Kafka采用基于领导者(Leader-based)的副本机制 副本分为两类:领导者副本(Leader Replica)和追随者副本(Follower Replica) 每个分区在创建时都要选举一个副本,称为领导者副本,其余的副本自动称为追随者副本 追随者副本是不对外提供服务的,所有的读写请求都必须发往领导者副本所在的B...
Java性能 -- JVM堆内存分配
JVM内存分配性能问题 JVM内存分配不合理最直接的表现就是频繁的GC,这会导致上下文切换,从而降低系统的吞吐量,增加系统的响应时间 对象在堆中的生命周期 在JVM内存模型的堆中,堆被划分为新生代和老年代 新生代又被进一步划分为Eden区和Survivor区,Survivor区由From Survivor和To Survivor组成 当创建一个对象时,对象会被优先分配到新生代的Eden区 此时JVM会给对象定义一个对象年轻计数器(-XX:MaxTenuringThreshold) 当Eden空间不足时,JVM将执行新生代的垃圾回收(Minor GC) JVM会把存活的对象转移到Survivor中,并且对象年龄+1 对象在Survivor中同样也会经历Minor GC,每经历一次Minor GC,对象年龄都会+1 如果分配的对象超过了-XX:PetenureSizeThreshold,对象会直接被分配到老年代 查看JVM堆内存分配 在默认不配置JVM堆内存大小的情况下,JVM根据默认值来配置当前内存大小 在JDK 1.7中,默认情况下新生代和老年代的比例是1:2,可以通过–XX:New...
Kafka -- 监控消费进度
Consumer Lag Consumer Lag(滞后程度):消费者当前落后于生产者的程度 Lag的单位是消息数,一般是在主题的级别上讨论Lag,但Kafka是在分区的级别上监控Lag,因此需要手动汇总 对于消费者而言,Lag是最重要的监控指标,直接反应了一个消费者的运行情况 一个正常工作的消费者,它的Lag值应该很小,甚至接近于0,滞后程度很小 如果Lag很大,表明消费者无法跟上生产者的速度,Lag会越来越大 极有可能导致消费者消费的数据已经不在操作系统的页缓存中了,这些数据会失去享有Zero Copy技术的资格 这样消费者不得不从磁盘读取这些数据,这将进一步拉大与生产者的差距 马太效应:_Lag原本就很大的消费者会越来越慢,Lag也会也来越大_ 监控LagKafka自带命令 kafka-consumer-groups是Kafka提供的最直接的监控消费者消费进度的工具 也能监控独立消费者的Lag,独立消费者是没有使用消费者组机制的消费者程序,也要配置group.id 消费者组要调用KafkaConsumer.subscribe,独立消费者要调用KafkaConsumer.assign直...















