ByteCoding

Created2019-09-09|JavaPerformance

编译前端编译：即常见的**.java文件被编译成.class文件**的过程运行时编译：机器无法直接运行Java生成的字节码，在运行时，JIT或者解释器会将字节码转换为机器码类文件在运行时被进一步编译，可以变成高度优化的机器代码 C/C++编译器的所有优化都是在编译期完成的，运行期的性能监控仅作为基础的优化措施是无法进行的 JIT编译器是JVM中运行时编译最重要的部分之一编译 / 加载 / 执行类编译 javac：将.java文件编译成.class文件 javap：反编译.class文件，重点关注常量池和方法表集合常量池主要记录的是类文件中出现的字面量和符号引用字面量：字符串常量、基本类型的常量符号引用：类和接口的全限定名、类引用、方法引用、成员变量引用方法表集合方法的字节码、方法访问权限、方法名索引、描述符索引、JVM执行指令、属性集合等类加载当一个类被创建实例或者被其他对象引用时，JVM如果没有加载过该类，会通过类加载器将**.class文件加载到内存**中不同的实现类由不同的类加载器加载 JDK中的本地方法类一般由...

Kafka -- 多线程消费者

Created2019-09-08|MiddlewareMQKafka

Kafka Java Consumer设计原理 Kafka Java Consumer从Kafka 0.10.1.0开始，KafkaConsumer变成了双线程设计，即用户主线程和心跳线程用户主线程：启动Consumer应用程序main方法的那个线程心跳线程：只负责定期给对应的Broker机器发送心跳请求，以标识消费者应用的存活性引入心跳线程的另一个目的将心跳频率和主线程调用KafkaConsumer.poll方法的频率分开，解耦真实的消息处理逻辑和消费组成员存活性管理虽然有了心跳线程，但实际的消息获取逻辑依然是在用户主线程中完成因此在消费消息的这个层面，依然可以安全地认为KafkaConsumer是单线程的设计老版本Consumer是多线程的架构每个Consumer实例在内部为所有订阅的主题分区创建对应的消息获取线程，即Fetcher线程老版本Consumer同时也是阻塞式的，Consumer实例启动后，内部会创建很多阻塞式的消息获取迭代器但在很多场景下，Consumer端有非阻塞需求，如在流处理应用中执行过滤、分组等操作就不能是阻塞式的基于这个原因，社区为新版本...

Java性能 -- JVM内存模型

Created2019-09-07|JavaPerformance

JVM内存模型堆堆是JVM内存中最大的一块内存空间，被所有线程共享，几乎所有对象和数组都被分配到堆内存中堆被划分为新生代和老年代，新生代又被划分为Eden区和Survivor区（From Survivor + To Survivor）永久代在Java 6中，永久代在非堆内存中在Java 7中，永久代的静态变量和运行时常量池被合并到堆中在Java 8中，永久代被元空间取代程序计数器程序计数器是一块很小的内存空间，主要用来记录各个线程执行的字节码的地址 Java是多线程语言，当执行的线程数量超过CPU数量时，线程之间会根据时间片轮询争夺CPU资源当一个线程的时间片用完了，或者其他原因导致该线程的CPU资源被提前抢夺那么退出的线程需要单独的程序计数器来记录下一条运行的指令方法区方法区 != 永久代 HotSpot VM使用了永久代来实现方法区，但在其他VM（Oracle JRockit、IBM J9）不存在永久代一说方法区只是JVM规范的一部分，在HotSpot VM中，使用了永久代来实现JVM规范的方法区方法区主要用来存放已被虚拟机加载的类相关信...

Kafka -- CommitFailedException

Created2019-09-06|MiddlewareMQKafka

CommitFailedException CommitFailedException是Consumer客户端在提交位移时出现的不可恢复的严重异常如果异常是可恢复的瞬时错误，提交位移的API方法是支持自动错误重试的，如commitSync方法解释 Commit cannot be completed since the group has already rebalanced and assigned the partitions to another member. This means that the time between subsequent calls to poll() was longer than the configured max.poll.interval.ms, which typically implies that the poll loop is spending too much time message processing. You can address this either by increasing the max.poll.interval.m...

Java性能 -- 并发一致性

Created2019-09-05|JavaPerformance

背景在并发编程中，Java是通过共享内存来实现共享变量操作的，所以在多线程编程中会涉及到数据一致性的问题 1234567public class Example { int x = 0; public void count() { x++; // 1 System.out.println(x) // 2 }} 有两个线程分别执行count方法，x是共享变量可能出现3种结果：**<1,1>**，<2,1>，<1,2> Java内存模型 Java采用共享内存模型来实现多线程之间的信息交换和数据同步程序运行时，局部变量将会存放在虚拟机栈中，而共享变量将会被保存在堆内存中由于局部变量随线程的创建而创建，线程的销毁而销毁，Java栈数据并非线程共享，所以不需要关心数据的一致性共享变量存储在堆内存或方法区中，堆内存和方法区的数据是线程共享的堆内存中的共享变量在被不同线程操作时，会被加载到线程的工作内存中，即_CPU中的高速缓存_...

Java性能 -- 命令行工具

Created2019-09-04|JavaPerformance

free12345$ free -m total used free shared buffers cachedMem: 15948 15261 687 304 37 6343-/+ buffers/cache: 8880 7068Swap: 0 0 0 Mem是从操作系统的角度来看的总共有15948M物理内存，其中15261M被使用了，还有687可用，15948 = 15261 + 687 有若干线程共享了304M物理内存，已经被弃用（值总为0） buffer / cached ：为了提高IO性能，由OS管理 A buffer is something that has yet to be “written” to disk. A cache is something that has been “read” from the disk and sto...

Kafka -- 提交位移

Created2019-09-03|MiddlewareMQKafka

消费位移 Consumer的消费位移，记录了Consumer要消费的下一条消息的位移假设一个分区中有10条消息，位移分别为0到9 某个Consumer消费了5条消息，实际消费了位移0到4的5条消息，此时Consumer的位移为5，指向下一条消息的位移 Consumer需要向Kafka汇报自己的位移数据，这个汇报过程就是提交位移 Consumer能够同时消费多个分区的数据，所以位移的提交实际上是在分区粒度上进行的 Consumer需要为分配给它的每个分区提交各自的位移数据提交位移主要是为了表征Consumer的消费进度当Consumer发生故障重启后，能够从Kafka中读取之前提交的位移值，然后从相应的位移处继续消费位移提交的语义如果提交了位移X，那么Kafka会认为位移值小于X的消息都已经被成功消费了灵活位移提交非常灵活，可以提交任何位移值，但要承担相应的后果假设Consumer消费了位移为0~9的10条消息如果提交的位移为20，位移位于10~19的消息可能会丢失如果提交的位移为5，位移位于5~9的消息可能会被重复消费位移提交的语义保障由应用程序保证，Ka...

Java性能 -- 协程

Created2019-09-02|JavaPerformance

线程实现模型轻量级进程和内核线程一对一相互映射实现的1:1线程模型用户线程和内核线程实现的N:1线程模型用户线程和轻量级进程混合实现的N:M线程模型 1:1线程模型内核线程（Kernel-Level Thread）是由操作系统内核支持的线程，内核通过调度器对线程进行调度，负责完成线程的切换在Linux中，往往通过fork函数创建一个子进程来代表一个内核中的线程一个进程调用fork函数后，系统会先给新的子进程分配资源，然后复制主进程，只有少数值与主进程不一样采用fork的方式，会产生大量的冗余数据，占用大量内存空间，也会消耗大量CPU时间来初始化内存空间和复制数据如果是一模一样的数据，可以共享主进程的数据，于是轻量级进程（Light Weight Process，LWP）出现了 LWP使用clone系统调用创建线程 clone函数将部分父进程的资源的数据结构进行复制，复制内容可选，且没有被复制的资源可以通过指针共享给子进程 LWP运行单元更小，运行速度更快，LWP和内核线程一一映射，每个LWP都是由一个内核线程支持 N:1线程模型 1:1线程模型的缺陷在线程创建、切换上都...

Kafka -- 避免重平衡

Created2019-09-01|MiddlewareMQKafka

概念 Rebalance是让Consumer Group下所有的Consumer实例就如何消费订阅主题的所有分区达成共识的过程在Rebalance过程中，所有Consumer实例共同参与，在协调者组件的帮助下，完成订阅主题分区的分配整个Rebalance过程中，所有Consumer实例都不能消费任何消息，因此对Consumer的TPS影响很大协调者协调者，即Coordinator，负责为Consumer Group执行Rebalance以及提供位移管理和组成员管理等 Consumer端应用程序在提交位移时，其实是向Coordinator所在的Broker提交位移 Consumer应用启动时，也是向Coordinator所在的Broker发送各种请求然后由Coordinator负责执行消费组的注册、成员管理记录等元数据管理操作所有Broker在启动时，都会创建和开启相应的Coordinator组件，所有Broker都有各自的Coordinator组件内部位移主题__consumer_offsets记录了为Consumer Group服务的Coordinator在哪一台Broker上...

Java性能 -- 线程池大小

Created2019-08-31|JavaPerformance

线程池原理在Hotspot JVM的线程模型中，Java线程被一对一映射为内核线程 Java使用线程执行程序时，需要创建一个内核线程，当该Java线程被终止时，这个内核线程也会被回收 Java线程的创建和销毁将会消耗一定的计算机资源，从而增加系统的性能开销大量创建线程也会给系统带来性能问题，线程会抢占内存和CPU资源，可能会发生内存溢出、CPU超负载等问题线程池：即可以提高线程复用，也可以固定最大线程数，防止无限制地创建线程当程序提交一个任务需要一个线程时，会去线程池查找是否有空闲的线程如果有，则直接使用线程池中的线程工作，如果没有，则判断当前已创建的线程数是否超过最大线程数如果未超过，则创建新线程，如果已经超过，则进行排队等待或者直接抛出异常线程池框架Executor Java最开始提供了ThreadPool来实现线程池，为了更好地实现用户级的线程调度，Java提供了一套Executor框架 Executor框架包括了ScheduledThreadPoolExecutor和ThreadPoolExecutor两个核心线程池，核心原理一样 ScheduledThreadPoo...