New Java Feature - Foreign Memory API

Created2025-01-16|JavaFeature

|Word Count:802|Reading Time:2mins

概述

在讨论代码性能的时候，内存的使用效率是一个绕不开的话题 - Flink/Netty
为了避免 JVM GC 不可预测的行为以及额外的性能开销，一般倾向于使用 JVM 之外的内存来存储和管理数据 - 堆外数据 - off-heap data
使用堆外存储最常用的办法，是使用 ByteBuffer 来分配直接存储空间 - direct buffer
- JVM 会尽最大努力直接在 direct buffer 上执行 IO 操作，避免数据在本地和 JVM 之间的拷贝
频繁的内存拷贝是性能的主要障碍之一
- 为了极致的性能，应用程序通常会尽量避免内存的拷贝
- 理想的情况下，一份数据只需要一份内存空间 - 即零拷贝

ByteBuffer

使用 ByteBuffer 来分配直接存储空间

1	public static ByteBuffer allocateDirect(int capacity);

ByteBuffer 所在的 Java 包是 java.nio，ByteBuffer 的设计初衷是用于非阻塞编程
ByteBuffer 是异步编程和非阻塞编程的核心类，几乎所有的 Java 异步模式或者非阻塞模式的代码，都要直接或者间接地使用 ByteBuffer 来管理数据
非阻塞和异步编程模式的出现，起始于对阻塞式文件描述符（包括网络套接字）读取性能的不满
- 诞生于 2002 年的 ByteBuffer，其最初的设想也主要是用来解决当时文件描述符的读写性能

站在现在的视角重新审视该类的设计，会发现两个主要缺陷

缺陷 1 - 没有资源释放的接口
- 一旦一个 ByteBuffer 实例化，它占用内存的释放，会完全依赖 JVM GC
- 使用 direct buffer 的应用，往往需要把所有潜在的性能都挤压出来
- 而依赖于 JVM GC 的资源回收方式，并不能满足像 Netty 这样的类库的理想需求
缺陷 2 - 存储空间尺寸的限制
- ByteBuffer 的存储空间的大小，是使用 Java 的 int 来表示的，最多只有 2G - 一个无意带来的缺陷
- 在网络编程的环境下，这并不是一个问题，可是超过 2G 的文件，一定会越来越多
- 2G 以上的文件，映射到 ByteBuffer 上的时候，就会出现文件过大的问题

合理的改进 - 重造轮子 - 外部内存接口

外部内存接口

外部内存接口沿袭了 ByteBuffer 的设计思路，但使用了全新的接口布局
分配一段外部内存，并且存放 4 个字母 A

try (ResourceScope scope = ResourceScope.newConfinedScope()) {
    MemorySegment segment = MemorySegment.allocateNative(4, scope);
    for (int i = 0; i < 4; i++) {
        MemoryAccess.setByteAtOffset(segment, i, (byte)'A');
    }
}

ResourceScope 定义了内存资源的生命周期管理机制，实现了 AutoCloseable 接口，可以使用 try-with-resource 来及时释放掉它管理的内存 - 缺陷 1
MemorySegment 用于定义和模拟一段连续的内存区域，而 MemoryAccess 用于定义对 MemorySegment 执行读写操作
- 在外部内存接口的设计里，把对象表达和对象操作，拆分成两个类
- 这两类的寻址数据类型，使用的是 long - 缺陷 2

Author: zhongmingmao

Link: https://blog.zhongmingmao.top/2025/01/16/new-java-feature-foreign-memory-api/

Copyright Notice: All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.

Java Java Feature

Related Articles

New Java Feature - Foreign Function API

概述 Java 的外部函数接口这个特性，与外部内存接口一起，会极大地丰富 Java 语言的生态环境像 Java 或者 Go 这样的通用编程语言，都需要和其它的编程语言或者环境打交道 - 如操作系统或者 C 语言 Java 通过 Java 本地接口 JNI 来支持该做法本地方法接口示例1234567891011public class HelloWorld { static { System.loadLibrary("helloWorld"); } public static void main(String[] args) { new HelloWorld().sayHello(); } private native void sayHello();} sayHello 使用了 native 修饰符，是一个本地方法，可以使用 C 语言实现 - 生成对应的 C 语言的头文件 1234$ javac -h . HelloWorld.java$ lsHe...

New Java Feature - Flow

指令式编程最常用的代码控制模式 1System.out.println("Hello, World!"); 通过代码发布指令，然后等待指令的执行以及指令执行带来的状态变化并且根据目前的状态，来确定下一次要发布的指令，并且用代码把下一个指令表示出来指令式编程模型关注的重点在于控制状态 1234567try { Digest messageDigest = Digest.of("SHA-256"); byte[] digestValue = messageDigest.digest("Hello, world!".getBytes());} catch (NoSuchAlgorithmException ex) { System.out.println("Unsupported algorithm: SHA-256");} 首先调用 Digest.of 方法，得到一个 Digest 实例然后调用该实例的方法 Digest....

New Java Feature - Error Code

概述 Java 的异常处理是对代码性能有着重要影响的因素 Java 的异常处理，有着天生优势，特别是在错误排查方面的作用，很难找到合适的替代方案用例123456789101112131415161718192021222324252627282930313233343536package me.zhongmingmao;import java.security.NoSuchAlgorithmException;public class UseCase { public static void main(String[] args) { String[] algorithms = {"SHA-128", "SHA-192"}; String availableAlgorithm = null; for (String algorithm : algorithms) { Digest md; try { md = Digest.of(algorit...

New Java Feature - Exception

概述 Java 异常的使用和处理，是滥用最严重，诟病最多，也是最难平衡的一个难题 Java 语言支持三种异常的状况非正常异常（Error）、运行时异常（Runtime Exception）、检查型异常（Checked Exception）异常，除非特别声明，一般指的是 Checked Exception 和 Checked Exception 异常状况的处理会让代码的效率变低 - 不应该使用异常机制来处理正常情况理想情况下，在执行代码时没有任何异常发生，否则业务执行的效率会大打折扣几乎无法完成，不管是 JDK 核心类库还是业务代码，都存在大量的异常处理代码软件都是由很多类库集成的，大部分类库，都只是从自身的角度去考虑问题，使用异常来处理问题很难期望业务执行下来没有任何异常发生抛出异常影响了代码的运行效率，而实际业务又没有办法完全不抛出异常新的编程语言（Go），彻底抛弃类似于 Java 这样的异常机制，重新拥抱 C 语言的错误方式性能没有抛出异常的用例，能够支持的吞吐量要比抛出异常的用例大 1000 倍案例在设计算法公开接口时，算法的敏捷性是必须要要考虑的...

New Java Feature - Switch Matching

案例假设上面表示形状的封闭类和许可类是版本 1.0，它们被封装在一个基础 API 类库里 - 基础类库而 isSquare 的实现代码，被封装在另一个 API 类库里 - 扩展类库新加入一个许可类，用来表示长方形 - 基础类库的升级，扩展类库也要同步升级 - 但不一定能意识到对于需要更改扩展类库这件事，基础类库的作者，不会通知到扩展类库的作者一般情况下，基础类库和扩展类库是独立的作品，由不同的团队和社区维护基础类库的作者不太可能意识到扩展类库的存在，更不可能去研究扩展类库的实现细节扩展类库维护者也不会注意到基础类库的修改，更不容易想到基础类库的修改会影响到扩展类库的行为模式匹配的 switch 具有模式匹配能力的 switch - 将模式匹配扩展到 switch 语句和 switch 表达式允许测试多个模式，每个模式多可以有特定的操作 - 简洁安全地表达复杂的面向数据的查询扩充的匹配类型在 JDK 17 之前的 switch 关键字可以匹配的数据类型包括 - 数字、枚举和字符串 - 本质上都是整型的原始类型在 JDK 17 之后，匹配的目标数据类型，可以...

New Java Feature - Switch Expression

概述 JDK 14 在 Java 规范里，表达式完成对数据的操作一个表达式的结果可以是一个数值（i * 4）；或者是一个变量（i = 4）；或者什么都不是（void 类型） Java 语句是 Java 最基本的可执行单元它本身不是一个数值，也不是一个变量 Java 语句的标志性符号是分号（代码）和大括号（代码块） - if-else 语句、赋值语句等 switch 表达式是一个表达式，而 switch 语句是一个语句 Switch 语句12345678910111213141516171819202122232425262728293031323334353637class DaysInMonth { public static void main(String[] args) { Calendar today = Calendar.getInstance(); int month = today.get(Calendar.MONTH); int year = today.get(Calendar.YEAR); int daysI...