由于在 Java 中创建一个实例的消耗不小,很多框架为了提高性能都使用对象池,Netty 也不例外。
本文主要分析 Netty 对象池 Recycler 的实现原理。
源码分析基于 Netty 4.1.52
缓存对象管理
Recycler 的内部类 Stack 负责管理缓存对象。
Stack 关键字段
// Stack所属主线程,注意这里使用了WeakReference
WeakReference<Thread> threadRef;
// 主线程回收的对象
DefaultHandle<?>[] elements;
// elements最大长度
int maxCapacity;
// elements索引
int size;
// 非主线程回收的对象
volatile WeakOrderQueue head;
复制代码
Recycler 将一个 Stack 划分给某个主线程,主线程直接从 Stack#elements 中存取对象,而非主线程回收对象则存入 WeakOrderQueue 中。
threadRef 字段使用了 WeakReference,当主线程消亡后,该字段指向对象就可以被垃圾回收。
DefaultHandle,对象的包装类,在 Recycler 中缓存的对象都会包装成 DefaultHandle 类。
head 指向的 WeakOrderQueue,用于存放其他线程的对象
WeakOrderQueue 主要属性
// Head#link指向Link链表首对象
Head head;
// 指向Link链表尾对象
Link tail;
// 指向WeakOrderQueue链表下一对象
WeakOrderQueue next;
// 所属线程
WeakReference<Thread> owner;
复制代码
Link 中也有一个DefaultHandle<?>[] elements
字段,负责存储数据。
注意,Link 继承了 AtomicInteger,AtomicInteger 的值存储 elements 的最新索引。
WeakOrderQueue 也是属于某个线程,并且 WeakOrderQueue 继承了WeakReference<Thread>
,当所属线程消亡时,对应 WeakOrderQueue 也可以被垃圾回收。
注意:每个 WeakOrderQueue 都只属于一个 Stack,并且只属于一个非主线程。
thread2 要存放对象到 Stack1 中,只能存放在 WeakOrderQueue1
thread1 要存放对象到 Stack2 中,只能存放在 WeakOrderQueue3
回收对象
DefaultHandle#recycle -> Stack#push
void push(DefaultHandle<?> item) {
Thread currentThread = Thread.currentThread();
if (threadRef.get() == currentThread) {
// #1
pushNow(item);
} else {
// #2
pushLater(item, currentThread);
}
}
复制代码
#1
当前线程是主线程,直接将对象加入到 Stack#elements 中。
#2
当前线程非主线程,需要将对象放到对应的 WeakOrderQueue 中
private void pushLater(DefaultHandle<?> item, Thread thread) {
...
// #1
Map<Stack<?>, WeakOrderQueue> delayedRecycled = DELAYED_RECYCLED.get();
WeakOrderQueue queue = delayedRecycled.get(this);
if (queue == null) {
// #2
if (delayedRecycled.size() >= maxDelayedQueues) {
delayedRecycled.put(this, WeakOrderQueue.DUMMY);
return;
}
// #3
if ((queue = newWeakOrderQueue(thread)) == null) {
return;
}
delayedRecycled.put(this, queue);
} else if (queue == WeakOrderQueue.DUMMY) {
// #4
return;
}
// #5
queue.add(item);
}
复制代码
#1
DELAYED_RECYCLED 是一个 FastThreadLocal,可以理解为 Netty 中的 ThreadLocal 优化类。它为每个线程维护了一个 Map,存储每个 Stack 和对应 WeakOrderQueue。
所有这里获取的 delayedRecycled 变量是仅用于当前线程的。
而 delayedRecycled.get 获取的 WeakOrderQueue,是以 Thread + Stack 作为维度区分的,只能是一个线程操作。
#2
当前 WeakOrderQueue 数量超出限制,添加 WeakOrderQueue.DUMMY 作为标记
#3
构造一个 WeakOrderQueue,加入到 Stack#head 指向的 WeakOrderQueue 链表中,并放入 DELAYED_RECYCLED。这时是需要一下同步操作的。
#4
遇到 WeakOrderQueue.DUMMY 标记对象,直接抛弃对象
#5
将缓存对象添加到 WeakOrderQueue 中。
WeakOrderQueue#add
void add(DefaultHandle<?> handle) {
handle.lastRecycledId = id;
// #1
if (handleRecycleCount < interval) {
handleRecycleCount++;
return;
}
handleRecycleCount = 0;
Link tail = this.tail;
int writeIndex;
// #2
if ((writeIndex = tail.get()) == LINK_CAPACITY) {
Link link = head.newLink();
if (link == null) {
return;
}
this.tail = tail = tail.next = link;
writeIndex = tail.get();
}
// #3
tail.elements[writeIndex] = handle;
handle.stack = null;
// #4
tail.lazySet(writeIndex + 1);
}
复制代码
#1
控制回收频率,避免 WeakOrderQueue 增长过快。
每 8 个对象都会抛弃 7 个,回收一个
#2
当前 Link#elements 已全部使用,创建一个新的 Link
#3
存入缓存对象
#4
延迟设置 Link#elements 的最新索引(Link 继承了 AtomicInteger),这样在该 stack 主线程通过该索引获取 elements 缓存对象时,保证 elements 中元素已经可见。
获取对象
Recycler#threadLocal 中存放了每个线程对应的 Stack。
Recycler#get 中首先获取属于当前线程的 Stack,再从该 Stack 中获取对象,也就是,每个线程只能从自己的 Stack 中获取对象。
Recycler#get -> Stack#pop
DefaultHandle<T> pop() {
int size = this.size;
if (size == 0) {
// #1
if (!scavenge()) {
return null;
}
size = this.size;
if (size <= 0) {
return null;
}
}
// #2
size --;
DefaultHandle ret = elements[size];
elements[size] = null;
this.size = size;
...
return ret;
}
复制代码
#1
elements 没有可用对象时,将 WeakOrderQueue 中的对象迁移到 elements
#2
从 elements 中取出一个缓存对象
scavenge -> scavengeSome -> WeakOrderQueue#transfer
boolean transfer(Stack<?> dst) {
Link head = this.head.link;
if (head == null) {
return false;
}
// #1
if (head.readIndex == LINK_CAPACITY) {
if (head.next == null) {
return false;
}
head = head.next;
this.head.relink(head);
}
// #2
final int srcStart = head.readIndex;
int srcEnd = head.get();
final int srcSize = srcEnd - srcStart;
if (srcSize == 0) {
return false;
}
// #3
final int dstSize = dst.size;
final int expectedCapacity = dstSize + srcSize;
if (expectedCapacity > dst.elements.length) {
final int actualCapacity = dst.increaseCapacity(expectedCapacity);
srcEnd = min(srcStart + actualCapacity - dstSize, srcEnd);
}
if (srcStart != srcEnd) {
final DefaultHandle[] srcElems = head.elements;
final DefaultHandle[] dstElems = dst.elements;
int newDstSize = dstSize;
// #4
for (int i = srcStart; i < srcEnd; i++) {
DefaultHandle<?> element = srcElems[i];
...
srcElems[i] = null;
// #5
if (dst.dropHandle(element)) {
continue;
}
element.stack = dst;
dstElems[newDstSize ++] = element;
}
// #6
if (srcEnd == LINK_CAPACITY && head.next != null) {
this.head.relink(head.next);
}
head.readIndex = srcEnd;
// #7
if (dst.size == newDstSize) {
return false;
}
dst.size = newDstSize;
return true;
} else {
// The destination stack is full already.
return false;
}
}
复制代码
就是把 WeakOrderQueue 中的对象迁移到 Stack 中。
#1
head.readIndex 标志现在已迁移对象下标
head.readIndex == LINK_CAPACITY
,表示当前 Link 已全部移动,查找下一个 Link
#2
计算待迁移对象数量
注意,Link 继承了 AtomicInteger
#3
计算 Stack#elements 数组长度,不够则扩容
#4
遍历待迁移的对象
#5
控制回收频率
#6
当前 Link 对象已全部移动,修改 WeakOrderQueue#head 的 link 属性,指向下一 Link,这样前面的 Link 就可以被垃圾回收了。
#7
dst.size == newDstSize
表示并没有对象移动,返回 false
否则更新 dst.size
其实对象池的实现难点在于线程安全。
Recycler 中将主线程和非主线程回收对象划分到不同的存储空间中(stack#elements 和 WeakOrderQueue.Link#elements),并且对于 WeakOrderQueue.Link#elements,存取操作划分到两端进行(非主线程从尾端存入,主线程从首部开始读取),
从而减少同步操作,并保证线程安全。
另外,Netty 还提供了更高级别的对象池类 ObjectPool,使用方法可以参考 PooledDirectByteBuf#RECYCLER,这里不再赘述。
如果您觉得本文不错,欢迎关注我的微信公众号,系列文章持续更新中。您的关注是我坚持的动力!
评论