NIO 看破也说破(四)—— Java 的 NIO

Java的NIO有selector,系统内核也提供了多种非阻塞IO模型,Java社区也出现了像netty这种优秀的 NIO 框架。Java的NIO 与内核的阻塞模型到底什么关系,为什么Java有NIO的API还出现了netty这种框架,网上说的 reactor 到底是什么?本文通过分析代码,带你一步步搞清楚Java的NIO和系统函数之间的关系,以及Java NIO 是如何一步步衍生出来netty框架。
NIO概念
前几节我们提到了 Nonblocking IO 的概念,在Java中有Java NIO 的系列包,网上的大多数资料把Java的NIO等同于 Nonblocking IO ,这是错误的。Java 中的 NIO 指的是从1.4版本后,提供的一套可以替代标准的Java IO 的 new API。有三部分组成:
Buffer 缓冲区
Channel 通道
Selector 选择器
API的具体使用不在本文赘述。
代码模板
NIO大致分为这几步骤:
获取channel
设置非阻塞
创建多路复用器selector
channel和selector做关联
根据selector返回的channel状态处理逻辑
单线程示例
参考代码模板,我们用 NIO 实现一个Echo Server。server代码如下:
写一个client ,模拟 50 个线程同时请求 server 端,在 readHandler 中模拟了随机sleep。client代码:

Selector 实现原理
用strace启动,[root@f00e68119764 tmp]# strace -ff -o out /usr/lib/jvm/java-1.8.0/bin/java NIOServerSingle
分析执行的过程,在日志中可以看到如下片段:
可以看出,在Java的 NIO 中(java1.8)底层是调用的系统 epoll ,关于 epoll 请出门右转 这里不再啰嗦。
从源码中也可以看出:
openSelector是抽象方法具体实现类,在Linux上代码如下:
跟踪代码可以看到最后调用 native 方法,说明:Java NIO 是利用系统内核提供的能力。
多线程处理
我们把单线程示例中,readHandler 随机 sleep,稍稍做些修改。模拟 server 端执行某一次请求时,处理过慢,如图示:
第十五个请求过来时,随机sleep:
结果第十五个线程之后,所有 client 的执行都有一个短暂的等待

很容易解释,因为在单线程处理中,channel创建、IO读写均为一个 Thread ,面对50个 client,IO时间需要排队处理。因此我们Redis系列中也提到了在Redis中,尽量避免某一个key的操作会很耗时的情况。可以参考 出门右转
我们对代码做一些改造,client 端代码不动,server 端代码稍作调整。增加一个线程来处理读写时间,代码片段如下:
这样相当于server端有两个线程,一个是主线程启动的 selector 来监听 channel 的 OP_ACCEPT 状态,另一个线程是处理 channel 的读写。程序也可以继续执行,稍稍快了一些。

reactor模式
接触 NIO 就一定听过reactor 这个名词,reactor 经常被混入 NIO 中,让很多人混淆概念。Reactor 到底是什么,维基百科的解释:
The reactor design pattern is an event handling pattern for handling service requests delivered concurrently to a service handler by one or more inputs. The service handler then demultiplexes the incoming requests and dispatches them synchronously to the associated request handlers.
核心点四个:
reactor design pattern (reactor是一种设计模式,不是专属于某个语言或框架的)
event handling pattern (事件处理模式)
delivered concurrently to a service handler by one or more inputs(一次处理一个或多个输入)
demultiplexes the incoming requests and dispatches them(多路分解,分发)
我们对单线程示例做些修改:
initServer的实现:
dispatcher 的实现:
acceptHandler的实现:
readHandler的实现:
单线程Reactor
改造后的代码,具备了以下特点:
基于事件驱动( NIO 的 selector,底层对事件驱动的epoll实现 jdk1.8)
统一分派中心(dispatcher方法)
不同的事件处理(accept 和 read write 拆分)
已经基本上实现了 Reactor 的单线程模式,我们把示例代码再做一些改造:
我们实现了最基本的单Reactor的单线程模型,程序启动后 selector 负责获取、分离可用的 socket 交给dispatcher处理,dispatcher 交给不同的 handler 处理。其中 Acceptor 只负责 socket 链接,IO 的处理交给 ProcessHandler。
我把网上流传的Reactor的图,按自己的理解重新画了一份

多线程Reactor
上面的示例代码中,从 socket 建立到 IO 完成,只有一个线程在处理。NIO 单线程示例中我们尝试加入线程池来加速 IO 任务的处理,reactor 模式中该如何实现呢?
简单理解,参考 NIO 多线程加入线程池处理所有的processHandler ,可以利用 CPU 多核心加快业务处理,代码不再赘述。

多Reactor模式
参考ReactorDemo ,我们的 acceptor 处理 socket 链接时和 handler 处理 IO 都是用的同一个 selector 。如果我们在多线程基础上有两个 selector ,一个只负责处理 socket 链接一个处理网路 IO 各司其职将会更高大的提升系统吞吐量,该怎么实现呢?
示例中创建了 selector 和 ioSelector ,其中 selector 只处理 socket 的建立,在 Acceptor.process 方法中把 socket 注册给 ioSelector。在 ProcessHander.process 方法中 ioSelector 只负责处理 IO 事件。这样,我们把 selector 进行了拆分。参考多线程实现,同理我们可以创建 N 个线程,处理 ioSelector 对应的 IO 事件。

总结
至此,我们了解了 Reactor 的三种模型结果,分别是单 Reactor 单线程、单 Reactor 多线程、多 Reactor 多线程。所有代码不够严谨,只为了表示可以使用多个线程或者多个 selector 之间的关系。总结重点:
reactor 是一种设计模式
基于事件驱动来处理
利用多路分发的策略,让不同业务处理各司其职
有单线程,单Reactor 多线程 和 多 Reactor 多线程,三种实现方式
参考:
http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
系列
关注我
如果您在微信阅读,请您点击链接 关注我 ,如果您在 PC 上阅读请扫码关注我,欢迎与我交流随时指出错误

版权声明: 本文为 InfoQ 作者【小眼睛聊技术】的原创文章。
原文链接:【http://xie.infoq.cn/article/b9baa25c9d506e4a1cb459fe0】。文章转载请联系作者。
评论 (7 条评论)