英特尔实现光学 I/O 芯粒的完全集成
英特尔的 OCI(光学计算互连)芯粒有望革新面向 AI 基础设施的高速数据处理。
英特尔在用于高速数据传输的硅光集成技术上取得了突破性进展。在 2024 年光纤通信大会(OFC)上,英特尔硅光集成解决方案(IPS)团队展示了业界领先的、完全集成的 OCI(光学计算互连)芯粒,该芯粒与英特尔 CPU 封装在一起,运行真实数据。面向数据中心和 HPC 应用,英特尔打造的 OCI 芯粒在新兴 AI 基础设施中实现了光学 I/O(输入/输出)共封装,从而推动了高带宽互连技术创新。
英特尔硅光集成解决方案团队产品管理与战略高级总监 Thomas Liljeberg 表示:“服务器之间的数据传输正在不断增加,当今的数据中心基础设施难堪重负。目前的解决方案正在迅速接近电气 I/O 性能的实际极限。然而,借助英特尔的这项突破性进展,客户能够将硅光共封互连方案无缝集成到下一代计算系统中。英特尔的 OCI 芯粒大大提高了带宽、降低了功耗并延长了传输距离,有助于加速机器学习工作负载,进而推动高性能 AI 基础设施创新。”
该 OCI 芯粒可在最长可达 100 米的光纤上,单向支持 64 个 32Gbps 通道,有望满足 AI 基础设施日益增长的对更高带宽、更低功耗和更长传输距离的需求。它将有助于实现可扩展的 CPU 和 GPU 集群连接,和包括一致性内存扩展及资源解聚的新型计算架构。
AI 应用正在全球范围内被越来越多地部署,近期大语言模型和生成式 AI 的发展正在加速这一趋势。对 AI 负载加速新需求而言,更大、更高效的机器学习模型将发挥关键作用。未来的计算平台需要面向 AI 实现扩展,因而需要指数级提升的 I/O 带宽和更长的传输距离,以支持更大规模的处理器(CPU、GPU 和 IPU)集群,和资源利用更高效的架构,如 xPU 解聚和内存池化(memory pooling)。
电气 I/O(即铜迹线连接)带宽密度高且功耗低,但传输距离短至不超一米。数据中心和早期 AI 集群中使用的可插拔光收发器模块可以延长传输距离,但就 AI 工作负载的扩展需求而言,其成本和功耗不可持续。xPU 光电共封 I/O 解决方案 可以在提高能效比、降低延迟和延长传输距离的同时,支持更高的带宽,从而满足 AI 和机器学习基础设施的扩展需求。
打个比方,在 CPU 和 GPU 中,用光学 I/O 取代电气 I/O 进行数据传输,就好比从使用马车(容量和距离有限)到使用小汽车和卡车来配送货物(数量更大、距离更远)。英特尔的 OCI 芯粒等光学 I/O 解决方案,在性能和能耗方面实现了这一水平的提升,从而有助于 AI 的扩展。
在完全集成的 OCI 芯粒中,英特尔利用了已实际验证的硅光子技术,集成了包含片上激光器的硅光子集成电路(PIC)、光放大器和电子集成电路。在 2024 年光纤通信大会上,英特尔展示了与自家 CPU 封装在一起的 OCI 芯粒,但它也能与下一代 CPU、GPU、IPU 等 SOC(系统级芯片)集成。
这一完全集成的 OCI 芯粒的双向数据传输速度达 4 Tbps,并兼容第五代 PCIe。在 2024 年光纤通信大会现场,实时光学链路演示展示了通过单模光纤(SMF)跳线(patch cord)在两个 CPU 平台之间实现的发射器(Tx)和接收器(Rx)互连。CPU 生成并测量了比特误码率(BER)。英特尔还展示了发射器的光谱(optical spectrum),包括单一光纤上 200GHz 间隔的八个波长,以及 32Gbps 发射器眼图(eye diagram),表明信号质量很强。
该芯粒目前单向支持 64 个 32Gbps 通道,传输距离达 100 米(由于传输延迟,实际应用中距离可能仅限几十米)。它采用 8 对光纤,每根 8 波长密集波分复用(DWDM)。这种共封装解决方案也非常节能,功耗仅为每比特 5 皮焦耳(pJ),而可插拔光收发器模块的功耗大约为每比特 15 皮焦耳。对数据中心和 HPC 环境而言,超高的能效十分重要,有助于解决 AI 应用的高能耗问题,提高可持续性。
英特尔研究院在硅光子领域已深耕超过 25 年,是硅光集成的开拓者和领导者。英特尔在业内率先开发并向大型云服务提供商批量交付硅光子连接器件,这些产品具有领先的可靠性。
英特尔的主要差异化优势在于其直接集成技术,结合晶圆上激光器混合集成技术,可提高良率并降低成本。这一独特的方法使英特尔能够在实现卓越性能的同时保持高能效比。依托强大的量产平台,英特尔已出货超过 800 万个硅光子集成电路,包含多达 3200 万个片上集成激光器,时基故障率(FIT)小于 0.1。时基故障率是一种广泛使用的测量可靠性的方法,体现了故障率和发生故障的次数。
这些硅光子集成电路被封装在可插拔收发器模块中,部署于超大规模云服务提供商的大型数据中心网络中,用于传输速率需求高达 100、200 和 400 Gbps 的应用。面向传输速率需求达 800 Gbps 和 1.6 Tbps 的新兴应用,速度达 200G/通道的硅光子集成电路正在开发中。
英特尔还正在探索新的硅光子制造工艺节点,该节点具有先进的器件性能、更高的密度、更好的耦合性,并能大幅提高经济性。英特尔将继续在片上激光器和性能、成本(芯片面积减少 40% 以上)和功耗(减少 15% 以上)等方面取得进步。
英特尔研发的 OCI 芯粒目前尚处于技术原型(prototype)阶段。英特尔正在与客户合作,开发共封 OCI 和客户 SoC,作为光学 I/O 的解决方案。
英特尔的 OCI 芯粒推动了高速数据传输技术的进步。随着 AI 基础设施的不断发展,英特尔将继续推动前沿技术创新,探索面向未来的连接技术。
评论