大模型时代的基础架构,大模型算力中心建设指南重磅来袭!
在被大模型围绕的今天,大模型可以为个人赋能,让每个人有成为 AI 超级个体的机会,大模型的基础架构也在为企业核心竞争力赋能,成为大中型企业云计算基础设施的关键组成部分!
目前,大中型企业正处于在其数据中心内建设大模型基础设施的关键阶段。
但是,对于企业来说,与以计算、存储、网络、数据库等中间件为代表的传统云计算服务相比,该基础架构的落地和使用面临诸多挑战,比如:大模型和软硬件不好选择;在大模型的基础设施建设和维护方面,技术门槛高、人才储备不足;等等。
此外,算力中心作为大模型基础架构,在其搭建过程中,除了大模型本身性能是否优异的问题,如何对与之关联的硬件进行部署、对硬件计算能力进行优化和提升,已经是绕不过去的突出问题。
《大模型时代的基础架构:大模型算力中心建设指南》一书便为以上问题提供了指导!
然而,本书的呈现形式不是枯燥乏味的描述,而是能让读者在思考及会心一笑的状态下,了解大模型基础架构的整体形态和各子系统是如何运作的,以及是如何响应需求且充分利用平台资源的。
这一亮点,在理论书籍盛行的计算机专业领域无异于一道甘泉。
本书不但讲解了大模型相关的基础技术,比如 AI 基本概念、GPU 硬件、软件、虚拟化等,还讲解了大模型基础设施的核心内容,包括 GPU 集群存储、网络、I/O、算力调度、网络虚拟化、管理和运营等,并结合实际案例,讲解了如何进行机器学习应用开发与运行平台设计,在此过程中把本书中的重点内容“串联”起来进行了讲解,以期读者建立整体的认知。
如果你曾为如何构建高效、稳定的基础架构而烦恼?渴望深入了解从 GPU、网络、IaaS 到 PaaS 的全栈智算云平台构建?那么,这本由腾讯专有云首席架构师方天戟倾力打造的《大模型时代的基础架构:大模型算力中心建设指南》将是你的不二之选!
本书亮点
01. 硬件设计逆向剖析,揭秘顶级服务器设计
本书通过逆向剖析 Nvidia DGX 系列服务器,深度解读了从 GPU、网络到 IaaS 和 PaaS 设计的全栈智算云平台构建方法。不论你是计算机专业的学者,还是对高性能计算感兴趣的工程师,都能从中获得宝贵的启发和实践指导。
02. 软硬件融合思维,消解性能瓶颈
书中讲解了如何通过软硬件融合的思路来消除高性能并行计算系统的性能瓶颈,如 SR-IOV、DPDK、GPU 虚拟化等。
还融入了 TOGAF 方法论,让你在理解架构设计的同时,也能掌握实践中的最佳方案。
03. 全栈知识,融会贯通
从 GPU 到服务器设计,再到网络设计、IaaS 和 PaaS 设计,本书为你提供了一个全面的智算云平台构建视角。无论你关心的是哪一个层面,都能在这里找到你想要的答案。
04. 计算机系统设计哲学思考,引领未来
“提供机制而不提供策略”“对修改封闭,对扩展开放”以及“低耦合,高内聚”等架构设计原则,几乎每个计算机领域的工程师都有所耳闻。
本书不但自始至终在为大家强调这些理论的重要性,还为大家介绍了“解剖麻雀”“从量变到质变”和“识别主要矛盾”等哲学层面的方法论,读者深刻体会这些方法论后,就能够在计算机技术这条路走得更远。
05. TOGAF 方法论
本书在写作过程中贯穿了 TOGAF(TheOpen Group Architecture Framework)的架构设计方法论对架构设计感兴趣的读者可以从中理解从 TOGAF 理论到实践的过程。
06. 实践案例分析
本书基于实际商用的智算平台案例,为读者阐述了如何基于具体需求进行智算平台的硬件、laaS 和 PaaS 设计,并投入用户核心生产业务的使用。
阅读本书可以收获什么
如果你是一名程序员,具有分布式应用开发的基础,这本书能让你理解分布式应用,特别是大模型与 AI 训练程序运行与协同所依托的底层机制,让你进一步知其所以然。
如果你是一名运维工程师或云计算架构师,在企业基础架构领域有一定的实践经验,这本书能让你了解企业基础架构在大模型时代的技术发展趋势,进而在工作领域保持领先地位。
如果你是一名在读本科生或研究生,对分布式高性能计算机系统的工作原理感兴趣,期望未来投身这个领域,这本书能通过浅显易懂的语言,为你打开通往这个世界的大门。
虾米爱看书
↑限时五折优惠↑
限时五折优惠,快快抢购吧!
评论