「深度」国产 GPU 的“成色”与“现实”
最近几年大芯片投资赛道,数 GPU 热得发烫。一众初创公司涌现,大厂精英抱团创业,巨额融资不断刷新行业纪录。一些成立较早的企业,已经进入研发落地阶段,刚成立不久的厂商,也旋风般推出相关产品。
与 GPU 创业高热相伴的,是从未间断的质疑声:估值虚高,PPT 发布,套壳马甲……一些国内 GPU 创企推出的产品,被认为已经背离了芯片研发规律,成为融资的工具跳板,后生们不讲武德,坏了规矩。
国产 GPU 创业领域目前存在哪些问题?应该以什么样的态度发展国产 GPU?与海外巨头相比,有何差距与挑战?追赶的机会在哪?集微网同产业人士进行交流,探寻国产 GPU 创业浪潮风起云涌的背后。仔细丈量国产 GPU 的“成色”,或许有助于更加清醒地正视现实。
一、乱象丛生 泥沙俱下
近两年,受市场需求以及政策、资本的推动,GPU 在国内受到疯狂追捧。地缘政治、大国博弈背景下,相较于已有一定积累的国产 CPU,国产 GPU 的破局更具紧迫性和必要性。人才储备程度,科创板提供的退出机制,也为国产 GPU 的发展创造了良好契机。
于是,GPU 成为继 AI 之后,最为性感的芯片投资赛道。资本的蜂拥而至吸引了来自英伟达、AMD、海思、高通等一众大厂精英创业。据不完全统计,目前该领域的初创企业已近 20 家,所有一线投资机构均参与其中。
谈及目前国内 GPU 创业领域的现状,行业人士李明(化名)认为赛道过热且拥挤,市场鱼目混珠、泥沙俱下。
李明并不否认看到一些企业推出的产品,不管是在跑分还是在标准测试和应用方面都取得了进步,但也有不少产品和演示目前还处于“PPT”状态。对于那些成立一年左右就推出多款产品的公司,在行业摸爬滚打了 20 多年的李明称“颠覆了自己的行业认知”。
“一块 GPU 芯片的研发周期从立项到上市至少要 3~5 年,好的芯片要经过架构和应用打磨,这个过程也不可能低于两年。有的产品宣称是自主设计,但明显违反整个芯片的设计规律。GPU 不可能一年半载就设计出来并跑通应用,有可能设计全是外包,或是将已流片的设计的 Spec 配置稍作修改。”李明分析称。
另一位 GPU 企业高管王强(化名)认为,一些 GPU 新势力尚没有明确自己的细分市场,也没有想清楚未来长远的发展方向,只会用 PPT 吹牛,发布产品参数和性能对比时混淆视听,实际并不能够正常量产或进行流畅演示,真实性和可靠性大打问号。
“有的芯片参数比较奇怪,宣称算力是 6T Flops/s,存储能力是 50GB/s,两者的比例达到 120:1,但实际上 GPU 最理想的比例应该是 25:1,这在应用层面非常尴尬,不知所用何处。此外,有的芯片带宽非常低,无论是用于 AI 计算还是图形,基本上都发挥不出功能。”谈及诸多费解之处,王强直摇头。
行业看来,这样导致的结果是搅乱了市场,浮躁了人心,在 GPU 这样一个高门槛且重积累的领域,不讲诚信,违背市场、技术规律,待潮水退去后,只能是一地鸡毛。
二、资本裹挟蒙眼狂奔
GPU 创企在产品上的乱象丛生,在行业投资人士张帅(化名)看来,有些是迫不得已。
“海思做 GPU,前后花了 4 年半,在华为强大流程体系支持下尚且如此,初创企业难度更大。如果也做这么长时间才出产品,投资人不会答应。”张帅说。
据张帅透露,有的 GPU 初创公司与投资方签下对赌协议,在某个时间点推出芯片产品,是决定其拿到下一轮融资的入场券。
资本裹挟之下,一些配置错误、不合逻辑、完全不像正常产品的 GPU 芯片横空出世,冠以自研、国产、打破垄断之名。吃瓜群众亢奋,行业人士错愕。
“很多国内 GPU 的研发,其实已经脱离了芯片开发的初衷,所有的成果展示和发布,其实是以融资为目的。”创道投资咨询合伙人步日欣直言。
赛道的火热以及大规模的融资助推 GPU 初创企业估值一路走高。一些成立一两年的热门企业,估值已经达到两三百亿元,GPU 成为高估值代名词。
不少业内人士呼吁,对于那些通过“放卫星”博眼球的方式来吸引关注的可疑产品公司,需要投资人和相关的市场机构进行甄别以及理性对待和评估。
北科建集团产业运营负责人李锴表示,国内 GPU 从整体而言,受到了政策推动的影响,有了积极进展,尤其包括“东数西算”政策、算力芯片和智慧化应用的市场打开。但目前阶段的投融资热度,还是一种行业聚焦惯性投资,依靠当前的政策性红利,大部分投资标的还属于高风险投资项目。
“真正投进去,一是要考虑估值是不是虚高的问题,二是需要专业性的知识背景和能力,考验投资机构慧眼识珠的本领。”李锴说。
但独具慧眼似乎是少数,GPU 赛道的玩家更多处于“蒙眼狂奔”中,几年过去,投资热度仍未消减。
张帅不否认 GPU 赛道过热,但他并不认为 GPU 创企估值过高,因为在他看来 GPU 的价值摆在那。
“如果真的中美脱钩,高性能 GPU 被卡脖子,中国一定要想办法替代。一个 GPU 工程师年薪 50 万,2000 人的企业,人力一年就要 10 亿,每年二三十亿的整体开支跑不掉。投资方愿意投钱给不同的创业团队也有道理,谁都想赌一把中国的 AMD 和英伟达。”张帅说。
三、图形/计算 花开两朵
GPGPU、通用 GPU、全功能 GPU、图形 GPU、渲染 GPU、GPU+……在国内,GPU 命名上的文字游戏已被厂商们玩坏,也让外界对这些产品一时云里雾里。
按功能划分,GPU 主要分为侧重图形图像的渲染 GPU 和侧重通用计算的 GPGPU。
目前国内初创 GPU 公司,结合自己的优势和阶段性定位,分别采取了不同的切入路线。其中 GPGPU 公司包括壁仞、沐曦、登临、天数智芯、红山微电子、珠海芯动力等,渲染 GPU 企业包括摩尔线程、励算、深流微、瀚博、芯瞳、格兰菲等。
沐曦 CTO 杨建博士指出,GPGPU 相当于大算力芯片,是传统计算的回归,GPGPU 的创新等同于将一些专用加速功能变成 GPU 的一组指令集,芯片面积只有原来的 1%-10%,却相当于实现了一个全新专有芯片的加持,同时具备通用计算的性能,这使得边际成本更低,更具价值。
而渲染 GPU 约 80%仍是 GPGPU 部分,20%则是固定渲染流水线(fixed function),例如 geometry pipeline、rasterization pipeline 等。固定渲染流水线涉及较多的数学公式,因此比较依靠编译器和驱动等软件能力,而 GPGPU 在硬件和应用层面较为复杂。
“从软硬件复杂度看,渲染 GPU 复杂度更高。从开发人员团队数量来看,GPGPU 如需要 200 人的硬件团队,渲染 GPU 可能要再增加 50 人,但软件开发人员相比 GPGPU 或需增加三倍,需要更多的人员开发驱动和编译器等。”杨建说。
芯动科技首席 SoC 架构师何颖认为,图形渲染 GPU 因为经过了十几年的演化进程,流水线长,实现起来复杂,设计上的挑战更大,同时存在很多专利陷阱。
“芯动科技目前聚焦于渲染 GPU 领域,但 GPGPU 也在规划之中,芯动科技选择的是一个起步很难但可以走得很远的赛道。虽然 GPGPU 的价值很高,增长也不错,但图形渲染 GPU 在细分市场总的体量更大。”何颖告诉集微网。
但杨建认为,对于一家初创公司的首颗 GPU 产品来说,如果要同时自研渲染 GPU 的固定渲染流水线 IP、统一着色器(shader)IP,需要的时间和人力成本将非初始的几百人团队可以承受。因此,沐曦采取先做 GPGPU,再发展图形渲染 GPU 的模式。在自研 GPGPU 中,只有统一着色器 IP,不需要固定渲染流水线,这样可以在自研 GPU 的道路上一步一个脚印稳健前行。
四、核心 IP 十年差距
任何一款高端芯片的打造,都离不开基石——IP 的“成全”,IP 的质量很大程度上决定了国产 GPU 性能的底色。
在步日欣看来,GPU 作为高性能的大芯片,想在短期内出成果,必然需要依赖外部 IP。国产 GPU 厂商能够快速推出相关产品,很大程度上依靠外购 IP。
但打着自主研发之名,行外购之实,推出“马甲”产品就难免有忽悠之嫌,这样的案例在芯片领域本就不在少数。
自研 IP 越多,芯片设计上越有把握,产品的差异化更明显。但相对而言,资金、人员、时间上的成本投入也更高。王强告诉记者,GPU IP 自研需要 36-48 个月以及 200 个工程师,而采用外购 IP 的方式,可以减少 12-18 个月开发周期。
李明则表示,考虑到 GPU 的研发非常考验项目的目标管理能力,对于团队能力和组织工程能力要求很高,初创企业由于能力有限,短期内如果自研路线不顺利,会选择大量外购 IP 或“马甲”路线。但从长远看,公司团队的成长、市场定位以及盈亏平衡不能得到保证,而且会逐渐拉开跟行业领先公司的差距。
据集微网了解,GPU 的 IP 主要涉及三大类,一是模拟 IP,包括 PCIe、Displayport 和 HDMI 等等,这方面国内厂商占有率较低;二是 Memory;三是数字 IP,包括基于 Arm 或 RISC-V 的微控制器 IP、编解码芯片 IP 以及最核心的 GPU IP 等。核心 IP 国内有 Imagination、芯原、格兰菲等厂商,相对而言,Imagination 认可度较高,芯原是后起之秀,而格兰菲主要面向特定领域用户。
在李明看来,国内核心 IP 能力至少比英伟达、AMD 等落后十年左右。而整体而言,GPGPU 企业与国际大厂技术差距约 3 年,渲染 GPU 与国际大厂差距约 10 年左右。
李锴认为,国内 GPU 底层技术空白点较多,IP 大多受制于国外厂商,产品前端稳定性不理想,目前又很难在主线中高端电子产品上得到普及化应用,需多年沉淀形成自主 IP 积累才能具有一定替代性。
需要指出的是,外购 IP 并不意味着无法自主可控,但对 GPU 企业的能力要求很高。
据何颖介绍,芯动科技与 Imagination 的合作是与苹果一样的架构授权,基于该初始架构芯动科技探索了很多自己的方案,包括自研的 Cache 一致性 Innolink Chiplet 技术,内置国产物理不可克隆 iUnique Security PUF 信息安全加密技术等。
“芯动科技去年推出的渲染 GPU‘风华 1 号’80%以上的 IP 都属于自主研发。既然已经获得了架构授权,芯动科技就可以不受限制地自行改进,能够做到自主可控。”何颖说。
五、生态之路 道阻且长
除了硬件性能上的比拼,高性能芯片的生态搭建也是绕不过去的一道坎儿。某种程度上,生态比硬件更重要。
步日欣表示,在最终量产和商业化产品出来之前,国产 GPU 还没到谈论生态和应用层面的地步,而杨建认为,GPU 生态是除产品外初创企业能否活下来的重要因素,是一开始就要考虑的问题。
对于渲染 GPU 和 GPGPU 而言,构建生态的难度截然不同。
渲染 GPU 在技术层面来相对复杂,但是好处在于有很多业界成熟的标准的 API,如 OpenGL、OpenGL ES、DirectX、Vulkan 等。只要打通了整个驱动程序层和编译器生态,就基本完成 90%。
而在 GPGPU 领域,几乎是被英伟达一手打造的 CUDA 生态所垄断。
“GPGPU 的生态非常复杂,要求一路打通到应用层,提供面向所有应用的全面支持,甚至要自主开发以支持一个新的应用领域。”杨建指出。
虽然不少 GPU 初创公司推出的产品都号称兼容 CUDA 生态,但李明认为存在兼容多少的问题,水分较大,比较重要的特性中可能 60%-70%都无法支持。
而据集微网了解,兼容 CUDA 并非易事,需要投入工程师的数量巨大。涉及 50 个驱动、50 个编译器、50 个数学库、300 个应用层工程师,3-5 年的时间。功能的验证,用户的培养需要额外 3-5 年,每年还要至少开支 1000 万-3000 万元资助外部开发者。
“使用的人越多,生态越占统治地位,看看国内的初创 GPU 企业,哪些是已经开始编写教材、在高校开课和开展合作项目、组织比赛等做这些人才培养方面的工作,就知道谁真正在沉下心来做生态了。”李明说。
何颖指出,国产 GPU 业应采取开放合作的心态,学会站在巨人的肩膀上,善于利用现有架构和生态,设计契合市场需求的优秀产品,打造全球化设计水平的开发团队。国产 GPU 在起步阶段兼容现有生态更容易发展,先求生存;长期还是要摆脱兼容思路,站稳脚跟后再求发展自有的核心技术。
在 GPU 生态中,软件的权重已越来越高。Imagination 中国区战略市场与生态副总裁时昕博士提及,GPU 软件极为复杂,包括各种图形 API 和计算接口、基础库、与上层应用对接适配等等,开发工作量巨大。
从应用角度来看,国内 GPU 生态的发展更需要“众人拾柴”。时昕认为,要加快打造国产 GPU 产业链,下游的整机厂商需要对国产 GPU 给予更多包容。
“国产 GPU 可能 99%已达标了,如果能帮助国产 GPU 厂商一起将这百分之一影响体验的最后一步补齐,做到更完善,这对其发展是非常重要的。”时昕强调。
六、掘金市场 盈利维艰
对于 GPU 创企而言,巨大的研发费用和资本开支是必需,但长期、持续的利润支撑才是 GPU 跨代发展的强劲驱动力。也就是说,GPU 的成功和成熟需要大量的验证和出货,这就需要国产 GPU 厂商瞄准目标应用市场发力。
步日欣认为,对于初创企业而言,渲染 GPU 涉及到生态建设的完善度,所以从信创、军工、工业等领域切入较为稳妥。而 GPGPU 市场从人工智能、服务器、高性能计算等领域切入是最优选择。
但初创 GPU 企业掘金市场的现实却相对骨感。
比如,在渲染 GPU 的传统应用如视频、游戏等领域,英伟达和 AMD 构建的护城河可谓固若金汤,国内企业与之差距较大,而且这一市场全球容纳三四家都比较困难。
短期看,虽然国内信创市场提供了一定空间,但总量不大,且偏向于中低端。因此,如何分食这一“蛋糕”之下还能实现正循环,是国内渲染 GPU 厂商面临的问题。从中长期看,虽然云端渲染成为新的增长点,但元宇宙、云游戏、云手机等市场普遍认为将在 2024 年前后起势,因此当下如何获得盈利求生存也是艰难挑战。
而在 GPGPU 方面,比如在 AI 计算领域,则面临场景应用复杂且碎片化,以及国内众多竞争对手混战的局面。
何颖认为,游戏、3A 大作对 GPU 的图形和计算相对要求比较全面,国内企业在 Windows 领域追赶难度较大,但在安卓手游、信创桌面和某些定制的服务器领域,以及自动驾驶领域,国内厂商有机会实现切入。目前,芯动科技的风华系列 GPU 瞄准国产信创桌面和服务器这两大细分领域。相较于信创市场,服务器显卡单价更高,实现盈利较有希望。
而杨建则指出,除生态之外,当下对于初创 GPGPU 企业生存而言,最大挑战是产能。
“目前和 AI 相关的大芯片,因为需要 Cowos 等先进封装,所涉及的中介层原材料非常紧缺,在目前产能吃紧的情况下,对于已经推出一些产品的初创 GPU 企业,会面临短期盈利的问题。”杨建说。
七、弯道超车 路在何方
我国在高端 GPU 领域缺席多年,面对海外巨头固若金汤的专利、生态等壁垒,GPU 业从战略布局成长为核心支柱,显然还有漫长征途。
行业人士看来,国内 GPU 企业发展破局的关键在于找准定位,贴近市场。
何颖特别强调,国内的渲染 GPU 厂商应该着重于贴近市场的定位和创新,使得设计和能效能够贴近应用,力争在专有应用领域或局部领域实现突破,然后再进一步拓展和打磨经验和能力,使得最终在生态和应用上能跟技术创新良好结合,形成正向循环。
“跟国外巨头相比,国产 GPU 在一些专用领域优化方面,并不是完全亦步亦趋。通过在这些领域发力,能够在计算密度或在工艺、节奏、带宽密度等面体现出差异化,可以使产品在性价比,在某些特种应用方面能够达到国外 GPU 的能效,甚至做得更好。”何颖说。
杨建则表示,在 GPGPU 方面,英伟达没有百分百的优势,国内 GPGPU 在某些方面可以说是超越的。国内厂商在 HPC 和服务器、通用计算等领域可以依托 Linux 的开放性和可控性强的优势,实现有效突破。
在杨建看来,国内 GPU 厂商的最大优势在于本土支持。
“如果整个市场是一个地图,国内 GPU 厂商可先撒点,针对一些特定市场循序渐进抢占生态,加强与国内厂商的紧密合作,积累一定的优势和声誉后,再由点及面布局寻求突破。”杨建建议。
多位受访者提及,高端芯片研发周期长、投入大,没有足量资金支持无法取得成功,但过度的投资热潮容易滋生投机现象,互联网投资的模式并不适用于芯片领域,国产 GPU 要谨防重蹈 AI 芯片的覆辙,需要正视差距,脚踏实地前行。
“烧钱的模式是难以为继的,只有踏踏实实服务客户,服务市场,并且能够不断的回收研发成本,进一步实现创新,才是国产 GPU 的成功之路。急功近利,疯狂招人,疯狂烧钱的模式,实际上不可能快速弥补国产 GPU 跟国外 GPU 之间的差距,因为国外的 GPU 是一个个应用打磨出来的,国产 GPU 一定要有耐心,才能够在这个领域实现创新和弯道超车。”何颖说。
步日欣指出,国内 GPU 距离国际大厂还有很长的距离,特别是目前的竞争格局下,国内 GPU 还处于野蛮生长阶段,虽然资本市场较为关注,但同质化竞争和创业造成了很大的人才和资金的浪费,一定程度上制约了国产 GPU 的发展进程。
“下一步这几十家 GPU 企业,肯定要面临一定程度洗牌,那个时候才是真正的国产替代、缩小差距的开始。”步日欣说。
评论