0 人感兴趣 · 1 次引用
编者按: 当我们谈论训练万亿参数的大语言模型时,除了惊叹于其算力需求,是否曾深入思考过:如何让成千上万甚至数十万块 GPU 高效协同工作,像超级大脑般实时共享信息?
提供全面深入的云计算技术干货
InfoQ签约作者
还未添加个人签名