0 人感兴趣 · 1 次引用
2月25日,蚂蚁技术研究院正式开源强化学习框架 AReaL(Ant Reasoning RL)。AReaL 源自开源项目 ReaLHF,旨在训练每个人都可以复现和贡献的大型推理模型 (LRM)。AReaL 是蚂蚁技术研究院为开发一个完全开放和包容的 AGI 世界迈出的一步。
提供全面深入的云计算技术干货
InfoQ签约作者
还未添加个人签名