国内首个输出分步式讲解推理模型“子曰 -o1”正式发布，消费级显卡即可部署

2025-01-22
浙江
本文字数：1413 字
阅读完需：约 5 分钟

2025 开年,AI 行业掀起大模型“推理潮”,自 OpenAI 发布 o1 后,各式推理模型不断涌现,模型的高阶推理能力迎来爆发增强,其应用价值也愈发获得业界的广泛关注。

1 月 22 日,网易有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。作为 14B 轻量级单模型,子曰-o1 支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。据悉,子曰-o1 正式对外开源,将助力教育领域推理模型的广泛应用及创新。

着眼当前的“推理潮”,以更长的思维链路实现更强的逻辑及推理能力,成为推理模型的主要技术思路,在此引导下,特性不同的模型层出不穷。这其中,可供应用的开源模型却不多,且参数规模较大,无法在低显存的消费级显卡上运行,即使是采用了低比特量化技术,使其能够在单卡上部署,但相应也为长思维链的运行带来了不稳定性。

针对这一问题,子曰-o1 开源模型选择了较小参数规模的基础模型,能够进行单卡部署并具备更强的数学能力。在此基础上,子曰-o1 开源模型进一步实现了轻量化,能够在消费级显卡上运行,并且提供与云端部署质量相媲美的模型质量。

在规模“压缩”的同时,子曰-o1 采用思维链技术,打造了国内首个输出分步式讲题的思维链模型,以 14B 小参数规模可复现 OpenAI o1 的单模型推理能力。据悉,子曰-o1 在解题时会形成较长的思维链条,使其运行思路更接近于人类的思考方式,通过“自言自语”、自行纠错的方式,提供分步解题过程及最终结果。作为教育垂类模型,子曰-o1 的这一特性也与教育应用产品更为适配,通过清晰呈现有条理的解题过程,以启发式讲解引导学生实现自主思考能力提升。

不仅如此,面向教育领域应用,子曰-o1 在长思维链所实现的高准确度上,进一步从数据筛选、训练指令等方面优化。通过应用有道自研的自动化评估方式,子曰-o1 不仅对最终答案的正确性进行评估,同时还覆盖了整个讲解过程,确保学习数据的高质量。

在训练指令选择上,基于有道多年来在教育领域的数据资源积累,子曰-o1 使用了大量的教育领域学生试卷习题为训练样本,从而提升教育场景应用的准确性。

当前,子曰-o1 已在网易有道旗下的 AI 全科学习助手“有道小 P”中落地应用,支持其实现“先提供解析思路、再提供答案”的答疑过程,引导学生用户主动思考、调用知识储备自主解决问题,从而实现真正把知识学透。在轻量化、输出分步式讲解、中文逻辑推理等多元优势的加持下,子曰-o1 能够进一步赋能国内 AI 教育应用提质增效,以更低的落地门槛撬动更高的应用价值。

作为教育垂类的推理模型,子曰-o1 的推出也进一步夯实了网易有道在教育大模型领域内的先发地位。在 2023 年 7 月,网易有道推出国内首个教育大模型“子曰”,并在一年内推出了 10 余个应用,覆盖了翻译、作文批改、语法精讲、句子解析、体育教育、口语练习、家庭辅导等多个细分场景。2023 年 11 月,有道子曰教育大模型顺利通过双新评估,成为首批通过完整国家备案的教育大模型。 2024 年 7 月,有道子曰教育大模型成功通过中国信息通信研究院的教育大模型评估,荣获 4+级证书,成为国内首批通过该项评估,并获得当前最高评级的企业。

坚持“场景为先”,有道子曰教育大模型作为教育垂类大模型,已经拥有较通用大模型更为专业的预训练语料,可以依据用户在学习场景下的需求,帮助用户答疑解惑。伴随着推理模型的赛道持续扩大,网易有道在教育垂直领域内的深耕沉淀,也将赋能其在教育垂类模型的深入探索,以子曰-o1 为起点,持续释放推理模型在教育领域内的应用价值。

欢迎访问 Demo 地址体验:https://confucius-o1-demo.youdao.com/

发布于: 刚刚阅读数: 4