澳鹏 Appen 入选大模型产业链基础层图谱及案例研究
亿欧《2024 中国“百模大战”竞争格局分析报告》从“百模大战”的关键进程切入,分析大战爆发原因及核心竞争力,评估通用大模型厂商的综合竞争力,洞察垂类大模型的行业发展前景,最后围绕通用大模型市场竞争格局、垂类大模型市场竞争格局、开源闭源发展路径、AI Agent 和多模态生成等领域作出趋势判断。
自 ChatGPT-3.5 的发布引发了全球范围内对大模型的广泛关注以来,目前,国内公布的大模型数量已超过 300 个,行业呈现出“百模大战”的竞争格局。随着大模型技术的演进,其赋能千行百业的能力不断提升。
《2024 中国“百模大战”竞争格局分析报告》构建了大模型基础层图谱、通用大模型图谱和垂类大模型图谱,全方位呈现大模型产业现状。作为产业链上的重要一环,澳鹏 Appen 凭借高质量的大模型数据能力成功入选大模型基础层图谱。
*图片来源于亿欧报告
在技术平台方面:澳鹏智能大模型开发平台提供数据集管理、数据标注、计算资源调度、模型评估、模型微调等全栈产品,助力企业轻松拥抱大模型。
在数据集方面:针对大模型的基础模型训练、模型微调、以及应用落地需求,澳鹏提供超过 290 种语言和方言的相关文本、语音数据库,并创建了一系列大模型专用的数据集,如:百科类人工泛化文本问答数据集,知识类百科文本语料对数据库,58 亿图文对数据库,法律问答及医疗问答等。
澳鹏全栈式大模型智能开发平台
赋能 AGI 智能涌现
数据是人工智能发展的关键因素,高质量数据可有效地提高模型性能。《2024 中国“百模大战”竞争格局分析报告》以澳鹏 Appen 为大模型数据领域的代表案例,分析了澳鹏 Appen 如何成功助力全球 7,500+个 AI 项目的研发及商业化,赋能 AGI 智能涌现。
*图片来源于亿欧报告
澳鹏大模型智能开发平台为企业提供高质量训练数据解决方案,助力企业的数据采集、清洗、标注以及管理,快速地构建高质量数据集。澳鹏自研的算法模型和核心技术,如预标注大模型、交互式算法、文档智能产品等,在数据生产加工的过程中起到关键作用,极大地提升了项目交付的效率和质量。
▲平台三大核心技术:
自研预标注大模型
自研交互式算法
算法赋能文档智能
案例 | 澳鹏大模型数据解决方案
案例 1:大语言模型训练数据解决方案
依托澳鹏大模型开发平台的工具集套件,澳鹏为某通用大模型厂商提供预训练数据、模型微调和提示词工程等训练数据解决方案,完成了逻辑推理,学科数据,多轮对话,指令标注等多个模块的训练数据生产工作,累计处理数亿量级的大语言模型训练数据,数据准确率达到 96%以上。客户基于澳鹏所生产的数据优化模型训练,模型的性能指标达到行业顶尖水平。
案例 2:多模态大模型数据解决方案
基于澳鹏的大模型平台多模态数据处理能力,澳鹏为某 AI 科技厂商提供图像文本描述数据服务工作,提供高质量图文对超过 50 亿对,为客户的图文大模型提供了丰富的数据养料。澳鹏同时也在为数个多模态大模型项目提供高质量数据服务,数据类型跨文本、图像、视频、音频等多种不同模态。
案例 3:垂类大模型数据解决方案
澳鹏为某科技公司提供大规模代码类大模型训练数据解决方案,基于高度定制的澳鹏自定义模版引擎和多模态数据编辑器,汇聚了大量行业领域专家,包括覆盖各种不同开发语言的研发工程师,数据分析师和算法工程师,提供高质量的代码训练数据。从代码编写,逻辑解析,到代码调试和单元测试,涵盖代码垂类大模型所需数据的各个阶段,生产出高质量代码数据 50 万组以上。为代码大模型的落地应用提供了高质量的数据保障。
本次《2024 中国“百模大战”竞争格局分析报告》的最后还重磅引述了三位行业大咖的观点。其中,澳鹏 Appen 全球高级副总裁、大中华区及北亚区总经理田小鹏博士分享道:“随着“数据二十条”等一系列政策措施相继出台,数据要素市场的探索与发展已步入高速增长阶段。据亿欧预计,2025 年数据要素市场规模可达 1990 亿元,年复合增长率可达 25%。尤其是在人工智能快速迭代、大模型与数据相得益彰的发展态势中,数据要素的战略地位进一步凸显。数据是决定机器学习模型性能的三大要素之一。随着各类大模型的智能涌现,数据,尤其是高质量的行业数据,正在成为决定大模型高速发展的关键因素。澳鹏自研的算法模型和核心技术,通过 AI 赋能数据全生命周期,更快更多地给予 AI 应用数据养料,为大规模的大模型场景落地提供支持。”
*图片来源于亿欧报告
APPEN
澳鹏 Appen 是全球图像、文本、语音、音频、视频等 AI 训练数据服务提供商,拥有业内先进的人工智能辅助数据标注平台、自研的大模型开发平台及全球 100 多万名技能娴熟的众包资源,支持 235+种语言和方言。澳鹏 Appen 数据解决方案已助力全球 7,500+个 AI 项目的研发及商业化。
版权声明: 本文为 InfoQ 作者【澳鹏Appen】的原创文章。
原文链接:【http://xie.infoq.cn/article/16ebb6eadce92fadd7a8f2210】。文章转载请联系作者。
评论