澳鹏大模型数据服务,赋能 AGI 智能涌现
作为大模型产业链的基础环节,澳鹏 Appen 支持全栈式大模型数据服务,包括数据集、模型评估、模型调优等;同时,澳鹏智能大模型开发平台与全套标注工具紧跟市场技术前沿,是快速部署大模型应用的利器。
多垂直领域的大模型部署
医疗:医学药学知识数据库,医学专业人员协同进行模型评估与调优支持。
金融:庞大的金融数据库支持,专业名词释义评估,以及金融趋势分析判断等。
教育:多学科公式及知识支持,含思维链标注,Prompt 撰写,以及评估打分等。
代码:专业技术团队,进行代码有效性评估、内容整理与判断。
法律:法律垂类数据库,专业团队进行思维链分析、答案判断及改写。
澳鹏大模型数据服务
通过人机协同的方式进行 LLM 微调,企业可以让模型更适应实际应用场景,在变幻莫测的市场上获得竞争优势。澳鹏 Appen 支持大模型定制开发的全流程需求,助力企业轻松拥抱大模型。
大模型数据集:提供多模态,多领域,多场景的数据集以供各类模型的各阶段训练。
模型评估服务:提供模型人工评估服务,可视化数据呈现模型效果,bad case 一览无余。
模型调优服务:提供通过 prompt 工程,模型精调,RAG 等方式实现的模型调优,提供更贴合使用场景的大模型。
训练平台部署:提供覆盖大模型训练全周期的训练平台部署。
标注工具部署:提供专业高效的大模型训练数据标注工具部署。
全面的工具支持
Response 的人工标注:对 response 人工改写,多维度评分,多类型错误标注,自定义属性标注。
多 Response 的排序 :支持对多个来源为各模型或人工的回答进行拖拽排序,评估最贴合偏好的回答。
构建多轮对话:支持人工/基于模型添加多轮对话。
大模型智能体标注能力:基于思维链,工具调用,知识库等,评估和完善大模型智能体内在的思维逻辑。
多模态数据标注能力:支持文本、图片、音频、视频等数据融合标注,支持 Markdown、LaTeX 等不同表现形式。
基于 LLM 的自动标注能力:嵌入 LLM 自动生成 Response,实时获取模型回答并提供反馈。
自定义模板引擎:除通用工具模版外,澳鹏也支持通过自定义组件拖拽配置的方式完成自定义标注工具的搭建,从而灵活适配项目的各类标注要求。
灵活的数据标注 Pipeline:支持多个人工和模型标注/质检节点的灵活配置。
数据是决定机器学习模型性能的三大要素之一。随着各类大模型的智能涌现,数据,尤其是高质量的行业数据,正在成为决定大模型高速发展的关键因素。澳鹏自研的算法模型和核心技术,通过 AI 赋能数据全生命周期,更快更多地给予 AI 应用数据养料,为大规模的大模型场景落地提供支持。
——田小鹏 博士
澳鹏 Appen 全球副总裁 大中华及北亚区总经理
版权声明: 本文为 InfoQ 作者【澳鹏Appen】的原创文章。
原文链接:【http://xie.infoq.cn/article/39789da2fa7dee2711cc000d7】。文章转载请联系作者。
评论