写点什么

使用 DPO 在 SageMaker 中定制 Nova 模型

作者:qife
  • 2025-08-06
    福建
  • 本文字数:716 字

    阅读完需:约 2 分钟

解决方案概述

在 SageMaker 训练作业中使用 Nova 定制配方的工作流程包含以下关键步骤:


  1. 选择特定 Nova 定制配方,该配方提供完整的配置参数来控制训练过程

  2. 通过 API 向 SageMaker 控制平面提交配方配置

  3. SageMaker 使用训练作业启动脚本在托管计算集群上运行配方

  4. 训练完成后自动释放计算资源

业务用例实现

本案例重点优化 Nova Micro 模型在结构化函数调用方面的表现:


  • 使用 nvidia/When2Call 数据集进行 DPO 训练

  • 训练数据格式转换为 Nova 要求的聊天补全格式

  • 采用参数高效微调(PEFT)技术降低计算成本

数据集准备

from datasets import load_datasetdataset = load_dataset("nvidia/When2Call", "train_pref", split="train")
复制代码

DPO 训练配置

recipe_overrides = {    "training_config": {        "trainer": {"max_epochs": 1},        "model": {            "dpo_cfg": {"beta": 0.1},            "peft": {                "peft_scheme": "lora",                "lora_tuning": {                    "loraplus_lr_ratio": 16.0,                    "alpha": 128,                    "adapter_dropout": 0.01,                },            },        },    },}
复制代码

模型评估结果

模型部署

训练完成的模型可通过 CreateCustomModel API 部署到推理服务:


request_params = {    "modelName": "nova-micro-sagemaker-dpo-peft",    "modelSourceConfig": {"s3DataSource": {"s3Uri": model_path}},    "roleArn": role,}response = bedrock.create_custom_model(**request_params)
复制代码

资源清理

为避免产生额外费用,请确保删除以下资源:


  • SageMaker 训练作业

  • 模型部署实例

  • 临时存储数据更多精彩内容 请关注我的个人公众号 公众号(办公 AI 智能小助手)公众号二维码

  • 办公AI智能小助手
用户头像

qife

关注

还未添加个人签名 2021-05-19 加入

还未添加个人简介

评论

发布
暂无评论
使用DPO在SageMaker中定制Nova模型_人工智能_qife_InfoQ写作社区