案例 | 跨越语言边界：20+ 种语言的 AI 图像生成挑战

2025-02-12
上海
本文字数：997 字
阅读完需：约 3 分钟

在这个日新月异的时代，能够熟练运用各种 AI 软件已经成为“打工人”的必备技能。一家领先的平面设计软件公司创建了一个多模态 AI 模型，可以从文本提示中生成原创图像。他们与澳鹏 Appen 合作，评估这些 AI 生成的图像是否能够成功满足用户期望。

本期案例故事，澳鹏 Appen 帮助该公司扩展其模型功能至 20 多种语言，确保模型能够在不同文化背景下生成高质量的 AI 图像。

目标

OBJECTIVE

从 20 多种语言的文本提示中创建具有足够文化相关性的高质量图像，项目的主要目标是全面改进 LLM 图像生成模型的能力。不仅仅是本地化能力，模型各方面的细节完善至关重要，以确保每个设计符合用户期望，在各种文化背景下能够为用户提供高质量、有共鸣的模型结果。

挑战

CHALLENGE

跨 20 多种语言评估 AI 生成的设计图像，本身就面临文化方面的挑战。每种语言的背后，都具备其独特、微妙的文化元素，这需要对各个地区文化的细微差别有深入的了解。与此同时，还需要具备对于视觉和平面设计原则的全面理解，才能够有效评估模型输出。

此外，在 20 多种不同文化视角下，对提示进行准确的评估和评分，其中的复杂性进一步加剧了模型输出一致性的需求。

解决

SOLUTION

该公司与澳鹏 Appen 合作，通过两个阶段的方法来应对 LLM 图像生成模型当前所面临的挑战：

文本提示本地化：澳鹏 Appen 的母语翻译人员将英文提示本地化成 24 种语言，并运用文化专业知识确保其准确合理。除了直接翻译外，该阶段还需要在某些情况下进行再创作，以更好地与当地用户产生共鸣。在这个阶段，捕捉特定文化庆典、符号和习惯至关重要，以确保提示能够准确反映出每种目标语言的独特特征。

设计评估：在第二阶段，澳鹏 Appen 的专家审核员根据详细的标准，评估每个 LLM 生成图像的质量，包括文化相关性、是否遵循提示说明、设计风格和图片格式等。每个提示的英文版本也经过评估，作为基准，以确保在 20 多种语言中保持一致性。通过对每个图像提供清晰一致的反馈，澳鹏 Appen 帮助客户完善其图像生成模型，全面提升 AI 生成图像的质量。