案例 | 跨越语言边界:20+ 种语言的 AI 图像生成挑战

在这个日新月异的时代,能够熟练运用各种 AI 软件已经成为“打工人”的必备技能。一家领先的平面设计软件公司创建了一个多模态 AI 模型,可以从文本提示中生成原创图像。他们与澳鹏 Appen 合作,评估这些 AI 生成的图像是否能够成功满足用户期望。
本期案例故事,澳鹏 Appen 帮助该公司扩展其模型功能至 20 多种语言,确保模型能够在不同文化背景下生成高质量的 AI 图像。
目标
OBJECTIVE
从 20 多种语言的文本提示中创建具有足够文化相关性的高质量图像,项目的主要目标是全面改进 LLM 图像生成模型的能力。不仅仅是本地化能力,模型各方面的细节完善至关重要,以确保每个设计符合用户期望,在各种文化背景下能够为用户提供高质量、有共鸣的模型结果。

挑战
CHALLENGE
跨 20 多种语言评估 AI 生成的设计图像,本身就面临文化方面的挑战。每种语言的背后,都具备其独特、微妙的文化元素,这需要对各个地区文化的细微差别有深入的了解。与此同时,还需要具备对于视觉和平面设计原则的全面理解,才能够有效评估模型输出。
此外,在 20 多种不同文化视角下,对提示进行准确的评估和评分,其中的复杂性进一步加剧了模型输出一致性的需求。

解决
SOLUTION
该公司与澳鹏 Appen 合作,通过两个阶段的方法来应对 LLM 图像生成模型当前所面临的挑战:
文本提示本地化:澳鹏 Appen 的母语翻译人员将英文提示本地化成 24 种语言,并运用文化专业知识确保其准确合理。除了直接翻译外,该阶段还需要在某些情况下进行再创作,以更好地与当地用户产生共鸣。在这个阶段,捕捉特定文化庆典、符号和习惯至关重要,以确保提示能够准确反映出每种目标语言的独特特征。
设计评估:在第二阶段,澳鹏 Appen 的专家审核员根据详细的标准,评估每个 LLM 生成图像的质量,包括文化相关性、是否遵循提示说明、设计风格和图片格式等。每个提示的英文版本也经过评估,作为基准,以确保在 20 多种语言中保持一致性。通过对每个图像提供清晰一致的反馈,澳鹏 Appen 帮助客户完善其图像生成模型,全面提升 AI 生成图像的质量。

成果
RESULT
澳鹏 Appen 为各种场景提供了本地化的文本提示,并对每种语言进行了数百次评估。每个图像输出都根据特定的文化标准进行了审核,包括以原始英文提示作为比较基准,使客户能够清楚地分析模型在多语言框架下的表现。

通过这种详细、具有文化敏感性的评估方法,澳鹏 Appen 帮助客户实现了高质量、符合文化相关性的图像输出,确保该设计软件的用户体验得到改善,增强了多样化的国际受众对产品的满意度和参与度。

版权声明: 本文为 InfoQ 作者【澳鹏Appen】的原创文章。
原文链接:【http://xie.infoq.cn/article/48a7c7734906be7ef6b2717a5】。文章转载请联系作者。
评论