写点什么

中国联通、欧莱雅和钉钉都在争相打造的秘密武器?虚拟 IP 未来还有怎样的可能

作者:行者AI
  • 2021 年 12 月 29 日
  • 本文字数:2100 字

    阅读完需:约 7 分钟

中国联通、欧莱雅和钉钉都在争相打造的秘密武器?虚拟IP未来还有怎样的可能

1. 引言

虚拟偶像是通过绘画、动画、CG 等形式制作,在因特网等虚拟场景或现实场景进行如歌手活动,以商业、文化等具体需求制作培养,但本身并不以实体形式存在的人物形象。

伴随着虚拟世界的到来,越来越多的虚拟产品也随之出现。比如常见的 AR、VR 产品、二次元虚拟产品等等。在这其中最受欢迎、关注度也极高的还是虚拟偶像。顾名思义,“虚拟偶像”身份是虚构的,在现实生活中并不存在,但它却具备人类的外观和行为意识,万物皆可虚拟化,赋予人的动作行为。

说起虚拟偶像,最先出圈的是初音未来,她以 CG 的形象连开了 9 场巡演,是以虚拟偶像的形象成功进行商业变现的首例。从各大公司相继推出小冰、小爱,到中国首个虚拟学生华智冰,还有抖音上火爆全网的虚拟偶像柳夜熙。可以看出这个行业的蓬勃发展。

虚拟偶像的本质是由算法和 AI 程序组成的,在功能的实现上基本脱离了人类,具有独立于人类思想之外的行为能力。我们知道,从图灵机开始,创造一个真实拟人的人工智能就一直是计算机的终极浪漫。这是一个比较复杂的工程,虚拟 IP 之所有如今的发展,得益于在 AI 领域中各个技术之间的突破,如数字人多模态建模,NLU,NLG,语音合成,技术等。

2. 数字人多模态建模

数字人多模态建模技术是数字人从声音、表情、动作的多模态角度,用对话和与语境相关的动作完成交互的技术。再通过“语义+语音+视觉”,构建支持多种场景的数字虚拟形象:在线直播,新闻主播,企业客服,企业代言,AI 导游,AI 助手,AI 在线教育。

在数字人的制作方面与与建模方面,主要是靠外观捕捉设备与视觉算法。随着近年来外观捕捉设备与视觉算法和相关制作工具等的发展,数字人的制作周期与难度已经下降了非常多。今年 2 月虚幻引擎公布了 MetaHuman Creator 实时 3D 创作工具,使用该工具创作数字人时间从原本的数周乃至数月缩短至一小时以内,同时该工具能保证如照片般逼真的制作效果。

图 1.MetaHuman Creator

3.自然语言技术

这里的自然语言技术是指 NLU(自然语言理解),NLG(自然语言生成)。NLU 让虚拟 IP 能够理解人类的语言,NLG 则让虚拟 IP 能够思考、输出并与人类交互。自然语言技术代表着虚拟 IP 的核心,也就是智能。设想一下,如果虚拟 IP 没有自己的思想,不能与人类进行语言交互,虚拟 IP 表达出的东西还需要虚拟 IP 背后的人类进行指定,那么这样的虚拟 IP 不能被称为真正的虚拟 IP 产品。

为了解决这样的问题,近年来,大规模的自然语言相关预训练模型层出不穷,例如浪潮人工智能研究院发布的全球最大中文预训练语言模型“源 1.0”,参数量已达 2457 亿。这样的大规模预训练模型在某些特定领域能够接近甚至达到人类水平。


图 2.源 1.0

4.语音合成技术

为了让虚拟 IP 看起来更真实,使用起来体验更好,语音合成技术是必不可少的技术。虚拟形象不仅要看的见,其高辨识度的「嗓音」更是重要的声音名片。也就是说不同的虚拟 IP 需要不同的音色,甚至一些特殊的虚拟 IP 需要根据虚拟 IP 的形象性格与人设属性「凭空创造」适合该 IP 的音色。同时需要注意的是,虚拟 IP 发声的时候,虚拟 IP 的表情,动作以及对应的嘴形都要与发出的文字对应。这样的语音合成技术应该算是多模态的语音合成技术。如下图所示,是一种支持同时输出合成语音与虚拟 IP 面部信息的解决方案。该方案可以确保输出的语音与面部信息是完全对应的。


图 3.DurIAN 模型

随着虚拟 IP 的发展,人们对于虚拟 IP 用到的语音合成技术的需求也在提高,比如虚拟 IP 是否能用相同的音色进行普通的发声的同时,也能用该音色进行歌声的合成?现有的虚拟 IP 产品,很大一部分是依靠真实人类扮演虚拟 IP,给虚拟角色配音,这样如果虚拟 IP 对应的演员声音有变动的话,就会导致该虚拟 IP 产品力的下降。所以研发既能够支持语音合成又能够支持歌唱合成的语音合成技术是非常必要的。

5.One more thing。。。

现有的虚拟 IP 技术可以让虚拟形象比较接近人类,但是在真实性,智能性与专业性等方面,虚拟 IP 与真实的人类还是有所差距。所以虚拟 IP 还能做到什么呢?还有什么样的技术能够被应用到虚拟 IP 当中呢? 现有的虚拟 IP 在内容创作方面相对来说比较薄弱。虚拟 IP 产生的内容大部分是作者预先设定好的。所以虚拟 IP 技术可以在内容创作方面发展相关技术,让虚拟 IP 能够进行符合其形象的故事,音乐,诗词等内容的生产,让每一个虚拟 IP 的特点都不那么类似。


行者 AI(成都潜在人工智能科技有限公司,xingzhe.ai)致力于使用人工智能和机器学习技术提高游戏和文娱行业的生产力,并持续改善行业的用户体验。我们有内容安全团队、游戏机器人团队、数据平台团队、智能音乐团队和自动化测试团队。 

如果您对世界拥有强烈的好奇心,不畏惧挑战性问题;能够容忍摸索过程中的各种不确定性、并且坚持下去;能够寻找创新的方式来应对挑战,并同时拥有事无巨细的责任心以确保解决方案的有效执行。那么请将您的个人简历、相关的工作成果及您具体感兴趣的职位提交给我们。我们欢迎拥抱挑战、并具有创新思维的人才加入我们的团队。请联系:hr@xingzhe.ai

如果您有任何关于内容安全、游戏机器人、数据平台、智能音乐和自动化测试方面的需求,我们也非常荣幸能为您服务。可以联系:contact@xingzhe.ai


我们是行者 AI,我们在“AI+游戏”中不断前行。

快来【公众号 | xingzhe_ai】,和我们讨论更多技术问题吧!

发布于: 刚刚
用户头像

行者AI

关注

行者AI,为游戏插上人工智能的翅膀。 2020.12.18 加入

行者AI(成都潜在人工智能科技有限公司)专注于人工智能在游戏领域的研究和应用,凭借自研算法,推出游戏AI、智能内容审核、数据平台等产品服务。

评论

发布
暂无评论
中国联通、欧莱雅和钉钉都在争相打造的秘密武器?虚拟IP未来还有怎样的可能