超写实“龚俊数字人”上线,百度智能云助力各行业打造定制数字人
日前,由百度打造的国内首个可交互超写实明星数字人——龚俊数字人,在百度 APP 正式上线。
他的神态表情栩栩如生,获得粉丝喜爱。发布当日,便在互联网上引起热议,微博话题 #AI 龚俊唱跳太好笑了 #收获了上千万阅读,网友热门评论说“比龚俊本人唱得好听”。
如果用户问“今天天气怎样”,他就会快速识别并用温暖嗓音播报第一条搜索结果。他还可以帮助用户轻松控制百度 APP 上的夜间模式、书架、游戏等功能,实现一语直达。
超写实明星数字人“龚俊数字人”由百度智能云数字人平台提供技术支持和服务。作为集数字人生成、内容生产为一体的平台级产品,百度智能云数字人平台为广电、互娱、金融、教育等客户提供一站式的虚拟主持人、虚拟偶像、品牌代言人、虚拟员工的创建与运营服务。
百度智能云数字人平台在“明星数字孪生”方面的核心优势不断显现:基于形象超写实、制作周期短的领先效果,实现了数字人的“能听、能说、能互动”。
以龚俊数字人为例,当前主流的数字人制作技术,如动作捕捉采集表情/动作数据、CG 技术合成等,不仅呈现效果不够精致,且流程环节多,常常反复迭代,消耗大量人力和时间成本。而在龚俊数字人制作过程中,百度 AI 技术深入赋能 CG 制作,通过 4D 扫描、智能绑定等 AI 技术,捕捉龚俊说话及日常表情面部细微变化、口型面部肌肉动作等,令龚俊数字人的表情神态更加逼真,做到对真人形象的超写实还原;同时,还通过引入 AI 降噪、AI 自动生成等技术,将原本 2-3 个月的制作周期大大压缩。
不仅如此,基于百度 AI 的全链路能力,龚俊数字人在“听、说、互动”上表现极佳:端内准确率高达 98%的语音识别技术(ASR),帮助数字人听懂用户的话,面对中英文混杂、生僻字、方言等各种语音都能轻松搞定;准确性达 98.5%的 AI 口型合成技术,则为数字人还原真人说话时的口型变化,张嘴说话自然生动;TTS 技术与自然语言处理(NLP)、知识图谱等技术,不仅让数字人在声音上无限接近于真人原声,并可与用户亲切交互,进行多轮对话。
据量子位发布的《虚拟数字人深度产业报告》预计,在 2030 年,我国虚拟数字人整体市场规模将达到 2700 亿。演艺型数字人受到业内人士看重。依托领先的 AI 技术优势,百度智能云数字人平台可提供数字主持人、虚拟主播、虚拟偶像、数字品牌代言人等四大解决方案,并打造出亮相全国两会报道、对话人大代表的央视网虚拟主持人小 C,即将在冬奥会期间服务听障朋友的央视新闻 AI 手语主播等惊艳案例。百度智能云未来将持续推动数字人技术降低门槛,帮助各行各业中高创作力的企业主体,获得快速、高效、低成本制作数字虚拟人的能力,打造属于自己的数字人,为业务经营与用户服务赋能。
版权声明: 本文为 InfoQ 作者【百度开发者中心】的原创文章。
原文链接:【http://xie.infoq.cn/article/2bf215a6f2f6a7e947055f5eb】。文章转载请联系作者。
评论