生成式 AI,引领 AI 从“换脸”到“造脸”



《中智观察》第 1531 篇推送
记者:木易
编辑:豆芽
头图来源:界面新闻

日前,Gartner 发布了 2022 年重要战略技术趋势。其中,生成式人工智能(Generative Artificial Intelligence)位列 12 项重要战略之首。
同时 Gartner 预计,到 2025 年,生成式人工智能将占所有生成数据的 10%,而目前这一比例还不到 1%。
也能看到,在 2020 年 Gartner 发布人工智能技术成熟度曲线报告 2020 时(Hype Cycle for Artificial Intelligence,2020),生成式人工智能便作为新增技术热点首次被提出。

今年的(Hype Cycle for Artificial Intelligence,2021)报告中,生成式人工智能同样位列其中。
以上种种迹象表明,Gartner 对生成式 AI 是多么看重。那么,生成式 AI 究竟是什么?生成式 AI 又能给智能时代带来什么?
训练后的再创造

先来看一张图。您觉得下图中这个金发碧眼、带着婴儿肥的小男孩是真实存在的吗?

AI 合成小男孩
ZHONGZHIGUANCHA
答案是 No。这是由人工智能合成的。
再看一张图。您觉得下图中这位女士像是人工智能合成的吗?

AI 合成的女士
ZHONGZHIGUANCHA
答案是 Yes。
上述这两张图均来自“ThisPersonDoesNotExist.com”网站。
也不止这两个,“ThisPersonDoesNotExist.com”网站中,每次刷新出来的人物,都是现实中根本不存在的。
如果不知道真相,是否你根本无法判断出真假?
这便是生成式 AI 的一种应用。
对于生成式 AI,Gartner 这样定义:通过各种机器学习(ML)方法从数据中学习工件的组件(要素),进而生成全新的、完全原创的、真实的工件(一个产品或物品或任务),这些工件与训练数据保持相似,而不是复制。
简单理解。生成式 AI 是利用现有文本、音频文件或图像创建新内容的技术。使用生成 AI,计算机检测与输入相关的基本模式并生成类似内容。
GANs,生成式 AI 的核心技术

在此必须看下生成式对抗网络(GANs, Generative Adversarial Networks ),这是生成式 AI 的关键技术。其本质是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。
2014 年,研究人员首次使用计算机,利用生成对抗网络 GANs,创造出了逼真的人脸。
在原理上,生成式对抗网络使用两个神经网络相互对立,一个生成器和一个判别器。生成器或生成网络是一个神经网络,负责生成类似于源数据的新数据或内容。判别器或判别网络是负责区分源数据和生成数据之间的神经网络。

这两个神经网络都经过交替周期训练,生成器不断学习生成更逼真的数据,判别器则更善于区分假数据和真实数据。
可以把 GANs 想象成一个造假者,一个在猫捉老鼠游戏中的警察,造假者正在学习传递假币,而警察正在学习检测假币。渐渐地,双方在对抗中都不断完善。
AI 生“万物”

当下,生成式 AI 已在研究和商业的多种场景得到应用,如创建软件代码、促进药物研发和有针对性的营销等。具体而言:
生成图形:AI 可以从艺术品中抽象视觉图案,然后将这些图案应用到具有该艺术品特征的虚拟图像再现中。这些算法还可以将任何粗糙的涂鸦转换为令人印象深刻的绘图,该图像似乎是由描绘真实世界的专业人类艺术家创作的。
生成式 AI 可以手绘人脸草图,并以算法将其转换为逼真图像,也可以指示计算机呈现任何图像,以便看起来好像是由特定的人类艺术家以特定的风格创作的。

生成照片:生成式 AI 可以通过生成并叠加到原始任何缺失、模糊或误导性的视觉元素上来自动更正照片,还可以将任何低分辨率原始图像转换为高分辨率版本,也可以通过混合现有的肖像或从任何特定的肖像中抽象特征来产生自然的外观,或者从语义标签中生成逼真的图像。


生成音频:生成式 AI 可以将任何计算机生成的声音渲染成一个真正听起来像是在人类声带中自然产生的声音,也可以将文本翻译成语音、可以组成音乐。
同样,生成式 AI 也可以生成视频、文本、字幕等。
生成材料:生成式 AI 甚至可以通过 3D 打印、CRISPR 和其他技术从零开始呈现假肢、有机分子和其他物品。
这也意味着,该技术也会被滥用于诈骗、欺诈、造谣、伪造身份等违法场景。
率先发力的迪斯尼、Netflix、影谱科技

那么,如今哪些公司在发力生成式 AI 呢。通过其能生成音视频、字幕等很容易联想到,传媒娱乐公司一定在使用。
的确,包括迪士尼、Netflix 等娱乐传媒巨头均在尝试用生成式 AI 代替标准内容制作。例如迪士尼借助生成式 AI 生成动画,只需通过文本描述某些活动,而不是注释数据和大量训练就能创建动画、电影剧本视频。
Netflix 会借助生成式 AI 抽取符合观影习惯和需求的画面,然后把这些图片制作成内容封面,以降低内容搜寻难度,提升视频制作效率。
去年 9 月上市的 Unity 是 3D 生成型 AI 的推动者。全球有超过一半的移动、PC 和主机游戏采用了其生成引擎来制作,其 3D-AI 技术也广泛应用于工业设计的 3D 模型搭建,VR/AR 设备内容创作以及影视特效制作。
一家名为 Insilico Medicine(英科智能)的 AI 药物研发公司也是生成式 AI 的应用者。该公司于 2014 年 1 月在美国成立(2019 年将总部迁到香港),是一家抗衰老及癌症治疗药物研发商,依托基因组学、医疗大数据及 AI 技术等技术手段,专注于癌症治疗、抗衰老药物的研发、生产及销售,同时面向用户提供健康管理、癌症预防等服务。

2015 年,Insilico Medicine 在全球范围内率先利用生成对抗网络(GANs)和强化学习(RL)技术,生成具有特定性质的药物分子结构。
同时,Insilico Medicine 也是全球第一家应用 GANs,以生成具有特定参数的新分子结构在 Oncotarget 及 Molecular Pharmaceutics 上发表开创性论文的公司,该公司也在研究癌症、帕金森病、老年性痴呆、渐冻人、糖尿病、肌肉减少症和衰老等新药开发计划。
不止国外。国内的影谱科技在 2018 年底便发布 AGC 智能影像生产引擎,这也是国内最早一批借助生成式 AI 开发的技术框架。
影谱科技的智能影像生成引擎 MAGC 已率先应用在传媒娱乐领域,被知名电视台、电信运营商、短视频平台广泛采纳。除此之外,MAGC 还广泛应用于数字人的 3D 成像,影视特效制作及数字孪生、虚拟主播、虚拟课堂等数字产权场景。

智能影像生成模拟
ZHONGZHIGUANCHA
面向文娱领域,影谱科技打造的智能文娱解决方案可以帮助产业推动视频自动化生产,提高内容生产效率,在视频帧审校、视频过滤、内容推荐到视频审核、视频深度预测、流媒体视频及短视频内容生产、故事可视化等产业环节应用。
面向传媒领域,影谱科技推出的智慧传媒平台服务,从内容创建到分发,形成以元数据为基本单位的一站式智能影像技术服务,提供包括批量化创建智能影像、视频资产管理与分析、智能影像运营、再到智能视频商业化的全过程。
基于影谱科技智能影像技术的 AI 方案,可在处理新闻、体育赛事等内容发挥作用。例如,实时自动绘制虚拟越位线,包括徽标,识别名人,提取字幕、人物图像等。

评论