写点什么

AIGC 技术展望和机会 | 社区征文

作者:AIWeker
  • 2023-07-24
    福建
  • 本文字数:1582 字

    阅读完需:约 5 分钟

AIGC技术展望和机会 | 社区征文

1. AIGC 技术半年总结

至去年 ChatGPT 引爆互联网后,虽然只过去了短短的半年, 生成式 AI 技术和应用以周为粒度不断更新迭代,可以日新月异,推陈出新。


我们来盘点下生成式 AI 近半年的发展

1.1 ChatGPT 系列

2023 年 1 月,ChatGPT 的月活用户达到了 1 亿。随着 ChatGPT 的应用不断增加,出现了许多围绕该技术的应用,如 copy.ai 的广告文案和 sitekick.ai 的 Landing Page。OpenAI 在 3 月份宣布推出面向商业用户的 ChatGPT API,用户只需支付 2 美元即可输出约 75 万个单词,使用的是 gpt-3.5-turbo 模型。谷歌在 2 月份推出了聊天机器人 Bard,并在 5 月和 7 月进行了功能和语言方面的扩展。Meta 公司在 2 月份推出了 LLaMA-13B 的新型 AI 大语言模型,该模型的参数量仅为 OpenAI 的 GPT-3 模型的 10%,但性能却更好。Meta 在 7 月份推出了 LLama2,包含 70 亿、130 亿和 700 亿 3 种参数变体,并对外开放以供商业使用。


OpenAI 在 3 月份推出了 GPT4,该模型能力大幅提升,并支持图片和文本的多模态应用。随后,百度推出了 ChatGPT 的替代品文心一言,其他大厂也纷纷推出了更新版本的大语言模型,如阿里云的通义千问,华为的盘古大模型,商汤的日日新,360 的 360 智脑,京东的言犀大模型,腾讯的 HunYuan 大模型,科大讯飞的讯飞星火等。同时,一些开源模型如 Alpaca、ChatGLM-6B、ChatGLM2-6B、MOSS、Vicuna-13B 和 mini-GPT4 也纷纷涌现。在应用方面,微软将 ChatGPT 与 Office 融合,阿里将大语言模型推广到所有业务线,字节将大语言模型整合到飞书,金山推出了 WPS+大语言模型,从而提高工作效率。


1.2 文生图

AIGC 的另一个分支,就是以 DALE-2 和 Midjourney 为代表文生图的应用,就是通过文本描述来生成逼真的图像。另一个是以 Stable Diffusion 为代表的开源模型。Midjourney 实现了 v3 到当前 v5.2 模型的更新,不仅在图像逼真度,而且支持扩大补全的神奇功能;



Stable Diffusion 最近也更新模型到 SDXL 0.9



文生图 AI 绘画对于绘画领域产生了深远影响,对插画,游戏原画,设计等行业势必产生新的创新模式。

2. AIGC 机会思考

生成式 AI 如火如荼,那 AIGC 对于创业者和使用者能带来什么机会?

2.1 效率提升,解决业务痛点

通过分析下当前业务中的痛点和效率低下的环节,评估下是否接入成熟 AIGC 工具如 ChatGPT 或者文生图,当然也要考虑成本因素。这是当前比较主流的应用方式。


比如游戏设计中的原画设计,可以接入 Midjourney 来做初稿和创意设计,来大大加快效率;视频或者文字内容创造者,可以用 ChatGPT 来文案设计,用 Midjourney 来插画或者视频素材;培训工作者如教师可以用 ChatGPT 来做备课工具,提升效率。


这个阶段注重和自身业务的契合点,直接使用工具解决问题。

2.2 提升易用性,做垂直应用

当前 AIGC 的一个重要的环节是 prompt(提示),不同的 prompt 可以有截然不同的结果,这个也是当前 AIGC 使用的一个门槛。如何提升工具的易用性,是一个值得关注的方向


  • prompt 分享平台:分享不同的 prompt 展示平台,甚至拿 prompt 做为产品来销售,以及 prompt 培训

  • 能不能只写简单的 prompt 就能有很好的结果,比较典型的就是做垂直领域的应用,总结垂直领域特别的 prompt 作为潜在的 prompt 添加到使用者的 prompt 之后进行简化使用

  • 垂直领域应用:用产品思维的方式,分析垂直领域的特点,综合 AIGC 和其他领域知识,打造更加智能化的垂直应用


这个阶段注重易用性的提升, 封装工具成特定领域的工具解决问题。

2.3 AI Agents

最近 AI Agents 迎来新的爆发点,以 AugoGPT 以开始,如何将 AIGC 功能扩展到更大的领域,如何做任务规划,存储记忆,以及使用工具;以及制作 AI Agent 的平台工具,这也是提升便利性的方向。


2.4 注重开源模型

特别对于垂直领域的应用,研究开源模型的特性,以及性价比高的微调方式,是一个重要方向。特别是文生图方向,可以通过 Lora 等技术需要少量的图片就可以训练专业定制的模型,毕竟像 Midjourney 闭源的模型种类不可能面面俱到。

3. 小结

本文总结了近半年来 AIGC 的重要发展,以及自己对未来机会的思路,抛砖引玉,希望对您有帮助。

发布于: 刚刚阅读数: 5
用户头像

AIWeker

关注

InfoQ签约作者 / 公众号:人工智能微客 2019-11-21 加入

人工智能微客(aiweker)长期跟踪和分享人工智能前沿技术、应用、领域知识,不定期的发布相关产品和应用,欢迎关注和转发

评论

发布
暂无评论
AIGC技术展望和机会 | 社区征文_AIGC_AIWeker_InfoQ写作社区