AI 日课 @20230409:对话式用户界面
学习 1:对话式用户界面
这篇文章读了好几天,是一篇非常有指导意义的文章。
If You Can Say It, You Can Do It: The Age of Conversational AI
https://blog.salesforceairesearch.com/age-of-conversational-ai/
作者介绍了 GPT 的生成式大语言模型会引发的“对话式用户界面”(Conversational AI),在人与工具的交互发展史上具有革命性的意义。强烈推荐阅读全文,下面是简短的介绍。
作者首先指出,我们使用的工具,在易用性和功能性之间存在一对矛盾:越是易用的工具,功能越简单;越是复杂的功能,易用性越差。也就是功能越强大,学习成本越高,上手越困难。这对天然的矛盾不难理解,只要你打开日常使用的软件,特别是稍微有点专业门槛的软件(哪怕是 Word、PPT、Excel 这样的办公软件),你就会看到类似下面的这种界面:
这种图形界面真的是比较复杂的,不经过一段时间的探索使用或者是专门的学习培训,一般人很难用好。更不要说是更专业、技术含量更高的用户界面,比如飞机的座舱:
各种数字面板和满屏的按钮和摇杆让人眩晕。工具的给我们带来沉重的认知负担。
而 ChatGPT 给我们带来了希望:通过“对话”来简化人与工具的交互。“对话”因为下面的特点而破解了“易用”vs“功能”之间的矛盾:
“对话”功能非常强大,可以让我们通过简单的方式描述并启动复杂的任务。
“对话”非常易用。它是人类最通用的工具,每个人都会使用语言。
人们使用“语言”常常是多模态的,也就是和视觉、声音等其他信号一起工作。
这还仅仅是人类单向地向工具下达指令时“语言”能达到的效果,而“对话”更强大的功能还存在于“对话”之中:
大语言模型可以给我们反馈提议,我们可以通过接受、拒绝或者修改这些提议,从而将单向的指令推进到双向的“对话”。
这种开放式、迭代的对话流,通过一轮一轮的尝试和纠正,让用户的需求不断得到明确和塑造,直到被解决。
基于大语言模型的智能,通过“对话式用户界面”,在“功能强大”和“简单易用”之间第一次达到一个难得的平衡,会带来产品设计上的重大变革。
往期日课:
AI日课@20230408:如何基于大模型训练一个自己的数字克隆
版权声明: 本文为 InfoQ 作者【无人之路】的原创文章。
原文链接:【http://xie.infoq.cn/article/ad66d20b96dc8e90bb01c1006】。文章转载请联系作者。
评论