通义家族大模型总结

2023-12-09
广东
本文字数：2751 字
阅读完需：约 9 分钟

引言

今年的确是生成式 AI 狂飙的一年，像 chatGPT、Amazon Q、CodeWhisperer、文心一言、通义千问等这些文本生成、文生图或者文生视频的应用迭代的速度都非常快，这些应用也让我们非常兴奋，大家甚至开始在自己的生活和工作中去尝试应用 AI 工具，像我平时写代码的时候，也会用 CodeWhisperer 或者通义灵码来辅助编程，我也认为 AI 可以帮助我们再一次提升人类的生产力，当然，也会有不少人会觉得自己的工作可能要被 AI 取代了，面临失业的风险。但现实的发展好像并没有想象中的那么美好。

对于企业来说，想在企业内部更快地使用“生成式 Ai”，享受 AI 带来的降本增效的福利，还面临不少问题和挑战，我认为最大的一个挑战就是基础模型本身的问题，目前模型的基础预料都是来自互联网上的公开资料，比如说博客、论坛、出版物以及维基百科的一些数据。对于企业内部的业务，AI 其实没有很深入的了解，也就很难在企业内部发挥作用，很多问题其实 AI 真的不懂，比如说你到底是在做什么工作，你的工作需要一些什么样的技能基础，又需要了解一些什么样的工作流程，甚至可以用到哪些内部的数据等等，它都不了解，自然也就没有办法给到很好的回答。

今年我也体验过很多大模型，接下来就谈谈自己感受！

通义家族

今年的云栖大会发布了众多大模型，尤其是通义千问升级到 2.0，在多项评测中综合性能超过 GTP3.5,相比 GTP4 各有胜负，据说 2.0 版本已经迭代至千亿参数级别，在复杂理解、创作、数学以及逻辑能力上升级，接下来我们就体验一下通用大模型。

通义千问

语义理解

Prompt：“在炎热的夏日，我喜欢在海边享受清凉的海风。” 请问“享受”一词在这里的具体含义是什么？

Prompt：“虽然他很忙，但还是抽出时间来陪我。” 请问“抽出时间”这个短语表达的是什么意思？

Prompt：“她对我微笑，但我知道那只是一个礼貌的微笑，不是真心的。” 在这里，“礼貌的微笑”和“真心的微笑”是如何区别的？

这里我用了三个 Prompt 测试通义对语义的理解，不得不说，通义对中文的理解还是挺棒的，也能 get 到我的意思，通义千问真的很聪明，它可以理解我们说话的意思，即使是很难懂的话也可以。不管是简单的问题还是复杂的问题，它都能够很快地明白我们在问什么，并且给出正确的回答。我真的觉得通义千问的语义理解能力很强，它能够在人工智能的世界里做得这么出色，真的让我大开眼界。

逻辑理解

Prompt：有一个农场主把鸡和兔子放在同一个笼子里。他数了一下，一共有 40 个头和 100 只脚。请问，笼子里有多少只鸡和多少只兔子？

这是一道数学理解题，通义千问在这次数学逻辑题里真的表现得很好。它很准确地理解了问题，并且通过建立方程，很快地找到了问题的关键，然后给出了正确的答案。这让我觉得通义千问不仅有很强的数学基础，而且在逻辑推理和解决问题方面也很厉害。这次的出色表现让我更加相信通义千问在人工智能领域里是很优秀的，也让我期待它在未来能解决更多更复杂的问题。

文学创作

在文学创作方面，要求通义千问描写黄河，但是不能出现“黄河”二字，并且起个优美的题目，从创作内容看，通义千问采用拟人的手法描述了黄河的壮观，没有出现黄河，符合提议

然后加大难度，给了一篇高考作文题目，写一篇符合题意要求的作文，说实话，写的确实可以，挺不错的。

Prompt：好的故事，可以帮我们更好地表达和沟通，可以触动心灵、启迪智慧；好的故事，可以改变一个人的命运，可以展现一个民族的形象……故事是有力量的。以上材料引发了你怎样的联想和思考？请写一篇文章。要求：选准角度，确定立意，明确文体，自拟标题；不要套作，不得抄袭；不得泄露个人信息；不少于 800 字。