大模型:未来的智能方向
一:什么是大模型
大模型是大规模语言模型(Large Language Model)的简称 -- 指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。
大模型设计的目的:
大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各个领域都有着很广泛的应用,例如图片识别、语音识别、医疗行业和专业岗位等。大模型通过海量数据(web,Wiki,小说等)来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。
二:大模型的现状
目前大模型的现状:
国外:
目前最新的是 GPT-4(openAi 为聊天机器人 ChatGPT 发布的语言模型, 回答准确性不仅大幅提高,还具备更高水平的识图能力,且能够生成歌词、创意文本,实现风格变化。此外,GPT-4 的文字输入限制也提升至 2.5 万字,且对于英语以外的语种支持有更多优化),目前这一年主要的功能和现状如下更新:
2023 年 3 月:美国人工智能研究实验室 openAI 为聊天机器人 ChatGPT 发布了 GPT-4 语言模型.
2023 年 4 月:GPT 用户突破 1.73 亿
2023 年 5 月:IOS 上线 GPT 的 APP 应用和上线联网+插件模式
2023 年 6 月:CEO(Sam Altman)巡回演讲,GPT 用户突破 2 亿+
2023 年 7 月:GPT-4 上线解码器模式(代码解释器模式提供了一种更直观、更精确的方式来利用 AI 生成代码)并且上线 Android APP 应用平台以及 3 小时 25 次对话数量变成 3 小时 50 次对话
2023 年 11 月:CEO(Sam Altman)发布 GPT-4 turbo(增加多模态--语言,图片,语音的对话,记忆能力达到 128k 等)
国内:
国内有多家 Ai 公司都在竞争发展,例如:百度--文心一言,阿里--通义千问,讯飞--星火大模型。对比下截至 12 月份的微信指数可看出相应公司的 ai 大数据,可以看到目前国内排名靠前的是百度的文心一言。
2023 年 5 月,百度智能云在北京举行文心大模型技术交流会。后面百度智能云推出全球首个一站式的企业级大模型平台“文心千帆大模型平台”。
2023 年 6 月,据百度智能云官微消息,无锡市梁溪人才集团与百度签署合作协议,共同建设百度智能云文心千帆大模型(无锡)创新中心,这是文心千帆大模型平台全国首个区域私有化部署落地。
2023 年 9 月, 百度智能云宣布千帆大模型平台升级至 2.0 版本。本次升级中文增强将提升大模型中文理解和生成能力,例如 LIama2 的国外大模型,也可实现中文对话好的效果。同时训练和推理性能有所提升,训练 LlaMA 2 的总体吞吐可提升 1/4,推理提升 3 倍。
2023 年 12 月 20 日,百度智能云宣布,AI 原生应用开发工作台——千帆 AppBuilder 全面开放服务,真正实现人人都能开发自己的 AI 原生应用。
综合来看:
目前大模型的现状不管是国外还是国内主要都是在人机对话式聊天解决问题阶段,还有待后面泛生出更多的发展方向。现在大模型在国内还是处于 GPT-3.5 左右的水平,只能通过文本 token 或者 prompt 去获取对话式文本回答,与国外 GPT-4 turbo 多模态,解码器等模式还存在一定的差距,但是由于中国的数字互联网基础措施的建设在国际一直都是排名第一的,相信后面国内发展定会慢慢缩小差距,最终实现弯道超车。
三:大模型的未来
未来几年,大模型的发展模式应该会和各行各业深度合作开展更专业的领域探索和发展的道路。
1:场景化的认知智能体--大模型驱动相应智能体具备复杂环境的自适应感知和认知能力并具备一定的自治和自主性。
2:通用大模型的跨领域专业知识--给金融服务,或者病患诊断确认特殊疾病等。
3:加速场景化转型--实现一些规范服务业的人员工作,例如客服,相应老师等。
大模型未来的发展——通用人工智能
通用人工智能(General Artificial Intelligence),是指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体,具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念。例如《流浪地球 2》中的 moss 就是通用人工智能的集合体,可以高质量的完成人类处理的事务,通用人工智能的发展将重塑人类文明。在遥远的未来,随着通用人工智能的发展,到那时人的智能不是唯一的、人只是一种更高级的通用智能体,但不是终结,人已不再特殊。人类将迈入人机共生的智能时代。
评论