大模型的出现及我的思考 | 社区征文
发展
过去半年,以 GPT-4 为代表的大模型技术引领了新一轮全球人工智能创新热潮。
记得从 2 月份开始,在 IT 这一圈子,人人都在讨论 ChatGPT。在此阶段,人们的注意力主要集中在 ChatGPT 使用方法上。各大科技博主也纷纷推出 ChatGPT 注册指南,人们也大开脑洞,纷纷向 ChatGPT 提问。这个时候,与 ChatGPT 相关的行业领域、科技名词也广受关注。AIGC(生成式人工智能)、Merlin(用于访问 OPENAI 的插件)、Midjourney(AI 绘画软件)等与 ChatGPT、AI 相关的术语成为搜索热词,还催生了新的岗位。
接着,国内大模型的研发热潮正在如火如荼地进行,这些大模型的名字各具特色,听着高大上档次,寓意深远,有人称之为“百模大战”。有网友在 Github 上列出了国内的大模型,这些大模型已经在医疗、教育、金融等各行各业中发挥了重要作用,渗透速度非常快。点击链接查看 相信你可以在这些大模型中找到适合你的工具。
应用案例
就在上个月,北京市科委、中关村管委会发布本市首批 10 个行业人工智能大模型典型应用案例,聚焦城市治理、医疗健康、科学研究、智慧金融、智慧生活、智慧城市等重点领域,充分展现大模型技术能力,深度结合不同行业需求特点,在帮助行业用户“降本提质增效”的同时,开发新功能、形成新产品、拓展新应用,推动人工智能技术与行业更加深度融合。
简单介绍下,这 10 个行业及基于什么模型,详细内容可自行查阅“北京市首批人工智能行业大模型应用案例发布会"相关知识。
智慧能源:基于电力行业 NLP 大模型的设备运检知识助手示范应用,基于百度“文心”系列大模型及领先的深度学习、知识图谱增强等技术,构建了千万级电力文本样本库和电力行业知识图谱,显著增强了设备及电网运营的自动化、智能化水平。
智慧医疗:数字中医大模型示范应用,基于智谱华章高精度千亿中英双语稠密模型“GLM-130B”,支持对医疗、健康问题进行智能化知识问答。
智慧城市:面向建筑领域多模态行业大模型示范应用,基于“紫东太初”多模态大模型和跨模态通用人工智能平台研发。
城市治理:城市大脑大模型示范应用,打通科大讯飞“星火”基础大模型和中科大脑公司“如如 ChatTT”行业大模型。
智慧医疗:基于山海大模型的门诊病历生成系统示范应用,基于云知声 700 亿参数规模的自研“山海”大模型,结合前端声音信号处理、声纹识别、语音识别、语音合成等全栈式智能语音交互技术。
科学研究:覆盖元素周期表原子间势,函数预训练模型示范应用,基于科学智能研究院深度势能原子间势函数预训练模型 DPA-1。
智慧金融:多模态智慧金融大模型示范应用,基于第四范式百亿参数大模型“式说”。
自动驾驶:自动驾驶大模型,DriveGPT 示范应用,基于毫末智行自研的业界首个自动驾驶生成式预训练大模型 DriveGPT。
智慧生活:面向消费领域的品商大模型示范应用,基于衔远品商大模型及 ProductGPT 等应用。
智能问答:智能问答大模型示范应用,基于面壁智能自研“CPM-Bee”大模型,联合开发“知海图 AI”智能问答大模型。
思考
大模型的出现,代表人工智能逐渐走向普及和应用的重要表现之一,随着这些技术的不断提升,越来越多的公司和研究机构将致力于拓展它们的应用和潜力。这些大模型的出现,不仅仅是技术的进步,更是一场跨越行业的技术革命。他们正在改变我们的生活方式,改变我们的工作方式,甚至改变我们看待世界的方式。
我们(技术人)可以基于已有的大模型参数,用自己的物料做一些训练,可以弄出来一个比较不错的文本模型或者其他类型模型,这个对个人来说是比较有优势的(我关注的技术博主就是基于 Github 上的开源项目来逐渐迭代,搭建了自己的网站,包含 AI 问答、AI 绘画)。
我们可以训练模型,使其成为我们的超级助理,帮助我们提升效率:对文本处理不熟悉的,可以用合适的模型进行文本关键词提取;做攻略;用来做文章中心思想提取,作为一些参考等等。
有了大模型,我们的工作量能减轻很多,你只需要写出准确的提示和耐心的调教,剩下的大模型会帮你搞定,这是超级个体的时代,我们能做的就是抓住时代给予的红利,奋力一博。
写在最后
对技术人而言,最好的方式无疑是做一款商业产品,我们常说技术人千万不要只是低头赶路,一定要抬头看路,抬头看路按我的理解就是对趋势的把握,对业务的深刻理解和对商业的深入洞察,这样对技术人而言才能构建更深的壁垒,更强的竞争力。
版权声明: 本文为 InfoQ 作者【于仔学技术】的原创文章。
原文链接:【http://xie.infoq.cn/article/126301e220886e1b74143571d】。文章转载请联系作者。
评论