写点什么

基础大模型纵横天下, 垂直大模型各领风骚, 专注一域称尊

  • 2024-06-14
    浙江
  • 本文字数:2412 字

    阅读完需:约 8 分钟

大模型“风口”与大数据系列之--

基础大模型纵横天下,垂直大模型各领风骚,专注一域称尊

今天,终于能挤出时间,开始动笔写这个期待已久的系列文章了。这个系列的灵感源自今年 2 月份我为极客时间做的一场直播,主题是“当大模型遇上大数据 预见 2024:解锁 AI 未来趋势”。

在那次分享中,我准备了一套 PPT,梳理了当前大模型技术的发展脉络、应用场景和未来图景、对行业与职场的改进、与大数据结合。直播结束后,就一直念念不忘,想把 PPT 中的干货提炼出来,写成一个系列,跟大家做更深入的交流。

但大家也知道,日常工作那么繁忙,总是被这事那事绊住,难得有空闲时间。接下来的日子,逐步把系列文章写出来,跟大家分享。

这个系列会用通俗有趣的方式,带大家了解

  • Part1 大模型的昨天今天明天

  • •大模型元年

  • •大模型的主要发展

  • •大模型在 B 端 C 端的应用

  • •大模型发展中的挑战

  • •大模型的突破点

  • Part2 大模型对企业、职场与个人成长的影响

  • •后时代的商业模式与大模型

  • •大模型与企业

  • •大模型与个人

  • •大模型与职场

  • Part3 当大模型遇上大数据


大模型这个话题既好聊,又难聊。它涉及技术、商业、社会等多个维度,每个角度都有很多值得探讨的问题。我就结合自己整理的 PPT,谈谈个人对去年 GPT 火出圈、国内大模型井喷现象的一些看法。

**从商业角度来看,许多公司纷纷跟进大模型,更多是出于跟风心态,而非基于市场实际需求。OpenAI 的成功让大家看到了大模型的潜力,纷纷效仿,希望在这个新兴赛道上分一杯羹。但大模型的研发成本高,周期长,变现模式尚不明朗,盲目投入可能面临较大风险

**从公司自身来看,拥有大模型确实是一项有价值的核心资产。强大的语言模型不仅能提升产品智能化水平,增强用户体验,还可以带动算力需求,促进相关产业发展。我们看到,很多上市公司在发布大模型产品后,股价都出现大幅上涨。

**从社会层面来看,每家公司都在训练自己的大模型,难免会导致资源浪费和重复建设。目前各家的模型在架构、性能上并无显著差异,缺乏突破性创新。站在更高维度,我们更应该合理整合资源,打造一个质量领先、开放共享的大模型,让各行业都能便捷调用,推动数字经济发展。

**作为产品经理,在考虑引入大模型时,要审慎权衡技术成熟度与商业可行性大模型确实很酷炫,但能否解决用户痛点、创造实际价值,才是决定成败的关键。产品经理要基于充分的市场调研明确产品定位,而不是盲从技术热点。

**对创业者而言,单纯做一个通用大模型恐怕很难立足。关键要在大模型之上,构建行业解决方案,或开发面向特定场景的上层应用。这需要深入理解行业需求、精准把握用户痛点,在快速迭代中形成差异化优势和护城河,从而在竞争中笑到最后。


那什么是大模型呢?

先来讲一个笑话:

大模型浪潮来袭,AI 新时代已然开启。一天,松子带着快生的老婆逛街,无意间来到一个叫“数据工程”的胡同口。那里有个算命摊,摊主身前的电脑屏幕上数据变幻,旁边立着一副对联:

左联:GPT 的古怪预言家,OpenAI 炼丹炉中萃取智慧而来,冠为全知的 AI Agent

右联:基础大模型纵横天下,垂直大模型各领风骚,专注一域称尊

横批:Sora 必爱模型,预测过去未来,给你 60 秒可视化沉浸式体验



松子心头一想,哦原来是同道中人啊,是个搞大模型的。

便坐下来,问道 "先生,给我预一测。" "你预测什么?" "预测一下老婆生男生女。" "OK,让我算算。"

然后,老先生在电脑上捣鼓一通,阿松很好奇,探头看看,原来老先生正在用大模型输入一大堆提示词,拖过来拖过去,时而上钻,时而下钻。

时而易经大模型、时而周易大模型,时而大数据多维分析。时而理、预测、关联、系统、静态、动态、定性、定量。

不一会儿,给我媳妇儿讲你老婆怀孕了,因为肚子大了。" "预测" "以你老婆肚子大小为变量,预测在 34 天之后生。"

"关联来看" "你也是搞大模型的?那么十有八九会生女孩。"

"基础大模型来看” "小孩会从肚子里出来。"

"静态" "要生了。" "动态的" "生完如果不注意避孕,还会生的。" "定性的?" "会生的。" "定量的?" "会生俩。" "比较的?" "你会比那个早生。" "交互的?" "让我摸摸。

"靠,到底是生男生女" "嗯,基本上,结合各类模型预测,50%的概率是男,50%概率为女。"

松子扭头就走,留下摊主独自嘟囔:“至于吗?不就是开个玩笑嘛......”。松子边走边说,“海量知识、天马行空、温故知新,但也经常语无伦次、胡言乱语。这究竟是个什么妖魔?”


再举一个例子来解释什么是大模型

比喻一下大模型是一个 985/211 毕业的大学生,在校期间他是被 OpenAi 这个老师用训练监督策略方法、训练奖励模型方法、强化学习等方法学习了各种知识(A、b、c、d) 同时还学习了全部人的人类知识基础知识,学习了基础推理,各种基础法则等。

当他毕业后就充当了大城市的一个公共向导员, 每天都有大量市民来问他各种问题,他会将自己学习到知识来回答人民的各种问题,大家发现这个公共向导员知识是海量的,还能帮忙总结、搜索问题,甚至还能给出一些思路上框架与指引。

这个毕业生刚开始有点内向,只知道一问一答,随着人们对他越来越熟悉,知道了各种问法。比如用更好的提示词,引导语,给出示例。他都能根据这些来很好的完成答案的生成,并且性格越来越外向。



久而久之大家感觉这个小伙子非常勤奋,吃苦耐劳,就让他承担更多的任务,法律、医生、物理、化学、数学题都会请教他。

但是吧,久而久之大家发现这个小伙子有时候一本正经的胡说八道,还有这些专业问题都回答错误,大家都开始当老师一般的教这个小伙子这些更加专业知识,还有干更多的活。

不久之后,ChatGPT 变得更加精于此道,变成了一个真正的垂类大模型,它不仅仅能够回答普遍的问题,还能处理特定领域的复杂查询。

大模型,正式名称叫"大规模语言模型"(Large Language Model),是自然语言处理领域的重大突破。它犹如一个饱读诗书却不拘小节的智者,懂得天文地理,能写能画,举一反三。这得益于它学习了海量的文本数据,通过深度学习算法,掌握了人类知识的精髓

待续......

​ps:​在整理过程中参考了大量信息与资料​,参考链接后面会放出。

发布于: 15 分钟前阅读数: 5
用户头像

还未添加个人签名 2018-10-30 加入

公众号:松子聊数据

评论

发布
暂无评论
基础大模型纵横天下,垂直大模型各领风骚,专注一域称尊_大数据_松子(李博源)_InfoQ写作社区