跃见书单 | 一文带你读懂《人工智能简史》
本期好书分享官:亚丹
本书推荐语:
“ 既是一本严肃的信史,又通俗易懂,带有科普的性质,更难得的是妙趣横生,使人拿起来一读就放不下手。”了解一个领域,可以从它的发展历程开始。尼克的《人工智能简史》,以人物为主线,中间穿插一些人物之间的有趣的细节,让历史更鲜活。
这本书对我们建立 AI 的全景式理解很有裨益,几乎覆盖人工智能学科的所有领域,包括人工智能的起源、自动定理证明、专家系统、神经网络、自然语言处理、遗传算法、深度学习、强化学习、超级智能、哲学问题和未来趋势等,以宏阔的视野和生动的语言,对人工智能进行了全面回顾和深度点评。
• 过去:大事件、关键人物、研究路线
• 现在:看待人工智能的三类人群
• 未来:插上 AI 翅膀,从 GPT 走向 AGI
过去
人工智能的大事件
科技大佬比尔盖茨说:我们总是高估未来两年的变化,低估未来 10 年的变革“,这里如果能了解历史,相信更容易评估未来 10 年的变革。历史是一面镜子,看得到过去,照得到未来。ChatGPT 说:读历史可以增加知识,培养思维能力和文化素养。我总结几个词:发觉兴趣,笃定未来,把握机遇。
这里结合了人工智能的发展脉络、演化路径,为大家整理人工智能历史上的这些大事件:
1943 年,人工智能诞生,开启了人类智能科学的新纪元。
1966 年,Eliza 诞生,首个人工智能语言处理程序,引发了人机对话的研究热潮。
1980 年,专家系统的兴起,让机器具备了专业知识和决策能力。
1997 年,Deep Blue 战胜国际象棋世界冠军,标志着人工智能在复杂计算领域的突破。
2011 年,IBM 的 Watson 击败人类参赛者,成为知识问答领域的超级智能。
2012 年,谷歌的深度学习算法实现图像识别突破,开创了人工智能的新篇章。
2016 年,AlphaGo 击败世界围棋冠军,引发全球对人工智能的深刻思考和讨论。
2019 年,微软推出了 Turing Natural Language Generation 生成语言模型,该模型拥有 170 亿个参数。
2020 年,GPT-3 问世,成为最先进的自然语言处理模型,引领了语言生成技术的发展。
2022 年,OpenAI 于 11 月发布了 ChatGPT。
2023 年,OpenAI 宣布推出 GPT-4 多模态 LLM,可接收文本和图像输入。
这些重要节点见证了人工智能的发展历程,展现了人类智慧的无限潜力。让我们共同期待未来人工智能的更大突破和应用,为人类带来更美好的未来。
可以看得出,Turing,Deepmind,AlphaGo,OpenAI,GPT 成为关键点!
人工智能历史上的关键人物
近日,《时代》周刊发布了 2023 年度 AI 领域最具影响力的 100 人名单。在这份名单中,我们看到了很多熟悉的学者和企业家。
「领导者」部分包括 OpenAI 联合创始人 Sam Altman,百度 CEO 李彦宏,谷歌 DeepMind CEO 兼联合创始人 Demis Hassabis,还有马斯克、李开复、吴恩达、黄仁勋等。
「 思想者 」部分,中国科学院教授曾毅、斯坦福大学教授李飞飞、OpenAI 联合创始人兼首席科学家 Ilya Sutskever,以及深度学习三巨头 Geoffrey Hinton、Yann LeCun、Yoshua Bengio 均入选。
(图源于 XR INNOtopia)
这 100 个 AI 影响力人物,是由《时代》周刊最有资深的编辑和记者,花了几个月的时间从几十个来源收集推荐,汇总得到了一个包含数百个提名的名单,再最终形成了这个 100 人的名单。大部分人的故事,在《人工智能简史》上能够看到。
透过历史,看到这些人对 AI 领域发展的贡献。正如《时代》周刊主编在榜单评语中写道,“ 他们的洞察力、愿望和缺点将决定这一日益有影响力的技术的方向。”
人工智能研究的两条路线
在过去 70 年的发展历史上,有两条技术路线,就像跷跷板一样,一上一下,此起彼伏,就当前来看,连接主义路线得到了快速发展。我简单分析一下这两条路线的关键差异。
符号主义,以逻辑推导为核心,底层实现更多是基于规则,通过符号和符号之间的逻辑关系来表达智能。这条路线的特点是可解释性强,毕竟每一步都是有逻辑的。
连接主义,以统计分析为核心,底层是数据的分类、关联,通过模仿人脑神经元的链接方式来表达智能。这条路线的特点是有些不可解释,在海量参数下,涌现了智能,泛化,幻觉,难以解释。
连接主义语料库(橙)与符号主义语料库(蓝)
(图源于“AI 范儿”)
在过去,符号主义长期占据主导地位,产生了商业和社会价值,比如专家系统,知识图谱等,但在较长一段时间内达到了瓶颈。
随着算力,算法,数据的指数级增长,连接主义背后机器学习,深度学习,强化学习等展现出极大优势,最最有影响的是 2016 年的 AlphaGo 战胜人类围棋冠军,以及 2022 年 OpenAI 推出的 ChatGPT,似乎预示着连接主义是人工智能的最好路径。
人工智能的连接主义学派,是模仿人脑的神经元连接方式来构造智能。在《人工智能简史》上,缺少了对于脑神经科学的发展历史和关键人物的讲述。如果有兴趣,可以通过阅读《新机器智能》和《千脑智能》这两本书来更深入了解神经网络和人工智能之间的发展关系。
现在
血清素 VS 多巴胺 VS 内酚酞
正视当前,跟大家分享下趣味的人工智能 3 大人群划分,这里借用“脑科学“中,关于人的快乐感觉的研究。人的快乐来自 3 种大脑化学物质,分别是血清素,多巴胺,内啡肽。三个层级的快乐感觉,引申定义了看待人工智能的三类人群。
血清素群体
血清素是帮助我们放松心情,减轻焦虑感,可以概括为 “ 舒适感 ” 。
血清素群体,在国民现象级产品中可以看到,是非常庞大的。比如,头条的新闻,抖音的视频,越刷越好看,越好看越刷。我们现在知道,这里基于个人兴趣爱好等特征的精准推荐,推荐算法比你自己还了解你。这类场景的用户不需要关心什么是人工智能,方便使用就可以了。这是理解人工智能的一种形式:科技让生活更美好。
多巴胺群体
多巴胺则让人感到愉悦,可以概括为 “ 快感 ” 。
多巴胺群体,使用工具提升效率的人,比如:使用 ChatGPT 写文案,使用 Midjourney 画图,使用 runwayml 将图生成视频等等工具。这类 ToB 的场景,使用工具提效,有学习门槛,要付出一点成本。因为这个群体知道:取代自己的不是 AI ,而是更懂 AI 的人。
内啡肽群体
内啡肽则是让人感受到极大的 “ 成就感 ” 。要获得内啡肽分泌,必须先付出巨大的努力,忍受极大的痛苦。而一旦成功,这种幸福感持续的时间也特别长。
内啡肽群体,他们是预言家,是技术专家,是时代先锋。
代表观点:
英伟达黄仁勋:ChatGPT 是 AI 领域的 iPhone 时刻
盖茨:ChatGPT 表明人工智能历史意义不亚于“PC 或互联网诞生”
GPT-5 恐被叫停, 马斯克、图灵奖得主等千名专家呼吁暂停
陆奇最新演讲审定版:大模型带来的新范式和新机会
吴军:ChatGPT 不算新技术革命,带不来什么变革...
代表企业:
OpenAI/Anthropic、Midjourney、Runwayml、NVIDIA、风投(YC,a16z)
他们是提供服务和工具的群体,他们是算法专家,硬件专家,网络专家,数据科学家,软件工程专家,人伦学家,脑科学家。在他们看来,人工智能是人类未来发展的必经之路,特别是在这次 ChatGPT 发布以来,是“新范式新变革新机遇”,他们坚持了很多年,经历潮起潮落,他们 “ 因为相信,所以看见 ” 。
未来
从人工智能的发展曲线看,我们不难发现:人工智能的发展起起落落,总体向上,近十年来高速发展,特别是去年 11 月份的 ChatGPT 发布以来,迎来新一轮的大爆发。
当前,人工智能的技术已经融入到我们的日常生活中,而且还在快速的发展变化。我们从中能够获得哪些启示?
从 GPT 走向 AGI/ASI
(图源于“AI 范儿的 A𝕀²·ℙarad𝕚gm 商业范式 v4.0 示意图”)
这张图是 AI 范儿社区的技术专家画的,信息量特别大。想要讲清楚这张图的整个逻辑,估计没有个 20 分钟讲不清楚,我尽量分享一下这张图里面的几个关键概念。
铲子
比如蓝色部分,卖硬件,卖电,卖 GPU,卖软件基础设施服务,典型的公司有英伟达,公有云服务厂商,这些都是卖铲子的,这个概念来源于 19 世纪美国西部淘金热,当时发现了很多金矿,全球各地的人蜂拥而至,最终服务于这些矿工的人,比如卖牛仔的挣到了钱。当前大模型火热,挣钱的是英伟达,前几天看到一个新闻,说最新的 H100 卡,利润是 1000%。
炼丹
训练大模型,产出一个海量参数的大模型叫做炼丹。很形象,为什么这么称呼?因为每训练一次大模型,时间特别长,可能要 1-2 个月的时间,很像中国古代的炼丹过程。
采矿
大模型出来了后,具备很强的通用能力,但如何发挥这些能力,这个就需要良好的提示,大家把“提示词工程”,称为挖矿。
化身
通用的大模型,由于是用了很多公开的数据集来训练,缺少专业知识,所以针对专业知识能力增强,就需要进行微调,微调后对专业领域知识增强后,通用能力会弱化。因此化身的意思就是变了另外一种身份。
具生
可以简单理解就是具备感知/认知/执行的 的智能体,可以是具人机器,自动驾驶的汽车这类综合场景的人工智能产品。
还有一种分法是从分层的角度看,基础设施层,基础大模型层,行业大模型,智能体-Agent。每一层都有巨大的机会,需要专业的人才,都有很多的机会。这些机会更多是面向内啡肽群体的。希望有更多的人群,成为内啡肽用户。
插上 AI 的翅膀
下面用一个短片,分享一下借助 AI 工具,提升生产效率的例子。这个短片,是我认识的一个朋友,他做了一家小型广告公司,他在前段时间台风天气时,在家里用一个下午的时间用 AI 制作的广告短片。
大概步骤如下:
1、让 ChatGPT 写生动的 Prompt
2、把 Prompt 给到 Midjourney 生成图片
3、将 Midjourney 生成的图像+文字描述,输入 gen-2 做视频素材生成和修改
4、使用 Google 插件和剪映工具完成视频配音
5、最后使用剪映工具将素材剪辑成完整的广告短片
未必人人都能成为人工智能领域的内啡肽群体,但我们要做的便是让自己从血清素群体尽快成长为多巴胺群体,让 AI 助力我们的工作和生活!
END
版权声明: 本文为 InfoQ 作者【码上跃见】的原创文章。
原文链接:【http://xie.infoq.cn/article/317564686f9e609d03adb1e62】。文章转载请联系作者。
评论