写点什么

人工智能的底层逻辑

  • 2023-07-11
    北京
  • 本文字数:3167 字

    阅读完需:约 10 分钟

众所周知,人工智能(Artificial Intelligence,AI)的研究大致有三个派别:符号主义、联结主义和行为主义。

简单来说,符号主义主要是用公理和逻辑体系搭建一套人工智能系统。联结主义主张模仿人类的神经元联结机制来实现人工智能。行为主义认为,智能取决于感知和行动,环境的反馈有助于智能的提升。

不同的研究视角派生出不同的学术流派。

然而,这些看似泾渭分明的主义,如果站在更高的抽象视角来审视,它们其实具有共同的特征——都是在研究事物间的关系(Relation)。

自 2012 年之后,以深度学习为代表的联结主义可谓风生水起,在计算机视觉、自然语言处理等领域均有广泛应用。如前所述,深度学习在很多领域取得的效果固然很好,但因为它属于典型的“端到端”黑盒模型,因此存在阿喀琉斯之踵(Achilles's Heel)——无法对预测的结果给出合理的解释。在探寻真理的路上,人们是不被允许在“知其然,不知其所以然”的非理性繁荣中徜徉太久的。要知道,追求因果,可能是人类保持心神安定的重要慰藉。

“天下无不散之筵席”,目前深度学习的技术红利收割已趋饱和,盛宴已过,诸神黄昏,需要纳入新的理论来突破 AI 的天花板。很多奋斗在科研第一线的科研人员很敏锐地意识到了这一点。2019 年 11 月,在著名学术会议 NeurIPS(Conference on Neural Information Processing Systems,神经信息处理系统大会)的主旨演讲上,图灵奖得主约书亚·本吉奥(Yoshua Bengio)借鉴著名心理学家卡尼曼提出的“系统 1”(快速、直觉、无意识)和“系统 2”(慢速、逻辑、有意识)的理念,指出深度学习的未来应走向“系统 2”,如下图所示。



以深度学习为代表的人工智能已在“听、说、看”等感知智能领域达到或超越了人类水准,但在需要外部知识、逻辑推理或领域迁移的认知智能领域还处于初级阶段。也就是说,深度学习的研究应从以感知智能为主,逐步向基于认知的逻辑推理方向演进。

显然,逻辑推理明显属于符号主义的研究范畴。被“慢待已久”的符号主义,似乎正酝酿着“冬天到了,春天还会远吗”的情绪表达。但怎样表达逻辑推理呢?除了传统的符号,图(Graph)也是一个颇有潜力的表达方式。

无独有偶,2020 年,清华大学张钹院士在《中国科学》第 9 期撰文提议:我们应“迈向第三代人工智能”。他认为,第三代人工智能发展的思路是:把第一代的知识驱动(符号智能)和第二代的数据驱动(感知智能)结合起来,通过协同利用知识、数据、算法和算力四要素,构造更强大的第三代 AI(知识智能)

清华大学唐杰教授在《人工智能下一个十年》主题报告中给出了一个实现认知智能的探索路径:认知图谱=知识图谱+认知推理+逻辑表达。显然,图谱需要用图来表达。

英雄所见略同,2020 年 9 月,在中国郑州召开的“第十六届全国高性能计算学术年会”上,陈左宁院士做了题为《人工智能进展对算力需求分析》的主题报告。在该报告中,陈左宁院士也认为,人工智能三大流派日趋融合,协同发展。她总结道:“人工智能的核心特征就是对‘关系’的研究。”“关系”的表现形式有三种:一是联结关系,比如,神经网络中神经元间的联结、反向传播算法中的梯度传播和进化算法中的变异;二是逻辑关系,如 RNN(循环神经网络)中的循环连接及知识图谱中的推理关系;三是因果关系,如贝叶斯、决策树及强化学习中的控制连接。

我们常说“有人的世界,就有江湖”。与此类似,有“关系”的地方,就有图。万物之间皆有联系。如果说人工智能的核心特征之一就是“关系”,那么描述“关系”的首选工具会是谁呢?当然就是图!图作为一种通用的数据结构,可以很好地描述实体与实体之间的关系。

虽然深度学习的技术红利有“日薄西山”之势,但并不会“戛然而止”。按照科技哲学家凯文·凯利(Kevin Kelly)的观点来看,技术是另外一种生命,它拥有自己的“技因”(Teme),为保持生命力,它会不断演化,从而达到技术自身的适者生存。深度学习作为一项 AI 前沿技术,亦会如此。

神经网络技术与图理论结合就塑造出了——图神经网络(Graph Neural Networks,GNN),这是技术发展趋势的理性宣泄。我们可以认为,GNN 是图在深度学习领域的生根发芽,也可以理解为,GNN 是深度学习在图数据领域的开疆拓土。如此这般,便能大致勾勒出图神经网络的模样。

图神经网络时代来临

“图”数据是图神经网络处理的对象,在中文语境中,“图”和“图像”感觉类似,实则不然,下面我们先来梳理这两者的区别。


01

图与图像大不同


在英文中,图像是 Image,图是 Graph,二者大相径庭,很容易区分。但在中文语境中二者常被混淆。图像与图的可视化区别如下图所示。如图(a)所示,在数据表达上,图像是基于点阵的,点阵是一种基于格子(Grid)的数据,其表达依赖于像素(Pixel)。而图则不同,它是一种由若干个节点(Node)及连接节点的边(Edge)所构成的,用于表达不同实体间的关系,如图(b)所示。描述这些实体关系的数据,就是图数据。



(a)由像素构成的图像              (b)由节点和边构成的图

作为一种高效描述实体间关系的数据结构,在数据分析中扮演着越来越重要的角色。很多涉及关系的计算问题,都可以转化为一个面向图的计算问题。比如,在社交网络分析、推荐网络分析、疾病传播探究、基因表达网络分析、细胞相似性分析等领域,图都有着广泛应用。

举例来说,分子式就可以视作一张图。分子中所有的粒子都在相互作用,但当一对原子彼此之间保持稳定的距离时,我们说它们共享一个共价键。不同的原子和化学键(Chemical Bond)有不同的距离。分子内的 3D 拓扑结构便可以用图描述,其中节点为原子,边为共价键。分子的 3D 表示和分子的图表示如下图所示。



分子的 3D 表示                     分子的图表示

再例如,社交网络(Social Networks)关系也可以表示为一张图。社交网络是研究人类、机构和组织的集体行为模式的工具。我们可以通过将个体建模为节点,将他们的关系建模为边,来构建一个表示人群的图。

随着移动互联网、物联网及社交网络等技术的发展,众多新兴应用正以前所未有的方式和速度产生并积累着大量图数据(见下图),如何对这些数据进行分析并使用,已成为许多领域面临的机遇与挑战。



02

图神经网络的本质


接下来,我们将在宏观层面探讨图神经网络的本质。图神经网络是机器学习的一种特定方式,是神经网络在图数据应用上的一个自然延伸。我们知道,所谓机器学习,在形式上,可近似等同于通过统计或推理的方法寻找一个有关特定输入和预期输出的功能函数。通常,我们把输入变量(特征)空间记作大写的,而把输出变量空间记为大写的。于是,机器学习在形式上就近似于寻找一个好用的函数:



再具体到图神经网络学习,其本质也脱离不了上述范畴。在本质上,它完成的任务也是构建一个函数映射,针对特定的图数据 X,经过数据预处理、数据转换,然后按照某种学习得到的规则,给出一个输出 Y(如分类信息或回归值)。图神经网络的本质如下图所示。问题在于,如何找到这样的映射关系?于是,各类图神经网络算法应运而生,八仙过海,各显神通。



图神经网络是一种将图数据处理和深度学习网络相互结合的技术。它先借助图来表达“错综复杂”的关系,当节点以某种方式局部聚合其他节点信息后,再做数据的“深加工”,可将其用于分类、回归或聚类等任务中。

图的确有着广泛的应用场景,但相比传统的栅格数据,图的表示更加复杂,对它的处理难度也更高,因此,图神经网络在应用当中也面临着一些困难与挑战。

但我们无须惧怕这些困难与挑战,尤其 AIGC 时代已来,我们更应该敢于拥抱 AI 技术。ChatGPT 作为一种强大的自然语言生成模型,本质上是一种高阶的深度学习模型,ChatGPT 可以与图神经网络的概念和技术相结合,进一步拓展其应用领域。这种结合有助于提升 ChatGPT 在知识图谱、智能问答和对话系统等领域的性能,为用户提供更智能、个性化的交互体验。

欢迎阅读《从深度学习到图神经网络:模型与实践》一书了解更多相关内容。





用户头像

还未添加个人签名 2019-10-21 加入

还未添加个人简介

评论

发布
暂无评论
人工智能的底层逻辑_博文视点Broadview_InfoQ写作社区