写点什么

清华大学朱文武教授团队最新著作《图表征学习:迈向动态开放环境》重磅上市!

  • 2023-08-03
    北京
  • 本文字数:1530 字

    阅读完需:约 5 分钟

图数据是对事物间联系的一般抽象,广泛存在于我们的日常生活中,例如社交网络、交通网络、推荐系统和互联网等。

作为图数据分析与挖掘的一种新范式,图表征学习(Graph Representation Learning)是近年来机器学习与数据挖掘领域的热门研究方向。

概括来说,图表征学习是指学习图中的元素,例如节点、边、子图或整个图的向量表征,并应用基于向量的机器学习算法进行图数据的建模与分析。

图表征学习有许多优点,包括从人工特征到自动表征、机器学习模型的适用性、大规模图的可扩展性等,使其在学术界和工业界都受到了广泛关注,并自 2014 年开始取得了长足的进展。

例如,根据谷歌学术 2022 年的统计结果,图表征学习的一种代表性方法——图卷积神经网络(Graph Convolutional Network,GCN),在人工智能顶级国际会议 ICLR(International Conference on LearningRepresentations)过去五年发表的论文中引用量排名第一,已被引用超过 2 万次;在 2019 年,阿里巴巴达摩院将“超大规模图神经网络系统将赋予机器常识”列为“2019 十大科技趋势”之一。图灵奖得主约书亚·本吉奥(YoshuaBengio)曾指出:“将神经网络扩展到图结构输入是机器学习当前的主要挑战之一”。

此外,在工业界,国内外许多互联网大厂均开发了自己的图表征学习系统,包括但不限于百度的 PGL(Paddle Graph Learning)、阿里巴巴的欧拉(Euler)与 Graph-Learn、腾讯的柏拉图(Plato)、亚马逊的 DGL(Deep Graph Library)、谷歌的 TensorFlow-GNN、DeepMind 的 GraphNets、Meta 的 PBG(Pytorch BigGraph)等。这些情况表明,图表征学习无论在科研还是应用方面,都具有巨大的潜力与价值,并受到了更广泛的关注。

进一步地,许多图数据都处于动态开放环境(Dynamic and Open Environments)之中。其中,动态环境是指图数据,包括结构、特征、性质、任务等,随时间发生变化。开放环境则泛指数据分布、学习目标、特征或标签等因素在机器学习过程或应用场景中发生变化。

例如,

  • 在社交网络中,用户间会随时间形成新的关系并删除旧的关系,也可能有新的用户加入,旧的用户退出,且社交网络的演化规律也在不断变化;

  • 在交通网络中,不同时刻的道路情况、车流量、外界环境与所发生的事件也在不断变化;

  • 在生物网络中,新的疾病(例如新冠病毒)可能具有与以往疾病不同的特性与机理,因此开发新的药物需要考虑多种复杂因素。

如何处理动态开放环境下的图数据对图表征学习提出了更大的挑战,也因此吸引了许多研究者的关注。

考虑到图表征学习的快速发展和广泛应用,《图表征学习:迈向动态开放环境》一书希望尽量全面地介绍图表征学习。


本书作者所在的研究团队——清华大学多媒体与网络实验室,从 2014 年左右开始关注图表征学习,并见证了这个领域从新兴,甚至可以说一开始相对小众,发展到目前受到各行各业的广泛关注,并成为一个机器学习和深度学习重要分支的全过程。本书作者基于在该方向的研究积累,并查阅了大量相关资料,费时约两年,写成了这本书。

本书将全面介绍图表征学习,特别是针对处于真实世界动态、开放环境之中图数据的图表征学习方法。本书分为 3 篇:

  • 第 1 篇介绍图嵌入和图神经网络等经典图表征学习方法;

  • 第 2 篇围绕鲁棒性、动态性、可解释性、分布外泛化性等多个角度,系统地介绍针对动态开放环境中的图表征学习方法;

  • 第 3 篇以四个不同领域为例,从推荐系统、交通预测、自然语言处理、组合优化等场景,介绍图表征学习的应用方法。

除了对代表性方法进行详细介绍,本书还提供了丰富的参考文献,读者可以更深入地学习图表征学习的前沿内容。

本书适合具有一定机器学习基础的高年级本科生、研究生、教师和研究者,以及对图数据感兴趣的计算机工程师和从业人员阅读,也适合对人工智能、深度学习和图数据分析感兴趣的其他人士参考。


限时满 100 减 50



用户头像

还未添加个人签名 2019-10-21 加入

还未添加个人简介

评论

发布
暂无评论
清华大学朱文武教授团队最新著作《图表征学习:迈向动态开放环境》重磅上市!_博文视点Broadview_InfoQ写作社区