人类视觉计算理论经典著作,豆瓣评分 9.7,中文版惊鸿面世!
天给大家介绍一本豆瓣评分高达 9.7 分、成书于 40 多年前的神书:
Vision:A Computational Investigation into the Human Representation and Processing of Visual Information!
这是一本影响一代脑、认知、计算机视觉专家的经典著作!
在计算机视觉领域,本书至少做出了两个重大贡献:
1. 提出了视觉研究需要相对独立地考虑包括计算理论、算法和神经实现在内的三个“理解层次”。
2. 提出了视觉计算理论。
两者都对包括计算神经科学和人工智能在内的多个领域产生了深远的影响。其中,“理解层次”这个概念的影响或许更大、也更根本。
在近年深度学习的热潮之中,了解掌握本书介绍的视觉计算理论对于在人工智能和计算机视觉领域内开展进一步探索是至关重要的。
如今,这本伴随着众多技术专家“长大”的经典著作有中文版啦!!!
中文版上市后,也在迅速在京东得到大家 100%的好评!
有读者评论说这是“名著中的名著”“领域内的人必读”!
跨学科的传奇作者
David Courtnay Marr 是一位跨学科的传奇人物!
他是计算神经科学领域的创始人之一,曾任麻省理工学院心理学教授。
他在 1970 年代将神经科学、心理学的成果与数学方法相结合,提出了视觉计算的理论框架,并厘清了计算理论、算法、实现三个研究层次,对计算机视觉在 1980~1990 年代的蓬勃发展提供了指导思想。
这本书为什么影响深远
01. 计算机视觉在过去十年的巨大进展,与书中提出的“理解层次”有本质的关联。
在计算机视觉领域,非常重要却又常常被忽视的就是计算理论的进展:计算机视觉究竟要计算什么?
客观地说,在过去十年中,计算机视觉领域内取得最大进展的是语义上的判别任务。这其中又以语义上的图像识别和分类为代表:图中有一条狗还是一只猫?
计算图像分类这样的任务,在今天看来似乎是天经地义的。
其实不然,探索计算的目的是一个漫长的过程。
Marr 关注的低层视觉和三维结构的重建在很长一段时间内主导了计算机视觉的研究,而低层视觉和三维重建确实是人类视觉中不可或缺的部分。
除了计算理论的进展,计算机视觉领域过去十年的爆发式进展还应当归功于(以卷积神经网络和反向传播算法为代表的)算法、(以 GPU 为代表的)硬件实现和(以 ImageNet 为代表的)数据这几个层次的进展。其中,计算理论、算法和实现三者与 Marr 的三个理解层次完全符合。
02. 书中提出的计算理论指导着对 AI 和 CV 领域的深入理解。
书中提出的计算理论似乎与当今部分深度学习领袖所强调的“完全从数据中学习”的概念格格不入。
但这里想指出两点。
其一,现有的深度学习架构有其内在的归纳偏置,如卷积神经网络的空间局部性、循环神经网络的时间局部性、Transformer 的自相似性,等等。而本书中讨论的许多基本元素,恰与这些归纳偏置有内在的关联。
其二,如果我们还试图在人工智能和人类智能之间建立联系(这本身也逐渐成为一个有争议的话题),那么任何的偏置是应该被预先设计,还是应该通过学习得到,就与人类认知科学中的先天与后天的概念,以及神经科学的内在机理,产生了千丝万缕的联系。
而这种联系也正是本书作为计算神经科学的教科书,可以长期对人工智能有深刻启发和深远影响的原因所在。
李飞飞同事翻译
本书译者是来自斯坦福大学计算机科学系的助理教授吴佳俊。
其研究方向是计算机视觉、机器学习和计算认知科学。加入斯坦福大学之前,曾是谷歌研究院的访问研究员,并分别在清华大学和麻省理工学院获得了学士和博士学位。
他的研究曾获 ACM 博士学位论文荣誉提名奖、AAAI/ACM SIGAI 博士学位论文奖、麻省理工学院 George M. Sprowls 人工智能与决策博士学位论文奖,以及 2020 年三星人工智能年度研究人员奖。
看看专家怎么说
适读人群
心理学、神经科学、计算机科学、人工智能、计算机视觉等相关专业的研究人员、研究生及高年级本科生等学习使用或作为研究参考。
广告
视觉:对人类如何表示和处理视觉信息的计算研究
作者:(美)David Marr(大卫?马尔)
当当
购买
评论