re:Invent 重磅回顾 | AWS 重塑机器学习的四大亮点,触及每一位 AI 工作者
作为全球云计算的年度指标性大会,亚马逊 re:Invent 2020 大会已进行了二周。其中热点话题——人工智能(AI)和机器学习(ML)也是新意多多,亮点频频。AWS 人工智能副总裁 Swami Sivasubramanian 博士亲自担纲了 2 小时的主题演讲,全景阐述了 Amazon Web Services (AWS) 在机器学习领域的各项 re:Invent – 重塑。
不仅如此,AWS 首席执行官 Andy Jassy 就已在其 AWS 整体阐述中,用了相当长的时间,就机器学习及其在多种行业应用的“重塑” 加以重点介绍。下面,我们就和大家一起快速浏览一下这里面的重点和新意。
强大的计算基础
与以往一样,产品技术的新发布、新功能新特性的面市等,依然“如期到来”。“提供坚强的基础”,这既是演讲开篇的第一章,也是后续一切的“基础”。在此,AWS 提供种类丰富的计算实例,既有支持一般训练加推理运用的通用型实例,也有针对高性能要求的训练实例如 P4d 或推理实例如 Inf1, G4dn 等。在此,以下几个新发布值得关注。
一个是基于 Habana Gaudi AI 处理器的 Amazon EC2 实例,专门用来进行高强度机器学习训练。测试表明,它比目前基于 GPU 的 Amazon EC2 机器学习训练实例的综合性价比还要高出 40%!
第二是 AWS 自研的机器学习训练芯片 AWS Trainium,并将用于 Amazon EC2 实例中,或对 Amazon SageMaker 机器学习开发平台进行底层支持。
第三,更快速的分布式训练,并作为 Amazon SageMaker 能力中的一部分进行提供。相对此前的模式,分布式训练使其速度大幅提高,例如在视觉识别领域的 Mask-RCNN 训练中,TensorFlow 的训练时间由 28 分钟降低为 6 分 13 秒,PyTorch 的训练时间由 27 分钟降低为 6 分 45 秒,这些将对诸如自动驾驶领域的 AI 应用产生重大作用。
如果你想要了解更多重磅的新发布资讯,点击下方视频,AWS Developer Advocate 谢洪恩 (Pahud Hsieh) 将带你回顾机器学习和基础架构等主题演讲的精彩内容,详细解读 re:Invent 的重磅新发布!
为开发者和数据科学人员赋能
“将机器学习交付到每一个开发者手中”,这一直是 AWS 在机器学习领域的愿景。降低他们在机器学习开发中的各项操作复杂度,并透过一体化机器学习开发平台 Amazon SageMaker 加以实施。
对此,在“创建最短成功路径”这一章节中 Swami 博士进行了具体阐述,并发布了一系列新品。例如用于数据准备的 Amazon SageMaker Data Wrangler、用于留存各种模型特征的 Amazon SageMaker Feature Store、用于工作流自动化的 Amazon SageMaker Pipelines、…… 等等,不一而足。这些都可视为开发者通过 Amazon SageMaker 平台更便捷开发机器学习时可以用到的“十八般兵器”。
其中最值得一提的是 Amazon SageMaker Clarify 的发布,专门用来处理“数据偏见(Bias,学术翻译为偏差)”。通俗理解的话,是指人们在工作中,由于各种原因不经意把并非完整客观的数据进行收集并处理,而使得结果产出发生“偏见”。
例如:在视频节目推荐中,仅对“戏剧类”节目的数据进行分析处理后,就认为是“娱乐”类的总体并加以推荐。“数据偏见”是人工智能社会化应用的一个重要课题,是确保技术客观公平应用的基础之一。现在,AWS 将偏见检测贯穿整个 ML 工作流程,这使得相关应用的开发不仅节省时间,并且提升了模型的整体质量,在模型老化过程中产生的漂移等,都可以被标注出来了。
机器学习的“扩张”
机器学习很高深,但尚处早期,受众有限。寻找更广泛的“圈外”开发者加入进来,使他们基于既有知识体系就“轻松上手”,这是机器学习长远发展之所在。AWS 显然洞悉到了这点。因此在第三章节“将机器学习向更多构建者扩展”中,Swami 博士带领团队一口气发布了 Amazon Aurora ML、Amazon Athena ML、Amazon Redshift ML、Amazon Neptune ML、Amazon QuickSight Q等一众产品服务,它们分别代表了关系型数据库、Amazon Simple Storage Service (Amazon S3) 的 SQL 查询、数据仓库、图数据库、商业智能等与机器学习集合一处的“re:Invent”。
最关键的,是开发者只需使用早已烂熟的 SQL 语句,就能进行连带机器学习功能的操作。之所以能如此,是因为 AWS 在后台进行了“系统集成”。以 Amazon Aurora ML 为例,当用户通过 SQL 查询客户信息以试图找到一些负面反馈时,Amazon Aurora ML 会自动调度 Amazon Comprehend 这样的 AI 服务来返回具备 AI 支持的查询结果。这极大降低了机器学习更广泛应用的门槛,使得学术一般的技术真的开始走入“大众视野”。
解决真正的业务问题
一个有趣的现象是,AWS 首席执行官 Andy Jassy 和 Swami 博士都先后在其演讲的后半段专门设置了“行业应用“或“解决业务问题”这样的章节。Andy 在演讲中引用了 Clay Christensen * 的一段话:“客户寻找产品和服务的目的是为了完成他的工作。…我找你不是为了机器学习,而是为了一项特定工作。如果你用机器学习的方式把工作完成了,很好,或其他方式其实也行。但我最终找你是要把工作完成。”
有鉴于此,AWS 此次发布将机器学习向行业应用领域也进行了大幅度扩展。例如应用于客服中心领域的 Amazon Connect,全面集成了各项 AI/ML 服务,并增加了 Amazon Connect Wisdom、Amazon Connect Customer Profiles、Real-Time Contact Lens for Amazon Connect、…等新功能服务,使得座席人员可以通过机器学习对知识库的加持、智能搜寻客户各项问题的解答、机器读取客户电话并分析语义等,实现与来话客户互动中的即时应答,秒级响应,进而提高客服满意度。
又比如在工业制造领域,AWS 发布了 Amazon Monitron 系列套件方案,通过传感器(检测震动和温度)、网关、AWS 云、移动应用等形成一个整体,为基于 AI 的设备维护提供端到端方案。这对诸如发电机、大型机床、重型装备等场合都有很实用的价值。此外还有 Amazon Lookout for Equipment、Amazon Lookout for Vision 等其他相关服务的配套发布。在工业智能检测方面,Amazon Panorama Appliance 的发布,为计算机视觉、IoT、机器学习等的集成应用,树立了一个新的“标杆”。此外还有……,篇幅所限,就不再过多展开了。
re:Invent 的确是一场“盛宴”,它系统展现了这一年来亚马逊在云计算领域的各项进展。今年尤其新意的是在上述各项应用领域里的“挺进”,从中我们仿佛看到了“工业 4.0”如何具体实施的身影,一个结合了人工智能、人机协同、流程优化、可持续迭代改进的工业制造身影,一个和现有普遍认知已经很大不同的身影!
* Clay Christensen,《破坏性创新》一书的作者,《福布斯》称之为“过去 50 年来最有影响力的商业理论之一”。2017 年在全球 Thinker 50 的排名中位列第三。
评论