InfoQ 对话天润融通 CTO|AI 时代,开发者的机遇与挑战?
几个月前,2023 亚马逊云科技 re:Invent 在拉斯维加斯圆满落幕,AI 成为这场云计算“春晚”最重要的关键词。
那么,在 AI 的技术浪潮下,开发者们将如何把握机遇、迎接挑战?天润融通 CTO 安静波与 SegmentFault 思否创始人 & CTO 祁宁、PingCap 联合创始人 & CTO 黄东旭,北京极客邦科技创始人 & CEO,InfoQ 中国创始人霍太稳一起,就 re:Invent 2023 的前沿洞察展开了一场深度对话。
【以下是对话全文】
霍太稳:如果用一个词来形容今年的技术圈,毫无疑问是大模型 LLM 或者说生成式 AI,大家从各自领域聊一聊对生成式 AI 的看法?
祁宁:我觉得大模型其实引爆了一波开源的工具,或者推动了项目的发展。生成式 AI 本身也是跟开源息息相关,包括 Transformer、Open AI 和一些工具集。现在 AI 领域已经出现了很多开源大模型,让开发者可以了解生成式 AI 最新一些进展,体验最新的技术。
黄东旭:不管是对生成式 AI ,还是对机器学习来说,数据都是这一切的根源,怎么存储好数据,用好数据库软件,我觉得还是一个长期会存在的事情。
但生成式 AI,也对新一代的数据库提出了很多不一样的需求。比如今年向量索引被提到很高的一个位置。同时,生成式 AI 或者 LLM 访问数据的模式变了。
过去大企业要把所有数据都整合在一起,然后在上面提供服务,但现在会发现 LLM 去访问数据可能是从边缘开始去连接,同时访问的都是跟个人相关的、或者和企业相关的数据集。以前我们很多时候拿到了数据,不知道该怎么去产生 Insight,因为它取决于 Data Scientist 或者应用开发者的想法。但现在你只要把数据库暴露给生成式 AI,它就可以帮你做数据的整合和加工,它可能会产生更多新的应用场景和新的 Insight。由这种动机出发,对于数据库,不管是底层的技术还是应用场景,以及这个应用的交互方式,我觉得都产生了巨大的影响。
安静波:过去七八年云计算一直是技术创新最活跃的地方。对于一些企业应用来说,跟随云的脚步做创新是一个很高效的方式。过去我们采用这样的方式完成了最早的一次快速成长,然后到做大做强。
今年 ChatGPT 引爆了大模型相关的技术,我这次去 re:Invent 的一个最重要目的,就是去看一下行业前沿的对于生成式 AI 的认知,做一些技术判断。因为从年初就感觉,大模型的影响是革命性的,它不是一个局部的技术革新,会对整个产业、软件产业、甚至说对人类都会有革命性的影响。我们是做企业服务的,所以我们今年也在不断探索如何将大模型的能力和应用场景结合,而且也找到了一些实践场景。
这次参会也很受启发,不管是企业的招人用人,甚至说产品的重构,越早深刻地认识,就越能占到先机。就像我们在 2014 年坚决上云给天润融通带来的价值是一样。
霍太稳:今年发布会现场有一个让人非常兴奋的发布——Amazon Q。Amazon Q 是否正在重构生成式 AI?这对行业带来了什么样的影响?
祁宁:我觉得亚马逊云科技打了个样。大家都知道生成式 AI 对企业很重要,现在很多企业也在做这一块的,包括企业内部的知识库,或者是想用生成式 AI 做客服机器人,或者去对企业文档做重构。Amazon Q 其实是一个整合,它把这一些技术给整合起来,然后告诉大家一个标准,告诉一个可以交付的 To B 应用应该长什么样子,应该具备什么样的功能。
黄东旭:Amazon Q 未来可能会成为亚马逊云科技这些应用的一个入口,现在只是先把这个入口放出去了。
安静波:我回来的时候仔细看了 Amazon Q 的文档,并真真正正地去使用了,我觉得有几点是很出乎我的意料的。比如说你使用它会发现,它去管理你的知识的时候,已经对接了 47 个 Connector。这对于企业来说很震撼,因为我就很需要这样的东西,而不是需要一个类似于 GPT4 或 5,它商业化还需要安全管理,还需要连接知识库等等。Amazon Q 甚至已经做到这么多的连接器,还可以设定有效期,因为大家知道知识是有有效时间,包括需要安全控制,这都是企业真正商业落地需要的。另外,Amazon Q 作为一个开箱即用的产品还解决了运行环境的问题。如果我们现在自己的团队去搞一个开源大模型,需要消耗了大量的时间进行探索,然后花了大量时间还要做服务保障,这显然并不是最好的一个方式。
霍太稳:亚马逊云科技提倡“负责任的 AI”,那么关于生成式 AI 的安全问题,大家是如何理解的?
安静波:负责任的 AI 肯定是 AI 发展的前提。我们有时候在国内参会跟一些监管部门去沟通。他们提到一个说法,就是你做 AI 的东西,你的投入里有 30% 是跟安全有关的。
亚马逊云科技构建了这个生成 AI 的开发和运行环境,安全是商业 Ready 的必需品。没有安全可控制就不可能有商业应用 Ready。我认为不论是国内还是国外,对这个安全可控制都有极高的要求。
我看到关于监管和落地的一个趋势,从技术的成熟到个人消费者的大量的应用,再到商业的企业应用,然后才会有面向 Public 的公众应用,政策是一定会随之跟进的。技术先发展,然后大规模的消费者应用,然后企业应用,然后公共法规跟上,这是一个过程。
我觉得 AI 安全这个课题不管国内还是国外都有一个很大的市场,未来有两类,一类是垂直领域,会有很大的 AI 的安全公司出现;第二个云厂商也会有很好的安全产品出来。
黄东旭:现在我们讨论的生成式 AI 的安全问题,跟我们过去讨论其他人写的软件安全问题,是完全不一样的两个问题。过去我有源代码,是可解释的。但现在我们构建 AI 应用的方式,严格来说都是个黑盒。我觉得所有的这些安全,都取决于 AI Alignment 技术的创新。
祁宁:我觉得现在安全,可能跟我们之前传统意志安全不一样。我们之前的安全可能是代码层,现在的安全更多是建立在逻辑层面上。未来,去构建 Prompt 的时候,可能就要考虑怎么样建立一个安全的 Prompt 去更好地符合伦理道德。
霍太稳:对于今年现场发布的 Amazon S3 Express One Zone 和 Amazon Graviton4 的价值,大家怎么看?
安静波:Amazon S3 是一个很经典的产品,大家可能都觉得没什么可 Reinvent 了,但是它出来一个更新,你会发现还是有惊喜的。
举个例子,比如说 Intelligent-Tiering,我们会监控每一个客户他的访问频度,如果说他三个月不访问了,我就把他放到 S3 Glacier 里,如果客户什么时候访问,我会再给他挪出来。这个功能我需要花大量的时间去做开发、测试。而这次发布的 Intelligent-Tiering ,就能够自动根据用户访问与否进行相应的处理。这个功能原先要我们自己来做,但我没想到这么古老的 Amazon S3 还在不断地做降本和创新。
另外,基于亚马逊云科技,我们在 2015 年基本上把当时所有的云服务都做了重构,包括使用了 Amazon EC2,Amazon S3、Amazon RDS 等大量的产品。国内很多时候只是卖产品,但是亚马逊云科技是真的在为 Builder 去做服务。因此,基于海外的生态,我们就可能会考虑还是基于亚马逊的产品去快速的去迭代、快速的上线。
黄东旭:我先说为什么 Serverless 如此重要。从成本上,它对开发者的负担是非常低的。过去我们开发个应用,最古老的时候还要去买服务器、找机房,还要托管;后来云计算刚刚开始出来,只需要买虚拟机,然后买服务、写应用,但是仍然需要管理虚拟机的状态,以保证它的高可用。现在这些都不需要操心了,只需要关心业务。从用户体验来说这是一个飞跃。因为好用的东西,一定会打败不好用的东西。
从技术上来说,有 Serverless 了以后,才能更好地去利用云上的资源。我觉得 Serverless 这个产品形态,是能够支持像我们这样的基础软件提供商去打造盈利模式的。
举个简单例子,我们 TiDB Serverless 上线了以后其实可以提供一个免费的 Database 给全世界所有人,这在以前是不可行的。因为其实可能 99% 的免费用户的用量是不太多的,所以我可以用一个更加共享,或者更加弹性的资源策略去应对,我从那些有高要求的用户那边收到钱就行了。
所以我觉得 Amazon S3、Amazon EC2、Amazon DynamoDB 这几个产品虽然都是亚马逊云科技一直以来有的东西,但正是几个产品构建了整个亚马逊云科技云的弹性的基石。所以在这上面任何一点创新都会带来巨大的的影响。
总的来说,Serverless 一定是未来的方向,因为用户体验变得更好了。对于 PingCAP 这样的基础软件厂商来说,不管是 Serverless ,还是这些基础设施的更新,它产生的影响也是更加深远的,不仅是亚马逊云科技,而是整个生态,所有人都会共享这个进步。
霍太稳:亚马逊云科技的 CTO Werner Vogels 在会上发布了俭约架构师的七大黄金法则,想听听大家对此的看法?
黄东旭:我谈一谈这条,把成本视作非功能性的需求。我最近这一年有一个亲身经历的例子。我们在做 TiDB Serverless 的时候其实在内部测试了好几版。可能一开始成本优化了 10%、20% 差不多了,然后我们直接说咱们应该敢想一点,能不能把这个成本下降“1000 倍”。最后我们为了达到这个目标,团队就会被迫放弃掉现有的一些固化的思想,再去做一些更大的技术创新,去做业务的重构。这也是为什么我们在云上开始使用 S3 作为我们新一代数据库引擎的基石。当我们把成本作为一个很重要的事情去思考的时候,它可能会带来一些选择和技术上的 Think out of the box。
第二点我印象特别深刻,无法观测的系统将带来无法估量的成本。我去面试一些 Senior 的研发,包括一些系统的架构师的时候,我很关注架构师对于这些系统的可观测性的重视度。有经验的架构师可能在构建系统的时候,就会把可观测性,跟系统的功能、成本,摆到同样重要的位置。只有当系统是可观测的,才可能有调优的机会,以及如果有什么问题,才有去修复的机会。
可观测性不仅是衡量业务的一个指标,也是衡量内部团队质量的一个手段。比如团队质量不高,构建了一个不健壮的系统,可能用户量小的时候没什么问题,但是用户量一上来,或者有新的需求的时候,就可能要推倒重来。
安静波:我觉得大部分的架构师是从研发一线的架构师,到高级的架构师,再到总架构师。
在国外可能架构师就能负责很多方面了,不仅要负责代码数据,还要负责基础设施、成本、业务。我们常说在国内做 CTO 的关键就是业务跟技术的结合。这里边第二条最重要的是架构和业务之间的关联。而业务里边最重要的一点,是业务的发展和成本之间是呈正相关的。
我们经常讲要降本增效,尤其是云上如何去降低成本。有一个前提是跟业务保持一定的比例,首先要有业务的规划,然后才有云上架构的规划。比如明年我的业务用量要比现在多上 5 倍,那架构的调整和节省成本的方式跟明年的业务如何结合是与今年完全不一样。做技术的人有时候会忘掉业务强相关这一点,忽略了业务对技术的影响。所以我特别想提出来就这一条。
此外,我们信赖一个法则,即所有的事情都必须是可观测的。你看刚才讲成本可观测,然后我的系统的架构运行指标可观测。因为我们做实时通信的系统,单一一个系统每分钟要采集 7 万多个指标,它所有的目的就是我们讲的叫无度量不优化。包括优化成本也是优化,没有度量就绝对不能优化。那么研发团队也是一样的,如果不能度量,其实我们不能大量地发展团队。我们也是从几十人上百人发展到现在有六七百人的这样一个规模,这时候必须有严格的度量方式,虽然这种度量的方式我们不能 100% 依赖它。
祁宁:我们当时还 Battle 了一下他那个演讲的标题要怎么翻译。我认为它应该是翻译成节俭。
其实它的中心思想就是成本意识要贯通在架构设计上来,自始至终就从成本这个角度去考虑。因为我们之前讨论的架构都是一个健壮的架构,或者一个可扩展的架构、灵活的架构,但是它从一个成本的角度来考虑这件事情的时候,最终是要能够实现一个成本可控的架构。
霍太稳:面对当下生成式 AI 的技术浪潮,各位认为技术管理者在招人、用人方面需要做出什么改变?
黄东旭:我最近一年最大的影响可能是跟 Werner 的七条黄金法则最后一条比较相关,就是 Open minded 在这个时代会变得更加重要。可能过去的这个经验在未来的这个几个月就过时了,比如 AI 工程师。所以大家要保持一个开放的心态。
另外,我觉得现在工程师这个职业,考核技术层面上的东西会越来越少。比如说具体到有几个参数这种问题已经没必要了。因为 Copilot 也好,Amazon CodeWhisperer 也好,编程这件事情已经被技术解决了。但是它对于一个系统的宏观设计和感觉,这是 AI 目前做得不够好的。所以我可能会更多的偏向于去考察一些更软性的东西。
祁宁:对程序员来说,之前的某些技术成分可能是属于手艺的成分,比如代码写的很好、执行效率很高。但现在来说是这一部分的意义已经不大了。ChatGPT 现在相当于把大家都拉到了一个相对平等的一个起点。
但从另一个方面来讲,就更需要考察程序员的整合能力,或者说他从架构这方面考虑的能力变得更为重要。这个程序应该往哪个方向去写,哪些功能是必要的,健壮的架构有哪些必要的实现……我觉他有没有这样的意识特别重要。可能我们以后不招 Developer,招 Builder。Builder 可能更能定义我们要招的这样一个角色。
安静波:首先心态很重要。我印象特别深有一段对话,我们所有人都知道答案是生成式 AI,那么问题是什么?我们需要知道问题的人,要有思想的人。我们也是用这个标准去衡量候选人。有技能是一个基础,要衡量他有没有思想,最直接的方式就是看他怎么向 AI 提问,观察他提问的过程。
霍太稳:Werner 提到,“现在是成为构建者最好的时代”,大家怎么看待这个事情?
黄东旭:有想法的人很多,做开源这么长时间,我是有这个亲身体会,就是高手在民间。你永远觉得你自己比较厉害的时候,社区里或者外部总会有人带来 Surprise。我觉得生成式 AI 降低了技术门槛,让这些有想法的人把想法变成现实。
同时,云本身在变成一个新的操作系统。以前我们要做应用,还得学 Linux,还得学 Windows,学各种各样基础设施相关的东西。但现在在云上实现这些东西变得越来越简单。加上 ChatGPT 和 AI 的这些能力,开发者能够快速构建出应用;再加上云的弹性基础设施,其实就已经可以实现 One man company 了。
创新的成本变得很低。对于 Builder 来说,想做东西,这个门槛现在至少是有史以来最低的时候,但我更看好未来,未来会更低。
霍太稳:从开发者角度,亚马逊云科技发布的 Amazon Q、Amazon Bedrock、Amazon CodeWhisperer 等一系列生成式 AI 工具对他们的开发工作有什么影响?
祁宁:生成式 AI 爆火之后,我一直在想编程语言最终会不会消失。因为编程语言创造出来的时候,就是让人懂机器,让机器懂人要干什么。但是如果有了这种大语言模型,其实中间这一层可以被消解掉。人要干什么,他告诉大模型,由大模型去生成机器码,那么程序员的意义在哪里?今天刚刚提到的 Builder 这个词解答了这个问题。他其实是更多地去创造,知道怎么拿这些资源去整合出我们最终想要的一个解决方案,这个可能是他最重要的一个能力。所以说我觉得可能我们后面开发者的思维范式要有所转变,可以更多的去拥抱这样的一些工具。
安静波:我感兴趣的是 Amazon CodeWhisperer 里面提供一个 Professional 的一个版本。在 Professional 版本里,我们把自己的代码上传上去可以再提高 28% 的开发效率。
代码转换方面, Amazon Q 和 Amazon CodeWhisperer 配合可以极大提高效率。Keynote 提到亚马逊云科技一个 5 人小团队两天就可以将 1000 个生产应用程序从 Java 8 升级到 Java 17,而我们自己把 Java 8 的代码升级到 Java 23,升级 1 个大概要一个月左右的时间,所以我们正在和他们一起利用亚马逊云科技的这些工具去解决这个问题。
霍太稳:大家对 2024 年有哪些期待?大家认为明年的 re:Invent 可能会带来哪些惊喜?
祁宁:AI 其实是一个很大商业机会,所以我觉得明年 AI 仍然会是 re:Invent 重要内容。因为今年只是发布了一个初步的模型,明年应该会有一个更具体的动作,包括根据今年行业的需求变化,明年应该会有更多的应用方面的更新。Amazon Q 我觉得明年会有一个更大的迭代。
黄东旭:我的期待比较实际一点,就是活下去。这个是最大的期待了。预测一下,我是觉得包括明年的 re:Invent 一切东西都会变得更简单。因为我是觉得 AI 会更加深层次地改变现在的产品形态,包括 Amazon Q 都只是小试牛刀,接下来我觉得会有更多的、更深层次的应用,但是这个应用的方向一定是会让这些复杂变得更简单。
安静波:最主要的期待是国内的大模型什么时候能商业落地,赋能各行业的应用。对 re:Invent 的期待,比如说我们现在基于 ARM 的替换,实际上我们几乎快完成 100% 的替换了,但这个替换过程很慢,希望未来能有加速的空间,期待亚马逊云科技明年的创新能带给我们这方面的惊喜。
结语
生成式 AI 对于每一个开发者的影响是不容怀疑的。围绕生成式 AI,今年亚马逊云科技在 re:Invent 也发布了一系列与企业业务相关的、与开发者工作相关的创新。
正如 Werner 所说,“现在是成为构建者最好的时代”,在这个过程中,持续的学习是非常重要的。不论是亚马逊云科技还是其他公司,大家都可以去学习最新技术,提升个人技能,并积极利用先进的生成式 AI 工具,提高效率、开放思维,从而为个人、企业及组织带来更多的商业价值。
评论