打卡智能中国(七):AI 的小城故事
“您认为 AI 公司在昆明,跟北上广相比有什么优势?”
“我觉得昆明就是中国的硅谷,气候特别好。”
这段对话,是在一次人工智能主题座谈会上真实发生的。
经常参加这类交流活动的朋友可能会懂,这类问题一般在“递话”,给受访人一个“安利”自家的产品、技术、差异化价值的由头。所以当现场有人抛出这个问题时,我也做好了听到一堆 PR 公关辞令的准备。
没想到,这位昆明某 AI 服务商、数据科技公司的技术负责人,给出的答案是大家都没有设想过的。但这种“意料之外”,展现出在“北上广”这类大城市少见到的“地气”。
活动结束后,我和这位技术负责人单独聊了聊,又发现了一种“意料之外”。
他们公司也在做大模型,用的是开源 Llama 架构+国产算力,经由私有数据微调,为云南游客提供线上问答服务。
你可能会问,AI 模型都不是自己从底层代码写上来的,有什么差异化竞争力?实际上并不是大家想的那么简单,只要调用 API 再用数据跑一遍就行了,他们在模型之外做的工作非常多且扎实。
比如,他们服务的一些云南本地企业,可能连数据标注、数据治理、数据工具链等基础概念都不知道,高质量数据集、文档也没有,想要训练专有 AI 模型,就得从自己组建“标注组”开始。因为客户都很在意数据隐私,所以一个组的项目做完就要解散,标注人才就流失了,下次再重新建组。今天的 AI 落地,依然高度依赖“有多少人工就有多少智能”。
当我们走到三、四线城市,发现这里的 AI 公司和开发者,对 AI 的认知和做法,都有很大的不同。
用这些“意料之外”,我们可以大概拼出一张拼图,上面写着:在小城市做 AI,究竟是一种什么体验。
小城做 AI,如同养“中华田园猫”
雄踞全球科技资本和人才的硅谷,是 OpenAI、DeepMind 等顶级 AI 机构生长的土壤。那么,中国三、四线小城市的一方水土,会孕育出怎样的 AI 呢?
在云南,我见到了两个 AI 服务商,以及不少开发了行业 AI 应用的实体企业,他们的 AI 模型有一个共同点:都使用通用大模型作为基座。比如基于开源 Llama 2 架构,加上自有数据、客户数据进行精调,底层代码都不是自己从头写上来的。
站在巨人的肩膀上,是目前在小城市做 AI 的最优解。
当地的 AI 开发者告诉我,首先,他们测试了市面上主流的开源大模型和闭源大模型,最终选择了 Llama,原因是模型在业务场景下的表现好,而且生态够丰富,社区资源多,配套工具成熟,这给他们的后续训练和开发减少了很多难度。
此外,身在三、四线城市的 AI 公司,往往并没有足够的预算、算力、工程人才去从头训练一个新的大模型,加入开源社区或闭源生态是最现实的选择。一位技术负责人说,他们没法像大厂那样囤上几千几万张英伟达算力卡,加上 N 卡价格疯涨,所以用的是国产算力,虽然需要解决跟 CUDA 的兼容性问题,但能满足他们的需求,是目前比较有性价比的选择。
另外,他们在本地垂类赛道,数据和工程是核心竞争力。这些三、四线城市的 AI 公司,没有股价压力,也不需要给投资人 PR,专注于某一个非常小的垂类场景,一般也是大厂看不上、不会去碰的小市场,依靠私有数据积累和工程化交付的能力,就能建立起商业模式。
因为很多落地场景,只有在当地深入了解行业才能发现。
比如一个 AI 公司,基于开源大模型+自有旅游数据开发的民宿大模型,已经在云南大理的民宿落地了。而将大模型的对话能力,打造成“24 小时 AI 管家”,这个灵感来自民宿会遇到社恐的游客,或者不希望暴露隐私,不想因为 WiFi 密码等小事麻烦服务人员,管家的介入很难做到恰到好处,让游客住的不够舒适自在。而大模型出来之后,就在旅客和管家之间,多了一个 AI 交互的缓冲地带,一些小问题通过 AI 管家就能解决,需要人工服务时随叫随到,这样就很好地解决了旅客的顾虑。
目前,该公司的 AI 大模型服务,主打的就是可落地、支持私有化,目前覆盖了文旅、工业、政务等场景,业务营收有 70%以上来自大型企业的数智化。
实话说,很多一线城市的 AI 创业公司、高校科研院所打造的大模型,都未必能产生这样的落地能力和经济价值。
总的来说,我的感受是,三、四线城市的技术从业者,上来就是从场景里找机会,找跟 AI 的结合点,反而更容易出效果。
一位开发者朋友是这样说的,“搞 AI 就像养猫,科学家们和企业会养聪明的品种猫,这跟我没什么关系,我喜欢养小猫串串,把 AI 领域跟人文艺术领域结合起来,这个品种你没见过吧”。
将通用大模型的“品种猫”跟本地场景、本土需求相结合,进行“杂交”,养出一只只“混血小猫”,这些垂类 AI 应用,就像中华田园猫,可能是大厂和科技媒体人不太关注的,却沐浴着云南得天独厚的阳光,真实而有生命力地成长着。
在小城市做 AI 的可能性
在交流活动中,有好几个媒体人都询问,在云南做 AI 有哪些阻碍和挑战。真正的问题,似乎在意料之外,又在情理之中。
所谓意料之外,是很多问题已经在被积极解决了。
比如基础设施,在大家的印象中,三、四线城市的数字基础设施发展比较晚,发展 AI 的资源禀赋比较薄弱。实际上,基础设施在当地越来越不成为问题。
拿算力来说,云南的算力资源已经可以满足当地 AI 的开发需求。当地工作人员告诉我们,由于电价便宜,气候条件好,所以云南很适合发展 AI 人工智能数据中心,前文提到的民宿大模型,就是在昆明人工智能计算中心上进行训练的,采用的国产算力。当地交通领域的数据中心工作人员也提到,该行业数据中心已经完成了 60%的国产替代率。
至于数据,参加交流活动的两家 AI 服务商,此前都是数据服务提供商。其中一个成立于 2018 年,在 2020 年的时候就形成了第一版数据解决方案,和一、二线的大厂签订了合作关系,积累了大量的数据资源和工程经验。而算法,如前所说,依托全球领先的开源模型和社区,当地 AI 公司也可以快速上手开发。
那么,当地 AI 发展的真正约束条件是什么呢?
一是远离产业带。行业 AI 解决方案包含了多个环节和生产链条,很多小城市还没有建立起产业集聚优势,导致生产环节中存在断点。一位昆明当地的 AI 服务商提到,客户的私有化部署,往往需要单独成立标注组,项目完成就解散了,人才就要流失。而他们跟省外的标注公司合作,有的要收取加盟费,有的对团队规模有要求,必须达到 100 人以上,这就给他们的项目增加了不少成本。
二是缺人。既然到外省找人很麻烦,那么找本地人才呢?答案就是当地没有那么多 AI 人才。那一场交流活动中,也有云南当地的 AI 产业学院老师参加,对方提到,该学院今年招收了 200 名人工智能专业的本科生。现场一家 AI 公司表示:“200 个?根本不够用啊。”
除了人数少,由于人工智能是一个新兴专业,当地也还在探索培养方案,有老师提到,目前 AI 教学还存在跟应用领域不够贴近的问题,企业提供的 AI 实训平台不符合教学、科研的需求,学校只能自己开发。
如何解决上述困境?我也在当地看到了一种跟开源文化有点类似的产业集群创新模式,那就是“抱团取暖”。
一家本地的数据服务公司,将自己打造的数据标注、数据治理、数据探源等工具链,开源出来,丰富区域内的数据资源。此外,依托昆明人工智能计算中心,当地也在陆续开展师资培训、工程师培训等人才培养项目,打通“学练训赛业”,推动产学研用的融合。
远离了“北上广”和“龙头企业”的三、四线城市,由于 AI 产业链的零星聚集,反而跟彼此产生了格外强的引力,特别积极地希望贡献出自己的一份力量。
产业 AI 的“面子”和“里子”
说到这里,你可能会问,那三、四线城市的 AI 落地情况究竟怎么样?跟当地产业相结合的广度和深度如何呢?
我可以分享两个真实的见闻故事:
一个是“面子”。在中国-老挝的边境城市,当地工作人员带我们参观了位于火车站附近的“智慧展示中心”。我们发现,这个展示中心的作用,确实是“展示”,我们到大屏幕前观看完两部宣传片,就没能再深入了。
另一个是“里子”。当我们走到日常运行的货车检查站,一个工作人员对着镜头侃侃而谈,告诉我们 5G+AI 的应用如何落地,让货车一站式通关,避免了层层卡验,将每辆车的平均通关时间从 8 分钟缩短到 4 分钟。从技术规划到落地效果,讲的非常清晰,带着一种很了解一线实际情况才有的挥洒自如。
对此,不同的人可能会有不同的解读角度。
AI 应该乐观吗?好像是的,它已经抵达了最遥远的边境线,在 n 线城市落地。AI 应该悲观吗?也有点道理,有效的 AI 应用似乎就那么多,作为“典型案例”存在,而如果没有 AI 场景的遍地开花,那么建好的 AI 基础设施发挥的作用,确实就是摆在那里,作为“展示”。
今天,三、四线城市的 AI 探索,处于一个智能化需求特别多、特别分散的阶段,只能一个场景一个场景地渗透。而这也是本地 AI 企业和开发者的机会,也有越来越多的人看到了这些地方存在的无数个被 AI 改变的可能性。
在当地走访时,本地 AI 企业提到一句话:通过一个场景,探索出一些模式,应用到整个行业,一个个场景的智能化,拼起来就是整个行业的智能化。
他们确实也是这样做的。
这些微小而分散的需求,是 AI 大厂和巨头不愿意触碰,做了也投入回报比很低的场景,被当地企业一个接一个地解决着。
比如云南开发出的越南语、老挝语、缅甸语、柬埔寨语、泰语等南亚东南亚语言的扫描笔、AI 翻译机;帮助企业无需写字段调用 API,就能根据不同的使用场景,比如经营分析会、领导参观汇报、财务数据上报等,实时生成任意需求 BI 的垂类大模型;为麻醉科提供高效智能排班服务的大模型等。
大模型狂奔这一年,已经从价值炒作阶段进入到价值沉淀阶段,有大模型厂商提出了“不作诗、只做事”的理念。那么,谁来做事呢?
这些在小城市做 AI 的人,用一个个场景的拼图,拼出了大模型“有用”的答案。而 AI 的小城故事,还会在这片土地一直讲下去。
版权声明: 本文为 InfoQ 作者【脑极体】的原创文章。
原文链接:【http://xie.infoq.cn/article/d44c432fc976242455ea4aa5d】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论