垃圾分类与 AI 的反碎片之旅
近年来,我国加速推行垃圾分类制度,2021 年 5 月,国家发改委和住建部联合发布《“十四五”城镇生活垃圾分类和处理设施发展规划》,要求到 2025 年底,京津冀及周边、长三角、粤港澳大湾区、长江经济带、黄河流域、生态文明试验区具备条件的县城基本建成生活垃圾分类和处理系统;鼓励其他地区积极提升垃圾分类和处理设施覆盖水平。
自此,垃圾分类成为国策。
你也许会以为,这是一个脏活、累活、苦活,这样的设想也不为过。但是,你可能不知道,这其中也蕴藏着巨大的经济价值。
我国是人口大国,也是垃圾产生大国,2021 年我国生活垃圾产量 27097.2 万吨。
由于统计口径的不同,对于垃圾分类市场的市场价值评估差别较大,但即使按较保守的计算,这也是一个千亿级市场;如果按照我们的调查,仅仅一个宁波市,每年回收废弃物的价值就高达 560 亿人民币。
如果有一种方法,既可以解决垃圾分类中的苦、脏、累,又能提升分拣效率、提升行业效率,让“变废为宝”成为一件相对轻松的工作,是否是一个社会期待的满意选择?
为了这个目标,AI 来了。
1 聚焦宁波
6 月 24 日,世界银行执行董事会批准给中国提供贷款 4.3 亿美元,其中的 1.5 亿美元贷款将用于宁波的垃圾分类。
宁波作为东部沿海城市,已经开始采取了先进的垃圾管理、循环利用和预防措施,在国内属于领先位置。
因此,此次的世行资金,主要用于宁波全品类智能回收箱的落地,该项目结合智慧化管理、区块链记账等技术优势对前段垃圾分类用户进行引导、对垃圾回收流程进行大数据分析和智慧化管理,实现对生活垃圾分类端+回收端的清运回收可控管理、成本优化、数据分析,这也标志着宁波即将步入垃圾分类“数智”管理时代。
机会只留给有准备的人,宁波蔚澜就是这样一家企业。此前,它是一家生产物联网配电柜的企业,公司负责人范世杰非常关注市场动态,在 2018 年底,当他看到央视开始宣传垃圾分类时,立刻产生了一个念头——垃圾分类柜这种东西,本质上和物联网配电柜的差别不大。
范世杰立刻开始市场考察,认为当时市场上生产的垃圾分类柜,以蔚澜的技术完全可以做,于是立刻在 2018 年 11 月投入研发,2019 年 3 月拿出了样机。
但是在实践中,他也发现,垃圾分类柜其实涉及到一个复杂的经济闭环。例如,废玻璃的回收后,每吨只能卖 70-80 元,而废纸板每吨却高达 2000 元以上,但废纸板需要详细分类,因为不同类型的回收价格也不同,所以如果设备能够在前端对垃圾进行更精准的分类,经济效益和整个回收闭环都有很大的优化空间。
所有的垃圾中,最难处理的是厨余垃圾。一般人可能很难想象,散发着异味、容易腐败的厨余垃圾其实有很高的经济价值,但厨余垃圾的处理也是最困难的。很常见的一个问题就是,居民在分类时不够精细,把其它垃圾混杂在厨余垃圾里,这就涉及到两个动作——需要对垃圾进一步分拣,还需要提醒居民注意类似问题。
所以真正的挑战,是增加厨余垃圾分拣这个环节,因为识别难度大增。严格的说,没有自动破袋+厨余垃圾识别的前两代产品,只能叫“自动分类柜”,只有这两个功能完备了,才能叫“智能分类柜”。
让范世杰感到幸运的是,公司新招来了 AI 技术总监杜一品。大家都知道 AI 的人才奇缺,有完整的 AI 开发经验的人更少。
杜一品来到蔚澜之前,也深知这家公司并没有完整的 AI 团队,但是,他有底气,因为掌握了新的工具——百度飞桨企业版 EasyDL。
EasyDL(以及各类的 AutoML/DL)的共同理念,就是“用 AI 技术来帮助人们设计 AI”,换句话说,开发一 AI 模型的流程中,涉及的数据处理、特征提取、模型选择、参数调节、训练部署等环节,都利用 AI 能力才实现了高度的自动化,经过简单的学习即可运用。
杜一品用 EasyDL 轻松完成了厨余垃圾识别模型,但一个问题随之而生,对于厨余垃圾的识别需要比较高的 AI 算力,如果回传到云端计算,就需要公司添置大量的服务器、GPU 卡等资源,这极大的增加了利润本身薄如刀锋的垃圾回收行业的成本。
就在这个时候,飞桨工程师给他支招,不需要购买庞大的 AI 计算设备,只需要一个百度的“EdgeBoard 嵌入式 AI 计算卡”再搭配两个普通的摄像头就可以解决问题。
当杜一品把不到 2000 元的一块 EdgeBoard 计算卡融合进了蔚澜的垃圾分类柜后,他说了一句很感概的话:“我们的设备成本只增加了大约 2-3%,就让我们从自动化时代进入了人工智能时代,不得不说,这样的技术才是产业落地真正需要的技术。”
事实上,百度飞桨的价值正在于此,它根据实际需求预制了大量可以灵活搭配的解决方案,即使是宁波蔚澜这样全公司只有极少数懂 AI 的技术人员的企业,也可以借助飞桨丰富的产品和生态,从软件到硬件、从训练到部署,搞定整个设备的 AI 化,企业只需要极低的成本,就把公司带到了一个新的发展境界。
范世杰因而很有感概的说,升级到第三代之后,宁波市场上,基本就没有我们的对手了,这就是 AI 的力量。
其实,宁波蔚澜只是崛起的垃圾回收产业大军中的一员。
垃圾分类可以使垃圾资源利用收益更大化,给产业和社会创造更多价值,具有大力推行的必要性。从产业链协同角度而言,前端的垃圾分类服务、中端的垃圾分类转运、终端的厨余垃圾处理、渗滤液处置、垃圾焚烧等相关企业均将从中受益。
2 不再只是“先行者”
一家企业,只有 1 个或很少几个懂 AI 的人员在做先导,对于这种现象,百度集团副总裁吴甜称之为“AI 先行者”阶段。
对于 AI 落地,吴甜在分享飞桨通过与产业伙伴的广泛合作中所观察到的落地实践路径时,把这条路描绘为三个阶段,也就是先行者探路阶段、工作坊应用阶段和工业大生产阶段。
吴甜发现,企业中的 AI 先行者,往往既不是一线业务人员,也不是高层管理者,而是公司内的一些资深工程师。他们懂业务、懂场景、有想法,想要突破传统的业务现状,希望借助 AI 的力量走出一条不一样的路。
我们所说的垃圾分类行业,就是这样一个典型场景。
垃圾分类庞大的市场空间,吸引了投资人和创业者纷纷进场,成为当下创投行业的一大热门。企查查数据显示,我国垃圾分类相关的企业注册量呈现快速增加的趋势,2016 年垃圾分类相关企业注册量不足 1000 家,2020 年的注册量为 3775 家。
但是,可以想见的是,传统的垃圾分类企业要在全社会 AI 人才存在较大缺口的背景下,招募到有一定水平的 AI 开发专才,是有明显的困难的。
而对于这种情况,飞桨 EasyDL、BML 等低门槛的企业级 AI 开发工具,就极大的降低了垃圾分类企业的开发难度,出现了“一个人能撑起一家企业的”的情况。
例如,宁波蔚澜的 AI 技术总监就告诉笔者,在与飞桨 EasyDL 合作之前也考察过别的公司,包括阿里、华为及国外的平台,最终发现飞桨 EasyDL 相对更好用,更人性化,他说:“EasyDL 最大的好处,就是不需要高深的算法基础和深度学习知识,也可以去操作它。集成到系统里也很方便。”
3 以生态能力反碎片化
事实上,EasyDL 能提供端到端完整的解决方案,包括用于数据服务的 EasyData 和用于边缘计算的 EdgeBoard 硬件等。
不得不提及的是,EasyDL 可以在数据量较小的情况下仍然取得不错的模型效果,这对于很多处于「投石探路」阶段的企业有很大的现实意义。
例如和中国香港的屈臣氏合作的深圳归谷智能公司,2019 年接到香港环保署的项目,要做一个识别瓶子的项目。虽然看起来简单,但实际中瓶子的形状各异。归谷智能一开始使用的是其他开源代码,但识别率不足六成,但在换为 EasyDL 之后,短时间达到了准确率 90%以上。
令归谷智能的技术人员感到惊讶的是,训练中只用了 100 多个瓶子、800 多张照片,用 EasyDL 训练后的识别率、准确率,就差不多达到实战要求,“这个算法听起来不难,但我们发现目前国际上同类算法能达到类似效果的公司估计也就是 2、3 家,其中有一个超难的进阶试验是,把两个高度类似的瓶子的条码互换,要求能够识别。这个试验里只有用了 EasyDL 的机器识别出来了,别的公司的设备一个都没有识别出来。”
这典型的体现了在小数据量的情况下,EasyDL 的训练效果。
其实,从以上几个故事中,我们不难发现一些共性,那就是虽然场景很碎片化,但实际的实践难度却很高。
在目前 AI 落地的浪潮中,有一个存在争议的领域就是,对于过于碎片化的场景,到底如何「反碎片化」,是用更多的专业人员+成本更高的定制化方案,抑或用学习曲线更低、企业业务人员自己稍加训练就可以上场的 EasyDL。
从这些故事中我们得出的结论是,让企业的开发人员自己具有 AI 能力无疑是最好的反碎片策略,但这必须建立在所依托的深度学习平台的高度产业化上,在这个过程中,除了 EasyDL、BML 外,笔者还见到了犹如电商页面一样的 EdgeBoard 的选购页面,百度飞桨就是通过不放过每一个痛点,把经过上万个场景的千锤百炼的模型,与实践过程中可以遇到的数据问题、软硬件整合问题,都提供了端到端的一站式解决,才具备了完整的反碎片能力。
垃圾分类只是我们整个社会「数智化」的一个缩影,当这么传统的领域也开始让 AI 开始施展魔力之时,我们距离 AI 融入工业大生产的目标,似乎又近了一些。
百度 AI 开发者社区https://ai.baidu.com/forum ,为全国各地开发者提供一个交流、分享、答疑解惑的平台,让开发者在研发路上不再“孤军奋战”,通过不断地交流与探讨找出更好的技术解决方案。如果你想尝试各种人工智能技术、开拓应用场景,赶快加入百度 AI 社区,你对 AI 的所有畅想,在这里都可以实现!
扫描下方二维码,添加小助手微信「京东卡、小度定制周边、神秘礼盒、行李箱」等更多福利你来拿~
版权声明: 本文为 InfoQ 作者【百度大脑】的原创文章。
原文链接:【http://xie.infoq.cn/article/9e343257badc31ef0cd9eff78】。文章转载请联系作者。
评论