边缘 AI 研发落地生态挑战调研报告
作者 | ECIL
摘要:随着边缘设备的广泛使用和性能提升,将机器学习相关的部分任务迁移到边缘,也即边缘 AI 技术,已成为必然趋势。但仅凭技术是不足够完成落地和产业转化的。近日我们启动了边缘 AI 研发落地生态挑战调研。我们发现,当前学界业界在落地过程已经遇到各式各样的困难,重点生态挑战包括数据集和配套算法难以获取、通用方案无法满足特定业务需求、缺乏商业成功案例等。
随着边缘设备的广泛使用和性能提升,将机器学习相关的部分任务迁移到边缘,也即边缘 AI 技术,已成为必然趋势,甚至能够同时结合云侧算力和边侧数据来完成机器学习任务。机器学习服务将边缘产生的数据转换为知识的过程中,需要在边缘快速响应并处理本地产生的数据。在落地过程中,我们发现,在连接海量边缘节点的边缘云时代,随着 AI 服务与边缘用户的距离缩短,通用 AI 原本部分挑战在边缘场景下变得更加尖锐。
基于一些落地经验,华为云边缘云创新实验室(ECIL,Edge Cloud Innovation Lab,Huawei Cloud)系列文章中曾介绍过数据异构等四大技术挑战。针对这些挑战,各个技术方案落地与成果转化到产业的进程正在紧锣密鼓地进行。但仅凭技术是不足够完成落地和产业转化的。当前学界业界很多团队已经遇到各式各样的困难,比如数据集难以获取、通用方案无法满足特定业务、缺乏商业成功案例等。
因此除了技术挑战外,华为云边缘云创新实验室一直密切关注边缘 AI 的生态挑战*。为了让更多边缘 AI 领域的朋友多快好省地完成技术研发落地和商业闭环,华为云边缘云创新实验室启动了边缘 AI 研发落地生态挑战调研。本次调研通过问卷发放的方式,希望进一步了解边缘 AI 方案落地与产业落地过程中遇到的生态挑战。截至 2021 年 11 月 29 日,已回收有效答卷 175 份,问卷开放选项采集到 49 条补充意见和 8 条补充建议。对答卷中共计 20 项量表题项进行分析,信度 Cronbach.𝛼**为 0.975。
*比如研发资源难获取、工具链不完备等主要依赖社区分工与共享的非技术挑战,在本文中定义为生态挑战
**信度指同一问卷对同一组对象重复测量时所得结果的一致性程度,用于测量样本回答结果是否可靠。如果在 0.8 以上,则该测验或量表的信度非常好;如果低于 0.6,量表就需要重新设计题项。
根据调研结果,对边缘 AI 各角色而言,当前阻碍研发落地,首当其冲生态挑战分别是
算法开发者:“真实业务数据集及其基线算法、预训练模型难以获取”
服务开发者:“通用方案整体性能不一定满足特定业务需求”
技术布道者:“缺乏商业成功案例”
具体调研报告结果请见下文。
1. 调研对象
调研对象职业主要是工业界从业者(53.45%),其次是在校学生(31.03%)和学术界研究者(25.86%)。
调研对象的技术方向主要是边缘 AI 及其应用(55.75%)、AI 及其应用(49.43%)、边缘计算及其应用(42.53%)。也有约四分之一的方向为云计算及其应用(25.86%),以及少量的其它方向(13.22%)。
2. 边缘 AI 算法开发者
本问卷中,边缘 AI 算法开发者是指研发联邦学习、协同推理乃至深度学习调度等边缘 AI 典型算法的角色。有 80.46%调研对象填写了边缘 AI 算法开发者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。
本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。
1.1. 平均分
若选择“不了解跳过”或“可维持现状”记为 0 分,“建议改进”记为 5 分,“亟需改进”记为 10 分,答卷中对边缘 AI 算法开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的 1.43 分,问卷中所罗列的各挑战都超过了 5 分,可以认为各挑战都有改进的需求。
其中,平均分值最高(6.87 分)的挑战是:
“真实业务数据集及其基线算法、预训练模型难以获取”
在截尾均值* 6.09 分以上的其它头部挑战还包括:
“算法研发迭代中,重复部署整套端边云系统过于沉重”
“缺乏 AI 工具,包括资源监控、节点仿真、标注工具等”
“算法找不到对应业务场景,或很难得知实际业务落地性能”
*截尾均值指是指在一个数列中,去掉两端的极端值后所计算的算术平均数。在本问卷中用于屏蔽最后一个开放选项的影响,下同。
从“边缘 AI 及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为 2:1:1),细化算法开发者各项挑战平均分:
“边缘 AI 及其应用”方向下各职业平均分值最高的算法开发挑战分别是:
工业界:“缺乏 AI 工具,包括资源监控、节点仿真、标注工具等” (平均分 7.5)
学术界:“缺乏真实业务及其研究需求的固定来源” (平均分 7.14)
在校学生:“真实业务数据集及其基线算法、预训练模型难以获取”(平均分 7.68)
在截距均值以上的其它头部挑战还包括:
工业界(截距均值 6.19):
“真实业务数据集及其基线算法、预训练模型难以获取”(平均分 7.1)
“算法研发迭代中,重复部署整套端边云系统过于沉重”(平均分 7)
“边缘 AI 系统部署等起步过程中缺乏指南文档”(平均分 6.35)
学术界(截距均值 6.30):
“真实业务数据集及其基线算法、预训练模型难以获取”(平均分 6.96)
“缺乏 AI 工具,包括资源监控、节点仿真、标注工具等”(平均分 6.72)
在校学生(截距均值 6.77):
“缺乏真实业务及其研究需求的固定来源”(平均分 7.41)
“算法找不到对应业务场景,或很难得知实际业务落地性能”(平均分 7.59)
2.2. 亟需改进
对于边缘 AI 算法开发者,问卷中提及的挑战被选为“亟需改进”的比例通常三分之一左右,高于“还有其他重要挑战”的 6.36%,可以认为各个挑战都有相当的迫切需求。
其中被选为“亟需改进”的挑战中比例最高(42.77%)的是:
“真实业务数据集及其基线算法、预训练模型难以获取”
在截尾均值(33.33%)以上的其它头部挑战还包括:
“算法研发迭代中,重复部署整套端边云系统过于沉重”
“缺乏 AI 工具,包括资源监控、节点仿真、标注工具等”
“算法找不到对应业务场景,或很难得知实际业务落地性能”
“边缘 AI 系统部署等起步过程中缺乏指南文档”
可以看到,除了一个挑战,“亟需改进”和“平均分”头部挑战基本保持一致,这个有区别的挑战是:
“边缘 AI 系统部署等起步过程中缺乏指南文档”
但可以观察到,除了“亟需改进”维度,该挑战其实在“平均分”维度也是非常接近头部(距离截尾均值 0.02),这说明其重要性。
2.3. 可改进
问卷中的绝大部分挑战都以较大比例(63.1% - 69.94% )被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为 13.87%,说明列举在问卷中相关挑战大部分都明显有改进的需求。
其中,被认为“可改进”的挑战中比例最高(69.94%)的是:
“真实业务数据集及其基线算法、预训练模型难以获取”
在截尾均值(67.06%)以上的其它头部挑战还包括:
“缺乏真实业务及其研究需求的固定来源”
“边缘 AI 系统部署等起步过程中缺乏指南文档”
“缺乏 AI 工具,包括资源监控、节点仿真、标注工具等”
“算法研发迭代中,重复部署整套端边云系统过于沉重”
与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。
1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急。这些可能看上去更“长远”的“重要不紧急”挑战包括:
“缺乏真实业务及其研究需求的固定来源”
“边缘 AI 系统部署等起步过程中缺乏指南文档”
第二个挑战也与“亟需改进”部分结论一致。
2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:
“算法研发迭代中,重复部署整套端边云系统过于沉重”
“缺乏 AI 工具,包括资源监控、节点仿真、标注工具等”
2.4. 小结
对边缘 AI 算法开发者有以下结论:
1、平均分值最高(6.87 分)的挑战是:“真实业务数据集及其基线算法、预训练模型难以获取”
2、其它头部重要挑战中
“重要不紧急”头部重要挑战包括:“缺乏真实业务及其研究需求的固定来源”“边缘 AI 系统部署等起步过程中缺乏指南文档”
“重要且紧急”头部重要挑战包括:“算法研发迭代中,重复部署整套端边云系统过于沉重”“缺乏 AI 工具,包括资源监控、节点仿真、标注工具等”
3、“边缘 AI 及其应用”方向下算法开发各职业平均分值最高的生态挑战分别是:
工业界:“缺乏 AI 工具,包括资源监控、节点仿真、标注工具等” (平均分 7.5)
学术界:“缺乏真实业务及其研究需求的固定来源” (平均分 7.14)
在校学生:“真实业务数据集及其基线算法、预训练模型难以获取”(平均分 7.68)
问卷中也尝试调研边缘 AI 算法开发其余重要挑战,调研结果词云如下所示,包括边缘 AI 概念与定义、硬件方案、人才协作、工具与文档、场景需求、AI 效果等 24 条意见,由于篇幅限制不一一阐述。
3. 边缘 AI 服务开发者
本问卷中,边缘 AI 服务开发者是指,在给定算法基础上开发工业、Re-ID、能源、机器人等边缘 AI 服务的角色。有 74.90%的调研对象填写了边缘 AI 服务开发者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。
本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。
3.1. 平均分
若选择“不了解跳过”或“可维持现状”记为 0 分,“建议改进”记为 5 分,“亟需改进”记为 10 分,答卷中对边缘 AI 服务开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的 1.24 分,问卷中所罗列的各挑战都超过了 5 分,可以认为各挑战都有改进的需求。
其中,平均分值最高(6.76 分)的挑战是:
“通用方案整体性能不一定满足特定业务需求”
在截尾均值 6.09 分以上的其它头部挑战还包括:
“自研业务算法和系统方案周期长成本高”
“方案效果复现困难或通用方案应用范围存疑”
从“边缘 AI 及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为 2:1:1),细化服务开发者各项挑战平均分:
“边缘 AI 及其应用”方向下各职业平均分值最高的服务开发挑战完全一致:
工业界:“通用方案整体性能不一定满足特定业务需求” (平均分 7.1)
学术界:“通用方案整体性能不一定满足特定业务需求” (平均分 7.8)
在校学生:“通用方案整体性能不一定满足特定业务需求”(平均分 7.5)
在截距均值以上的其它头部挑战还包括:
工业界(截距均值 5.99):
“自研业务算法和系统方案周期长成本高”(平均分 6.63)
“方案效果复现困难或通用方案应用范围存疑”(平均分 6.1)
学术界(截距均值 5.75):
“自研业务算法和系统方案周期长成本高”(平均分 7.00)
“方案效果复现困难或通用方案应用范围存疑”(平均分 6.60)
在校学生(截距均值 5.84):
“方案效果复现困难或通用方案应用范围存疑”(平均分 6.88)
“自研业务算法和系统方案周期长成本高”(平均分 6.46)
3.2. 亟需改进
对于边缘 AI 服务开发者,问卷中提及的挑战被选为“亟需改进”的比例都在 20%以上,高于“还有其他重要挑战”的 6.36%,可以认为各个挑战都有一定的迫切需求。
其中被选为“亟需改进”的挑战中比例最高(36.78%)的是:
“通用方案整体性能不一定满足特定业务需求”
在截尾均值(25.57%)以上的其它头部挑战还包括:
“自研业务算法和系统方案周期长成本高”
“现场人员只会开关机,希望简化现场安装部署”
与“平均分”维度相比,“亟需改进”维度头部部分选项排名有变化。
1、在“亟需改进”维度才进入头部的挑战有一个,在“平均分”部分其实也是非常接近头部(距离截尾均值 0.06),这可能说明该挑战比较重要,而且需求比较迫切,这个挑战是:
“现场人员只会开关机,希望简化现场安装部署”
2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降,意味着其有一定的重要性,但相对紧急程度较低,可能是“重要不紧急”的、更为“长远”的需求,这个挑战是:
“方案效果复现困难或通用方案应用范围存疑”
3.3. 可改进
问卷中的绝大部分挑战都以较大比例(59.77% - 68.96% )被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为 10.92%,说明列举在问卷中相关挑战大部分都明显有改进的需求。
其中,被认为“可改进”的挑战中比例最高(68.96%)的是:
“通用方案整体性能不一定满足特定业务需求”
在截尾均值(61.78%)以上的其它头部挑战还包括:
“自研业务算法和系统方案周期长成本高”
“方案效果复现困难或通用方案应用范围存疑”
与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。
1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急,看上去更“长远”的“重要不紧急”挑战包括:
“方案效果复现困难或通用方案应用范围存疑”
这与“亟需改进”章节结论一致。
2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:
“现场人员只会开关机,希望简化现场安装部署”
这与“亟需改进”章节结论一致。
3.4. 小结
对边缘 AI 服务开发者有以下结论:
1、平均分值最高(6.76 分)的挑战是:“通用方案整体性能不一定满足特定业务需求”
2、其它头部重要挑战中
“重要不紧急”头部重要挑战包括:“方案效果复现困难或通用方案应用范围存疑”
“重要且紧急”头部重要挑战包括:“现场人员只会开关机,希望简化现场安装部署”
头部重要挑战还包括:“自研业务算法和系统方案周期长成本高”
3、“边缘 AI 及其应用”方向下服务开发各职业平均分值最高的生态挑战完全一致:
工业界:“通用方案整体性能不一定满足特定业务需求” (平均分 7.1)
学术界:“通用方案整体性能不一定满足特定业务需求” (平均分 7.8)
在校学生:“通用方案整体性能不一定满足特定业务需求”(平均分 7.5)
问卷中也尝试调研边缘 AI 服务开发其余重要挑战,调研结果词云如下所示。包括场景定制化、培训与指南、部署安装、硬件资源、技术方案等 18 条挑战,由于篇幅原因不一一阐述。
4. 边缘 AI 技术布道者
本问卷中,边缘 AI 技术布道者是指开展边缘 AI 技术演讲布道,推广甚至销售现有边缘 AI 技术与服务的角色。有 69.94%调研对象填写了边缘 AI 技术布道者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。
本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。
4.1. 平均分
若选择“不了解跳过”或“可维持现状”记为 0 分,“建议改进”记为 5 分,“亟需改进”记为 10 分,答卷中对边缘 AI 技术布道者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的 0.73 分,问卷中所罗列的各挑战都超过了 5 分,可以认为各挑战都有改进的需求。
其中,平均分值最高(6.61 分)的挑战是:
“缺乏商业成功案例”
在截尾均值 5.77 分以上的其它头部挑战还包括:
“缺乏与现有方案系统对比,包括成本、部署要求”
“受众对边缘 AI 不了解”
从“边缘 AI 及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为 2:1:1),细化技术布道者各项挑战平均分:
“边缘 AI 及其应用”方向下各职业平均分值最高的技术布道挑战分别是:
工业界:“缺乏与现有方案系统对比,包括成本、部署要求” (平均分 6.63)
学术界:“缺乏商业成功案例” (平均分 6.59)
在校学生:“受众对边缘 AI 不了解”(平均分 6.25)
在截距均值以上的其它头部挑战还包括:
工业界(截距均值 5.98):
“受众对边缘 AI 不了解”(平均分 6.15)
“缺乏商业成功案例”(平均分 6.43)
学术界(截距均值 5.40):
“受众对边缘 AI 不了解”(平均分 5.91)
“缺乏与现有方案系统对比,包括成本、部署要求”(平均分 5.68)
在校学生(截距均值 5.46):
“缺乏商业成功案例”(平均分 6.05)
“缺乏直观的 UI 界面和 Demo”(平均分 6.05)
“缺乏与现有方案系统对比,包括成本、部署要求”(平均分 5.53)
4.2. 亟需改进
对于边缘 AI 技术布道者,问卷中提及的挑战被选为“亟需改进”的比例都在 20%以上,高于“还有其他重要挑战”的 1.72%,可以认为各个挑战都有一定的迫切需求。
其中被选为“亟需改进”的挑战中比例最高(32.18%)的是:
“缺乏商业成功案例”
在截尾均值(25.00%)以上的其它头部挑战还包括:
“缺乏与现有方案系统对比,包括成本、部署要求”
“缺乏直观的 UI 界面和 DEMO”
与“平均分”维度相比,“亟需改进”维度头部部分选项排名有变化。
1、在“亟需改进”维度才进入头部的挑战有一个,在“平均分”部分其实也是非常接近头部(距离截尾均值 0.06),这可能说明该挑战比较重要,而且需求比较迫切。这个“重要且紧急”挑战是:
“缺乏直观的 UI 界面和 DEMO”
2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降,意味着其有一定的重要性,但相对紧急程度较低,更为“长远”的需求。这个“重要不紧急”挑战是:
“受众对边缘 AI 不了解”
4.3. 可改进
问卷中的绝大部分挑战都以较大比例(54.02% - 62.07%) 被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为 6.89%,说明列举在问卷中相关挑战大部分都明显有改进的需求。
其中,被认为“可改进”的挑战中比例最高(62.07%)的是:
“缺乏商业成功案例”
在截尾均值(57.61%)以上的其它头部挑战还包括:
“缺乏与现有方案系统对比,包括成本、部署要求”
“受众对边缘 AI 不了解”
与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。
1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急,看上去更“长远”的挑战包括:
“受众对边缘 AI 不了解”
这与“亟需改进”章节结论一致。
2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:
“缺乏直观的 UI 界面和 DEMO”
这与“亟需改进”章节结论一致。
4.4. 小结
对边缘 AI 技术布道者有以下结论:
1、平均分值最高(6.61 分)的挑战是: “缺乏商业成功案例”
2、其它头部重要挑战中
“重要不紧急”头部重要挑战包括: “受众对边缘 AI 不了解”
“重要且紧急”头部重要挑战包括: “缺乏直观的 UI 界面和 DEMO”
头部重要挑战还包括:“缺乏与现有方案系统对比,包括成本、部署要求”
3、“边缘 AI 及其应用”方向下技术布道各职业平均分值最高的生态挑战分别是:
工业界:“缺乏与现有方案系统对比,包括成本、部署要求” (平均分 6.63)
学术界:“缺乏商业成功案例” (平均分 6.59)
在校学生:“受众对边缘 AI 不了解”(平均分 6.25)
问卷中也尝试调研边缘 AI 技术布道其余重要挑战,调研结果词云如下所示。包括边缘 AI 价值和方案配套等 7 条意见,由于篇幅原因不一一阐述。
未来工作
作为 KubeEdge 社区 SIG AI 重要成员,华为云边缘云创新实验室将依据调研结果有针对性地向 KubeEdge 社区 SIG AI 持续贡献。KubeEdge 是业界首个云原生边缘计算框架、当前云原生计算基金会内部唯一孵化级边缘计算开源项目。KubeEdge 在全球已拥有 800+贡献者和 60+贡献组织,在 Github 获得 4.6k+Stars 和 1.3k+Forks。作为 KubeEdge 中唯一的 AI 特别兴趣小组(Special Interest Group),KubeEdge 社区 SIG AI 致力于使能 AI 应用在边缘更好地运行,聚焦边缘 AI 技术讨论、API 定义、参考架构、开源实现等。为全球开发者提供相关研发支持并孵化繁荣生态,当前已开源边缘 AI 平台 Sedna,包括其跨边云的协同推理、联邦学习、增量学习和终身学习特性。
作为信奉开源文化的社区,KubeEdge 始终都强调“Best ideas win”,领域发展自然也不例外。为了交出一个更有竞争力和创意的提案,本次调研了解每位关注开源与边缘 AI 的朋友对相关方案落地过程遇到的困难,然后选取 Best idea,对社区内容进行优化,以便为大家呈现一个体现开源开放精神的资源分享社区生态。
除了之前章节提及的内容,问卷中还包括调研对象的建议。其中“提供公开数据集、预处理和基线代码,构建 Benchmark”的建议无论在总览、还是在边缘 AI 方向的工业界、学术界和在校学生中票数均排名第一,比例分别为 82.18%、92.98%、87.10%、86.67%,并且显著高于其它建议,相信此建议需要重点关注。社区也可以根据上面的阐述细分相关职业需求,进一步优化边缘 AI 生态。
问卷也尝试调研其余重要建议。包括场景演示和研发支撑等 8 条建议:
场景演示
增加 demo 展示
深入了解行业落地痛点
找准一个典型领域或场景进行全方案的落地测试,包括训练和推理结合实际业务形成一套端到端的解决方案
光调研开发者不足够,并非方案用户,要落地还得调研边缘 AI 的最终客户需求
研发支撑
最重要还是数据公开
希望能提供更多的例子,示例怎么完成一个任务的训练和部署。联邦学习目前了解的人比较少,希望对它的优势和使用方法做更多介绍,降低系统使用门槛。
需要对相关开源平台的了解,也可以搞合作
提供更多的开发者使用模式,不局限于现在 example
路遥共相伴,勠力同向前。特别感谢参与答卷的专家、学者和同学,本次调研的四大“意见领袖”与十佳“优秀意见”等各项评选正在有序进行,并将陆续发放报告和纪念品。结合行业关注的最新技术趋势,KubeEdge 将集结当前 SIG AI 中 30+单位的各供应商和开发者为边缘 AI 算法开发者、服务开发者、技术布道者三种角色提供资源和平台帮助。这将包括数据集开源、预处理与范式算法开源、以及 AI 工具等行业内迫切需要的资源,为大家带来一场开源饕餮盛宴。相关内容将陆续到来!欢迎关注 KubeEdge 社区https://github.com/kubeedge/ 、KubeEdge SIG AI 及其项目 Sedna https://github.com/kubeedge/sedna。
版权声明: 本文为 InfoQ 作者【华为云开发者社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/e6baf0a1461c64684f524eea1】。文章转载请联系作者。
评论