Manus 技术路线的硬伤

从各种渠道看了 Manus 表现,对它的实现大概有了认识,个人觉得技术路线不够好,会有很大硬伤。
首先说一个不是问题的地方:验证码
很多演示在验证码环节卡壳了,这个我反倒最不担心,随着技术的升级,验证码所需要的认知推理和执行能力(输入、点击、旋转、滑动等)都可以很快被解决。
最大的硬伤:基于云端虚拟机的执行环境带来三个靠技术升级也跨不过去的坎:
账号登录:目前 RPA 落地最大挑战;
个人数据隐私安全(网站登录密码等);
短信/邮箱验证码。
比较理想的是下发到用户设备执行,云端只保留 Coordinator,甚至把推理到下发到本地设备执行。
好处:
突破. Action 执行边界:从仅网页到不受限(访问 App、OS 能力);
隐私数据操作:安全的访问密码管理器等隐私数据。

涉及隐私数据访问,最好是要开源设备侧执行器源代码。
打消安全隐私顾虑:完全自动的执行器,需要开放的隐私权限太高了,闭源代码在云端执行风险太高了(即怕厂商违规,也怕黑产渗透攻击);
支持设备厂商加入开放增强本地执行能力,这样可以有更好的 App、OS 访问能力。
至于很多人提到在设备执行容易被用户操作打断,这个其实用过华为手机的第二空间就知道完全不是技术问题。只要设备厂商想做,完全可以开启第二空间去执行,跟用户操作时两个并行、独立的环境。也能理解创业公司困境,这个策略只有设备厂商参与才能落地。
当然这个方案最大的问题是不适合创业公司干,投入时间长、战线长,但也是最能实现完全自动化的最佳路线了。
版权声明: 本文为 InfoQ 作者【柯杰】的原创文章。
原文链接:【http://xie.infoq.cn/article/44bdbc4b63030a4691701e8ba】。文章转载请联系作者。
评论