TMECH 发表优必选运控技术最新进展:实现人形机器人高鲁棒性行走
运动控制是人形机器人的核心技术之一,也是人形机器人适应人类生存环境所必需的能力。近日,优必选科技与代尔夫特理工大学丁加涛博士、东南大学韩林言博士合作,在这一技术领域取得了进展,联合发表了论文《Robust Locomotion Exploiting Multiple Balance Strategies: An Observer-Based Cascaded Model Predictive Control Approach》【利用多平衡策略的鲁棒运动:一种基于扰动观测器的级联模型预测控制方法(MPC)】,于 2022 年 7 月收录于《IEEE/ASME 机电一体化汇刊》(IEEE/ASME Transactions on Mechatronics,简称“TMECH”),该期刊是由美国电气和电子工程师协会(IEEE)和美国机械工程师协会(ASME)共同主办的机械电子与控制领域权威期刊,论文同期在 IEEE/ASME 先进智能机电一体化国际会议(IEEE/ASME International Conference on Advanced Intelligent Mechatronics)上发表。
具备鲁棒步行能力是仿人机器人能够执行现实任务的先决条件。一般来讲,给定落地位置,可以通过控制压力中心(center of pressure, CoP)在支撑多边形内部来确保稳定性(即利用踝关节策略)。然而,由于脚掌的尺寸有限,仅利用脚踝策略无法抵抗严重的干扰。为了增强鲁棒性,研究者们试图集成多种步态平衡策略,例如调整落脚位置(即迈步策略)(1),修正角动量(即髋关节策略)(2)和修正质心高度(即变高度策略)(3)。
文章针对人形机器人的步行提出了一种基于扰动观测器的级联模型预测控制(model predictive control, MPC)方法,该方法能够集成踝关节、迈步、髋关节和高度变化策略,实现高鲁棒性行走。系统整体结构如图 1 所示。
图 1:本文所提结构的方框图
文章的主要贡献有:
•提出一个种基于 MPC 的级联控制框架,集成踝关节策略、迈步策略、髋关节策略和变高度策略。该框架将两个子 MPC 问题建模为凸优化问题并实现快速求解。
• 设计非线性高阶滑模观测器(high-order sliding mode observer, HOSMO),实时估计机器人的状态(包括三维质心(center of mass, CoM)位置、速度和二维上身倾角和角速度)以及系统的动态扰动。
• 采用闭环 MPC 方案实现了多种场景下的鲁棒运动,并在仿人机器人上进行了大量的实验验证。
MPC 的结构设计:
相比于其他步行控制算法,MPC 算法具有以下优点:
• MPC 可以被表述为一个最优控制问题,便于处理各种可行性约束。
• MPC 预测未来一段时域内的运动,可以适应动态环境。
• MPC 可以通过反馈控制机制抵抗外界干扰。
为了在不造成沉重计算负担的情况下集成多种步态平衡策略,本文提出一种双层 MPC 结构:
a) 用于三维鲁棒性运动的非线性 MPC (NMPC)
第一层 NMPC 使用可变高度倒立摆(variable height inverted pendulum, VHIP)模型规划三维运动并通过操纵压力中心(即采用踝关节策略)以保持平衡。同时,还对落脚位置进行调制,以抵抗动态扰动。
b) 用于角动量自适应的线性 MPC(LMPC)
第二层 LMPC 旨在利用髋关节策略提高行走的鲁棒性。假设在骨盆中心有一个惯性飞轮,角动量的变化可以用上半身旋转来表征。基于此,通过旋转上半身来调节质心力矩枢轴(centroidal moment pivot, CMP)以保持平衡。
基于 HOSMO 的状态估计:
为实现闭环控制,设计了高阶滑模观测器(HOSMO)来估计机器人的状态。基于非线性飞轮倒立摆(inverted pendulum plus flywheel, IPF)动力学,该观测器同时估计三维 CoM 状态、二维身体倾角状态和各个方向的动态扰动。
考虑到系统的不确定性以及外部扰动,将 IPF 的动力学模型改写成如下形式:
其中
包含三维质心运动和二维躯干倾角。
HOSMO 估计系统状态和集总扰动为:
由此,我们建立了一种用于估计状态和扰动的非线性观测器(具体工作参见论文)。
实验结果:
为了验证方法的有效性,在 Walker 机器人上进行了大量的实验。图 2 分别展示了机器人在非共面地形上的稳定行走、变方向的三维变高度行走、原地踏步时抗扰恢复和不平地面踏步时抗扰恢复。
以第(iii)行为例,当机器人原地踏步时,侧向推力作用于肩部。当施加向右的力时,机器人快速恢复平衡。此外,闭环策略有助于抵抗不同方向的推力。
第(iv)行展示了一项更具挑战性的任务:机器人在不平地面上踏步时受到侧向推力。此时,非共面地形限制了落脚点的调整,即不能使用迈步策略。尽管如此,机器人仍能通过旋转上半身来保持平衡。这表明第二层 LMPC 有助于增强步行鲁棒性。此外,本实验也证明了级联策略能够灵活地运行,可以单独使能各种步行平衡策略。
图 2:Walker 机器人的实机实验
结论:
文章提出了一个用于鲁棒步行的级联 MPC 框架,集成踝关节策略、迈步策略、髋关节策略和高度变化策略。该框架构造并求解两个凸优化问题,具有较高的时效性。为了提高抗干扰性能,设计了一种用于状态和扰动估计的 HOSMO。大量的样机实验证明了在有外部推力情况下机器人仍能够保持稳定。此外,该方法有助于机器人完成挑战性任务,如有高度变化的三维行走和在非共面地形上抗扰行走。
对于仿人机器人来说,在具有动态扰动的情况下实现鲁棒运动是一项具有挑战性的任务,但却是仿人机器人适应复杂的人类生存环境所必需克服的难题。起初,仿人机器人依靠手动编程的方式实现在结构化环境中的稳定运动能力,这的确能在一定程度上满足工业场景中结构化环境的使用需要,但当进入人类实际生活的非结构化环境时,手动编程就不再适用。因此,让仿人机器人在复杂的非结构化环境中灵活自如地运动,成为机器人研究领域最重要的课题,也是产业和学界共同努力的目标。这篇论文背后的运动控制技术进展,就是以优必选科技为代表的产业与学界通力合作,提升仿人机器人对外界适应性所跨出的一步,也是向着“智能让机器人走进千家万户”的使命迈出的坚实一步。
参考文献:
(1) A. Herdt, H. Diedam, P.-B. Wieber, D. Dimitrov, K. Mombaur, and M. Diehl, “Online walking motion generation with automatic footstep placement,” Adv. Robot., vol. 24, no. 5-6, pp. 719–737, April 2010.
(2) R. Schuller, G. Mesesan, J. Englsberger, J. Lee, and C. Ott, “Online centroidal angular momentum reference generation and motion optimization for humanoid push recovery,” IEEE Robot. Autom. Lett., vol. 6, no. 3, pp. 5689–5696, July 2021.
(3) K. Van Heerden, “Real-time variable center of mass height trajectory planning for humanoids robots,” IEEE Robot. Autom. Lett., vol. 2, no. 1,pp. 135–142, June 2017.
版权声明: 本文为 InfoQ 作者【优必选科技】的原创文章。
原文链接:【http://xie.infoq.cn/article/00414dc1c1384f9e68a8945bb】。文章转载请联系作者。
评论