Go2 / Go2W 运动部署¶
摇杆驱动的运动(平地 + 崎岖)以及轮足式的 Go2W 变体。两者的硬件流程相似;本页指出 其中的差异。
观测契约¶
分组 |
维度 |
硬件上的来源 |
|---|---|---|
基座线速度 |
3 |
状态估计器(在 IMU + 腿部里程计上的 KF);不是原始积分 |
基座角速度 |
3 |
IMU 陀螺仪 |
投影重力 |
3 |
IMU 朝向 |
摇杆指令 (vx, vy, ωz) |
3 |
操作员输入 |
关节位置 |
12(Go2)/ 16(Go2W) |
编码器 |
关节速度 |
12 / 16 |
经过部署控制器滤波路径后的编码器速度 |
上一步动作 |
12 / 16 |
上一次策略输出 |
足端接触 |
4(仅 Go2) |
接触传感器,或由足端高度估计 |
状态估计器注意事项
策略是针对所选环境 owner 发出的观测项训练的。如果部署无法提供同样的基座速度信号, 请训练一个变体,使其 actor 观测与你能在机器人上运行的估计器相匹配(参见 HIM-PPO, 见 HIM-PPO)。
崎岖地形注意事项¶
对于 go2_joystick_rough,策略期望存在抬升的地形特征。在平坦的室内地面上,按崎岖
地形训练的策略会比必要时更加保守,但在硬件上机前仍应通过回放进行验证。对于在
斜坡 / 碎屑上的部署:
从实测的部署表面选取地面摩擦的 DR 范围。
用地形课程训练:见 程序化地形。
Go2W 轮 ↔ 腿分派¶
Go2W 策略为后轮关节输出连续轮速,并为腿部输出位置目标。动作向量的顺序必须
与 src/unilab/assets/robots/go2w/ 匹配。用 unilab-export-scene 验证。