Language

Go2 / Go2W 运动部署¶

摇杆驱动的运动（平地 + 崎岖）以及轮足式的 Go2W 变体。两者的硬件流程相似；本页指出其中的差异。

观测契约¶

状态估计器注意事项

策略是针对所选环境 owner 发出的观测项训练的。如果部署无法提供同样的基座速度信号，请训练一个变体，使其 actor 观测与你能在机器人上运行的估计器相匹配（参见 HIM-PPO，见 HIM-PPO）。

对于 go2_joystick_rough，策略期望存在抬升的地形特征。在平坦的室内地面上，按崎岖地形训练的策略会比必要时更加保守，但在硬件上机前仍应通过回放进行验证。对于在斜坡 / 碎屑上的部署：

Go2W 策略为后轮关节输出连续轮速，并为腿部输出位置目标。动作向量的顺序必须与 src/unilab/assets/robots/go2w/ 匹配。用 unilab-export-scene 验证。