部署¶
一本实操手册,帮助你将 UniLab 策略跨硬件、仿真后端与源框架迁移。每篇教程都遵循 相同的结构:
你从什么开始 —— 训练好的产物与配置。
要改什么 —— 代码、YAML 与资产中最小的一组改动。
如何验证 —— 具体的命令与检查点。
选择你的路线¶
🤖 仿真 → 真机
为 G1 / Go2 / Allegro 上机准备训练好的策略,包含 ONNX 导出与部署侧契约检查。
🔀 仿真 → 仿真
在 MuJoCo 与 Motrix 之间切换同一任务,无需从头重新训练。
🔁 框架迁移
从 Isaac Lab / Legged Gym / rsl_rl / skrl 迁移任务。
🤖 仿真 → 真机¶
🗺 总览与上机前检查
端到端流程 + go/no-go 清单。
🦿 G1 全身
29 自由度人形;运动跟踪部署。
🐕 Go2 运动
摇杆、崎岖地形、Go2W 轮足。
🤚 Allegro 手内操作
方块旋转;摩擦 + 视觉。
📦 ONNX 导出与运行时
训练回放导出、ONNX Runtime 检查以及部署原型输入。
🎲 仿真到真机的 DR
按优先级排序的 DR 配方。
🛡 安全层
软限位、EMA、急停、看门狗。
⏱ 延迟与观测滞后
训练侧的延迟旋钮与部署侧的测量检查。
🔧 故障排查
症状 → 原因 → 修复速查手册。
🔀 仿真 → 仿真(MuJoCo ↔ Motrix)¶
🤔 后端切换
📝 Owner YAML 切换
🔬 接触与摩擦对齐
⚖ 奖励一致性检查
🎞 回放差异
🚫 已知能力缺口
🔁 框架迁移¶
来自 Isaac Lab
GPU 常驻 → CPU + 共享内存。
来自 Legged Gym
基于类的环境 → NpEnv。
来自 rsl_rl
训练器拆分:collector + learner。
来自 skrl
算法覆盖范围与取舍。
📋 配置翻译速查表
逐字段对照表。
📒 奖励移植手册
以 UniLab 风格表达常见奖励项。