训练¶
UniLab 中的训练以配置为先(config-first)。日常运行使用软件包 CLI,调试底层 Hydra 组合时再使用脚本入口。
CLI 参考
uv run train、uv run eval、uv run demo 以及底层脚本的路由。
Hydra 配置
owner YAML 布局、后端选择以及安全的 override 示例。
日志与跟踪
TensorBoard、W&B、运行元数据以及 trace 选项。
续训与检查点
algo.load_run、检查点文件与回放命令之间如何配合。
Docker
在仓库内置的 Linux NVIDIA 镜像工作流中运行 UniLab。
多 GPU
当前 off-policy 的多 GPU 旋钮及其配置边界。
什么时候下沉到 scripts/train_*.py¶
日常运行应使用统一 CLI。只有在下面几种场景才直接使用底层
scripts/train_*.py 入口:
需要调试特定训练栈,
需要直接观察 Hydra compose 行为,或
需要对照脚本级日志目录或 adapter 行为。