训练

UniLab 中的训练以配置为先(config-first)。日常运行使用软件包 CLI,调试底层 Hydra 组合时再使用脚本入口。

CLI 参考

uv run trainuv run evaluv run demo 以及底层脚本的路由。

CLI 参考
Hydra 配置

owner YAML 布局、后端选择以及安全的 override 示例。

Hydra 配置
日志与跟踪

TensorBoard、W&B、运行元数据以及 trace 选项。

日志
续训与检查点

algo.load_run、检查点文件与回放命令之间如何配合。

续训与检查点
Docker

在仓库内置的 Linux NVIDIA 镜像工作流中运行 UniLab。

Docker
多 GPU

当前 off-policy 的多 GPU 旋钮及其配置边界。

多 GPU

什么时候下沉到 scripts/train_*.py

日常运行应使用统一 CLI。只有在下面几种场景才直接使用底层 scripts/train_*.py 入口:

  • 需要调试特定训练栈,

  • 需要直接观察 Hydra compose 行为,或

  • 需要对照脚本级日志目录或 adapter 行为。

关联