UniLab Glossary

语言: 简体中文

本页定义 UniLab 文档中反复出现的核心术语。架构和评审文档应链接到这里,避免同一个概念在多处重新解释。

Backend Capability

后端显式声明并实现的能力边界。MuJoCo 和 Motrix 不要求功能完全对等;play、snapshot、video、domain randomization 等差异必须通过 capability 或 owner config 表达。

Cold Path / Hot Path

Cold path 指 init、materialization、cache build 等低频路径。Hot path 指 step()reset()、domain randomization 执行循环等高频路径。

资产、XML、模型元数据只能在 cold path 访问。hot path 不允许解析 asset/XML,也不允许通过 backend 私有属性探测来决定运行时行为。

Evidence Grades

用于描述 backend/task/algo 支持程度的证据等级:

  • Registered: registry 中存在 env/backend 注册。

  • Configured: 存在对应 owner YAML。

  • Tested: tests/ 中有自动化覆盖该 entrypoint/task owner/backend 组合。

  • Benchmarked: 存在绑定该组合的 benchmark manifest。

  • Recommended: 存在显式 recommendation metadata。

没有对应证据时,不应把能力写成稳定支持或推荐路径。

Owner Layer

拥有某类规则和默认值的最低合理层。问题应在 owner layer 修复,而不是在上层脚本绕过 contract。

常见归属:

  • backend 差异归 backend adapter 或 backend-specific config。

  • MDP、observation、reward、reset 归 env。

  • task/backend/reward/algo 组合归 owner YAML。

  • collector/learner 生命周期归 runner / IPC。

  • 脚本只做流程装配。

Owner YAML / Task Owner

顶层 CLI 通过 --algo <algo> --task <task> --sim <backend> 选择最终 task owner 配置。PPO / APPO 路径位于 conf/{ppo,appo}/task/<task>/<backend>.yaml,off-policy 路径位于 conf/offpolicy/task/<algo>/<task>/<backend>.yaml

owner YAML 直接持有 training.task_nametraining.sim_backendrewardenv 以及 task-specific algotraining.sim_backend 是 owner YAML 的身份字段,不是独立 backend switch。

Registry Bootstrap

通过 unilab.base.registry.ensure_registries() 导入显式声明的 registry modules,使 @registry.envcfg(...)@registry.env(...) decorator 生效。bootstrap 入口是 package contract,不依赖目录扫描推断注册目标。

Task Owner Config

同 Owner YAML。文档中出现 task owner config 时,强调它是 task/backend/reward/algo 组合的唯一入口,而不是可被 training.sim_backend=... 单独改写的拆分式配置。