Language

unilab.base¶

Environment registry and base classes.

class unilab.base.TerminalObservationContract[source]¶

Bases: object

TerminalObservationContract(terminal_obs: ‘np.ndarray | None’, terminal_mask: ‘np.ndarray’, timeout_terminal_mask: ‘np.ndarray’, terminal_critic: ‘np.ndarray | None’ = None)

Parameters:

terminal_obs (ndarray | None)
terminal_mask (ndarray)
timeout_terminal_mask (ndarray)
terminal_critic (ndarray | None)

terminal_obs: ndarray | None¶

terminal_mask: ndarray¶

timeout_terminal_mask: ndarray¶

terminal_critic: ndarray | None = None¶

__init__(terminal_obs, terminal_mask, timeout_terminal_mask, terminal_critic=None)¶

Parameters:

terminal_obs (ndarray | None)
terminal_mask (ndarray)
timeout_terminal_mask (ndarray)
terminal_critic (ndarray | None)

class unilab.base.TransitionBootstrapContract[source]¶

Bases: object

TransitionBootstrapContract(actor_next_obs: ‘np.ndarray’, transition_next_obs: ‘np.ndarray’, terminal_mask: ‘np.ndarray’, timeout_terminal_mask: ‘np.ndarray’, actor_next_critic: ‘np.ndarray | None’ = None, transition_next_critic: ‘np.ndarray | None’ = None)

Parameters:

actor_next_obs (ndarray)
transition_next_obs (ndarray)
terminal_mask (ndarray)
timeout_terminal_mask (ndarray)
actor_next_critic (ndarray | None)
transition_next_critic (ndarray | None)

actor_next_obs: ndarray¶

transition_next_obs: ndarray¶

terminal_mask: ndarray¶

timeout_terminal_mask: ndarray¶

actor_next_critic: ndarray | None = None¶

transition_next_critic: ndarray | None = None¶

__init__(actor_next_obs, transition_next_obs, terminal_mask, timeout_terminal_mask, actor_next_critic=None, transition_next_critic=None)¶

Parameters:

actor_next_obs (ndarray)
transition_next_obs (ndarray)
terminal_mask (ndarray)
timeout_terminal_mask (ndarray)
actor_next_critic (ndarray | None)
transition_next_critic (ndarray | None)

unilab.base.ensure_registries(packages=None, *, optional_packages=None, fail_on_error=True)[source]¶

Import env registry bootstrap modules.

Parameters:

packages (Sequence[str] | None)
optional_packages (Sequence[str] | None)
fail_on_error (bool)

Return type:

None

unilab.base.flatten_obs_dict(obs)[source]¶

Concatenate obs groups in insertion order -> flat (N, total_dim) array.

Parameters:: obs (dict[str, ndarray])
Return type:: ndarray

unilab.base.flatten_policy_obs_dict(obs)[source]¶

Build actor-policy inputs from the single actor observation group.

Parameters:: obs (dict[str, ndarray])
Return type:: ndarray

unilab.base.get_critic_base_dim(obs_groups_spec)[source]¶

Get critic observation dim, falling back to actor obs when absent.

Parameters:: obs_groups_spec (dict[str, int])
Return type:: int

unilab.base.get_obs_dims(obs_groups_spec)[source]¶

Extract (actor_obs_dim, critic_obs_dim) from obs_groups_spec.

When no separate critic group exists, critic_obs_dim == actor_obs_dim.

Parameters:: obs_groups_spec (dict[str, int])
Return type:: tuple[int, int]

unilab.base.patch_transition_next_obs(next_obs, final_observation=None, done=None, info=None, next_critic=None)[source]¶

Patch transition next obs with final_observation without mutating actor inputs.

Parameters:

next_obs (ndarray)
final_observation (dict[str, Any] | None)
done (ndarray | None)
info (dict[str, Any] | None)
next_critic (ndarray | None)

Return type:

tuple[ndarray, ndarray | None, ndarray]

unilab.base.resolve_terminal_observation_contract(next_obs_batch_size, final_observation=None, done=None, info=None, truncated=None)[source]¶

Resolve terminal observation facts without constructing patched next obs.

Parameters:

next_obs_batch_size (int)
final_observation (dict[str, Any] | None)
done (ndarray | None)
info (dict[str, Any] | None)
truncated (ndarray | None)

Return type:

TerminalObservationContract

unilab.base.resolve_transition_bootstrap_contract(next_obs, info=None, final_observation=None, done=None, truncated=None, next_critic=None)[source]¶

Resolve actor/storage observations and timeout bootstrap masks for a step.

Parameters:

next_obs (ndarray)
info (dict[str, Any] | None)
final_observation (dict[str, Any] | None)
done (ndarray | None)
truncated (ndarray | None)
next_critic (ndarray | None)

Return type:

TransitionBootstrapContract

unilab.base.split_obs_dict(obs)[source]¶

Split observation dict into (actor_obs, critic_obs).

When no separate critic group exists, critic_obs == actor_obs.

Parameters:: obs (dict[str, ndarray])
Return type:: tuple[ndarray, ndarray]

Modules

`augmentation`
`backend`
`base`
`curriculum`	Curriculum learning for adaptive difficulty adjustment.
`final_observation`
`np_env`
`observations`
`registry`
`scene`