どこから見てもメンダコ
id:horomary
Jax/Flax NNXで実装する深層強化学習②:PPOによるロボット犬の歩行学習
MuJoCo-XLA (MJX)環境にてロボット犬(UnitreeGo1)の歩行学習のためにPPOをFlax NNXで実装します。 Jax/Flax NNXとは Massively Parallel Reinforcement Learning (大規模並列強化学習) 大規模並列強化学習のためのプラットフォーム MuJoCo XLA(MJX): アルゴリズム研究者向け NVIDIA Isaac Lab: ロボット開発者向け…