どこから見てもメンダコ
id:horomary
Jax/Flax NNXで実装する深層強化学習①:DQNによるAtari/Breakout攻略
Pytorchスタイルになって書きやすくなったFlaxの新API「NNX」の使用感の確認のため、ALE/Breakout(ブロック崩し)向けにDQNを実装しました。 Jaxとは? ①Numpyの使いやすさ ②柔軟な自動微分 ③マルチCPU/GPU/TPUでの分散並列コンピューティング Flax NNXとは? PyTorchスタイルになったFlaxの新しいAPI 余談: Flax NXXま…