GPU無し、コンテナもPythonも使わない、RAM=8GBのLinux PCでGPT

2023年03月23日追記 この投稿での事例は、1トークンの推論に約1分を要する。とにかく動作させてみることを念頭にしている。swapを用いず、小規模なモデルをオン・メモリで動作させることで、実用に適うパフォーマンスで動作させることができる。そのような事例を、次の投稿で紹介している。関心があれば参照してほしい。 …