Technically Impossible
id:espio999
GPU無し、コンテナもPythonも使わない、RAM=8GBのLinux PCでGPT
2023年03月23日追記 この投稿での事例は、1トークンの推論に約1分を要する。とにかく動作させてみることを念頭にしている。swapを用いず、小規模なモデルをオン・メモリで動作させることで、実用に適うパフォーマンスで動作させることができる。そのような事例を、次の投稿で紹介している。関心があれば参照してほしい。 …