GGUF 変換メモ - Qiita

Python の Transformers ライブラリで使用される safetensors 形式から、llama.cpp で使用される GGUF 形式への変換と量子化についてのメモです。 clone Hugging Face にある git リポジトリから clone す...