LLMベースTTS「CosyVoice3」を完全ONNX化してPyTorchなしで推論する

はじめに 成果物 (ONNXモデル/推論スクリプト) CosyVoice3のアーキテクチャ Zero-Shot音声クローニングの仕組み 開発環境 ONNXエクスポート 生成されたONNXファイル LLMのKVキャッシュ分割 HiFTのFP32必須問題 PyTorchフリー推論の実装 依存パッケージ NumPy/SciPyによるSTFT/ISTFT実装 推論ループの実装 発見した問題と解…