vLLMで独自実装モデルを高速推論させる

zenn.dev zenn.dev