vLLMで独自実装モデルを高速推論させる