LayerX エンジニアブログ
id:kikehara
実践!gpt-5-mini推論レイテンシ改善: パラメータ調整とプロンプトエンジニアリングによる爆速回答
こんにちは、LayerXのバクラク事業部 AI BPOチームでエンジニアをしているikehara (@ikehara_dev)です。 この記事は LayerX Tech Advent Calendar 2025 19日目の記事です。 本記事では、推論(Reasoning)モデルgpt-5-miniを本番投入した際の事例を紹介します。 当初は推論レイテンシが想定上限に達し、運用が厳しい状態で…