サーバーワークスエンジニアブログ
id:swx-kenji-kubo
Amazon BedrockのPriority / Standard / Flexの推論サービス階層で推論コストと性能を最適化
はじめに こんにちは、久保(賢)です。 2025年11月18日に、Amazon BedrockにPriorityとFlexという2つの新しい推論サービス階層(Service Tier)が追加されました。 2025年11月26日には、Reservedという予約型のサービス階層も発表されています。 そのため既存のStandard(従来のオンデマンド推論)と合わせて、合計4つのTie…