Google、Gemma 4を3倍を高速化。出力品質はそのまま

 Googleは5月5日、最新の高性能オープンモデル「Gemma 4」向けに、出力品質を維持しながら推論速度を最大3倍引き上げる「Multi-Token Prediction(MTP) drafters」を提供開始した。Apache 2.0ライセンスのもとオープンソースで公開しており、モデルウェイトはHugging FaceやKaggleにて入手できる。