【LLM】1B帯の日本語事前学習モデルのベンチマークを測定する