パソコン関連もろもろ
id:touch-sp
東工大と産総研の研究チームが公開している大規模言語モデル「Swallow」にことわざの意味を聞いてみた
huggingface.co はじめにパラメータ数が70億パラメータ(7B)、130億パラメータ(13B)、700億パラメータ(70B)の3モデルがあるようです。さらにそれぞれにbaseモデルとinstructモデルが存在します。instructモデルはチャットのように質問に対して答えを返すモデルです。今回は「Swallow-7b-instruct-hf」と「Swallow-13b…