中華IT最新事情
id:tamakino
DeepSeekがGPUの制限を突破するのに使われたPTX。その制約が突破の原動力になった
DeepSeekはトレーニングコストが従来の1/10。それには冗長計算の8割をカットするという努力が必要だった。米国政府は中国に対してGPUの制限をかけ、それをDeepSeekチームは突破をしたと量子位が報じた。 冗長計算を8割カットしたDeepSeek DeepSeekがなぜ1/10のトレーニングコストでGPTと肩を並べる大規模言語モデル(LLM…