METRICA-tech blog
id:metrica-tech
quantization aware trainingの論文「Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference」を読みました
はじめに CTOの幅野です。 Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inferenceを読みました。 この論文はTensorflow/Tensorflow Liteで実装されている、モデルのパラメータを量子化する手法です。 以前まではEdgeTPUで機械学習モデルを推論させるために、この学習方法で行う…