はじめに CTOの幅野です。 Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inferenceを読みました。この論文はTensorflow/Tensorflow Liteで実装されている、モデルのパラメータを量子化する手法です。以前まではEdgeTPUで機械学習モデルを推論させるために、この学習方法で行う…

METRICA-tech blog

quantization aware trainingの論文「Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference」を読みました