Top-Down Microarchitecture Analysisとは何か ― Intelの性能解析手法の基本思想を読む (1)

CPUの性能解析を行うとき、最初に直面する問題は「どこがボトルネックなのか分からない」というところだ。Linuxのperf statを用いると、各種イベントの回数などを取得することはできる: L1 miss LLC miss branch mispredict stall cycle TLB miss しかし、この数値を見ただけでは何も分からない。この数値をもとに、実際…