AIスタックチャンのWakeWord.cppを解読

AIスタックチャンのウェイクワード検出のソースである WakeWord.cpp をざっくり解読します。 コメントにある通り、ややこしいです。 仕様・用語 サンプルレート: 16000Hz VAD : 音声アクティビティ検出 (人が話していることを検出) MFCC : メル周波数ケプストラム係数 (音声の特徴量) DTW距離 : 2つの時系列データの似てない度 (…