音声ファイル特徴量変換(その2)メルスペクトログラム

前回の続き。「log-mel spectrogram」(STFT+メル周波数変換+自然対数)について見ていく。音声データは「yes」という一秒間の発話データ。 log-mel spectrogram メル周波数(対数変換なし) メル尺度に変換する。 import librosa import numpy as np # Audio Data audio_path = 'speech_dataset/yes/0a7c2a8d_nohash_0.…