データサイエンティスト(仮)
id:tekenuko
Pythonでデータ分析:imbalanced-learnで不均衡データのサンプリングを行う
導入 クラス分類、例えば0:負例と1:正例の二値分類を行う際に、データが不均衡である場合がたびたびあります。例えば、クレジットカードの取引データで、一つの取引に対して不正利用かどうか(不正利用なら1、それ以外は0)といった値が付与されているカラムがあるとします。通常、不正利用というのは稀に起こる事象なの…