Pandasでメモリを効率的に扱うテクニック5選

はじめに 1.サンプリングをしデータの行数を減らす ファイルレベルでサンプリングする ファイルのチャンクごとでサンプリングをする 2.サブセットを抽出しデータの列数を減らす ファイル読み込み時にサブセット抽出をする データフレーム読み込み後にサブセット抽出をする 3.データを分割して読み込む 4.扱うデータタイプ…