ぽっぺんしゃんにょろりんこ
id:Pop_Ancient
Node.jsで不要ページを事前にフィルタリングし、クロール高速化&帯域削減するというお話
※全体のクローリング処理では Puppeteer を使用していますが、この記事で紹介するフィルタリング処理は Node.js 単体で完結しています。 こんにちは、にょろりんこです。 今回は、クローリング処理を高速化&軽量化するために導入している、「事前URLフィルタリング」の仕組みについて紹介します。 髪を触るティアラ 私が…