Techouse Developers Blog
id:techouse-dev
大量データの重複検出をUnionFindと逆引きインデックスで劇的に高速化した話
先日、業務で重複判定を実装する機会がありました。その中でUnionFindと逆引きインデックスという技術を使ったのですが、実際に導入してみると非常に効果的だったので、今回は商品マスタの重複検出を例にこれらの技術を用いて重複検出の課題を解決した話をします。