まずは蝋の翼から。
id:chito_ng
文字列の類似度を測る編集距離
仕事である固有名詞に対してデータソースがAのものとBのもので、微妙に表記ゆれがあったため名寄せ作業をおこなう必要があった。 目で見ていくとキリがないので文字列の類似度測って閾値以上のものをリストアップした上で目で見ると効率が良くなりそうなので文字間の類似度比較について調べた。 文字の編集距離 ある文字A…