
VibratoをLambdaで使いたい
Vibratoは高速便利な形態素解析器。
以下の記事参照。
これをAWS Lambdaで使いたい。
たとえば何らかのシステムに「青眼の白龍」のつもりで「青目の白龍」と入力したとする。
(「眼」と「目」が間違っている。)
このときに、

ではなく、

こういった需要を満たす技術は「名寄せ」と呼ばれていて、
そこでは文字列間の類似度、あるいは距離を計算する手法がよく用いられる。
有名なアルゴリズムとして、
などいくつか挙げられるが、その辺のアルゴリズムを大体網羅して、かつ高速で使用方法も簡単な最強ライブラリが存在する。
今回はその最強ライブラリrapidfuzzを使って遊戯王カード名の名寄せを行う。
Update your browser to view this website correctly. Update my browser now