前回挑戦したが微妙な結果だった知名度ランキング。
しかし「知名度」の指標として「Google検索ヒット数」を使用するアイディアは良かった。前回をベースとして改善した結果いいかんじのランキングができた。
「青眼の白龍」、「ブラックマジシャン」など数ある有名カードのうちどれがどのくらい有名なのか、あるいはどのカードの知名度が低いのか。知名度を数値化することでカード間の比較を行いたい。
ここで「知名度」の指標として「Google検索ヒット数」を使用する。「Google検索ヒット数」はWEB上でどれだけその言葉が使用されているかを表す。イコールではないが相関が高そうに思われる。
前回の記事は今回の実験に向けた準備。
本当は複数の検索エンジンで調べて平均を取るなどしたい、
Google検索で単語を検索したときに表示される
約 00,000 件 (0.00 秒)
のような検索ヒット数を取得したい。数十個なら手作業でなんとかなるが数千個だと無理。
はじめはスクレイピングしようと思ったがGoogleはガチガチのスクレイピング対策してて難しそう。調べたところ「Google Custom Search API」を使えばできそうなのでこれを使う。
KEN
Circle KEN
Twitter: @CircleKENdotNet
Aichi
投稿
134
カテゴリ
1
タグ
72
software
Update your browser to view this website correctly. Update my browser now
×