遊戯王OCG全カードの知名度(≒Google検索ヒット数)を調べる
「青眼の白龍」、「ブラックマジシャン」など数ある有名カードのうちどれがどのくらい有名なのか、
あるいはどのカードの知名度が低いのか。
知名度を数値化することでカード間の比較を行いたい。
ここで「知名度」の指標として「Google検索ヒット数」を使用する。
「Google検索ヒット数」はWEB上でどれだけその言葉が使用されているかを表す。
イコールではないが相関が高そうに思われる。
前回の記事は今回の実験に向けた準備。
本当は複数の検索エンジンで調べて平均を取るなどしたい、
1. 実験
「遊戯王カードAPI」によって全てのカード情報を取得
全カードに対して「Google Custom Search API」により検索ヒット数を取得
検索時は下記条件を付けることでカード自体の知名度を調べられるようにする
- カード名と”yu-gi-oh”とのAND検索
- 完全一致検索
カード情報付きで表を作ったのでいろいろ集計できる。
遊戯王カードAPIを使った都合上英語検索。
1.1. 上位10件
とりあえずトップ10。
順位 | card name | カード名 | Google検索ヒット数 |
---|---|---|---|
1 | 7 | 7 | 31300000 |
2 | Contact | コンタクト | 18000000 |
3 | NEXT | NEXT | 17400000 |
4 | Question | クイズ | 12400000 |
5 | Return | 差し戻し | 11400000 |
6 | Wolf | オオカミ | 10500000 |
7 | Storm | 嵐 | 9430000 |
8 | Forest | 森 | 8410000 |
9 | Fine | 罰則金 | 8220000 |
10 | Mountain | 山 | 8150000 |
残念な結果。
一般名詞が上位を独占。
検索オプションにより遊戯王関連のみを検索したはずだがあまり効いていないようだ。
この表を見て「遊戯王カードだ!」と気づく人の方が少ないだろう。
1.2. モンスター上位30件
モンスターに絞って上位30件。
一般名詞モンスターたちの中に「青眼の白龍」、「ブラックマジシャン」の2つがランクイン。
さすがだ。
順位 | card name | カード名 | Google検索ヒット数 |
---|---|---|---|
1 | Wolf | オオカミ | 10500000 |
2 | Supply | 物資調達員 | 7650000 |
3 | Victoria | ウィクトーリア | 7480000 |
4 | Eva | イーバ | 7040000 |
5 | Bat | バット | 6520000 |
6 | Scanner | スキヤナー | 6250000 |
7 | Hyo | 氷 | 5290000 |
8 | Inferno | インフェルノ | 5250000 |
9 | Merlin | 伝説の預言者マーリン | 4900000 |
10 | BOXer | BOXサー | 4880000 |
11 | Overdrive | ガトリングバギー | 3970000 |
12 | Moja | モジャ | 3770000 |
13 | Honest | オネスト | 3750000 |
14 | Dark Magician | ブラック・マジシャン | 3680000 |
15 | Trent | トレント | 3620000 |
16 | Athena | アテナ | 3270000 |
17 | Blocker | ブロッカー | 3220000 |
18 | Lord of the Red | ロード・オブ・ザ・レッド | 3200000 |
19 | Chakra | チャクラ | 3100000 |
20 | Peacock | クジャック | 3060000 |
21 | Code Generator | コード・ジェネレーター | 3030000 |
22 | Blue-Eyes White Dragon | 青眼の白龍 | 3000000 |
23 | Gigantes | ギガンテス | 2910000 |
24 | The Creator | 創世神 | 2840000 |
25 | Firebird | 火炎鳥 | 2800000 |
26 | Jellyfish | 海月-ジェリーフィッシュ- | 2480000 |
27 | Slot Machine | スロットマシーンAM-7 | 2210000 |
28 | Doki Doki | 怒気土器 | 2170000 |
29 | Charlemagne | シャルル大帝 | 2160000 |
30 | Spore | スポーア | 2140000 |
2. 改善案
現在の手法では一般名詞カードばかり上位に来てしまい、カードの知名度を図る目的が達成できなかった。
以下の方法での改善を考えている。
- 日本語カード名での検索結果も利用
少なくとも「Supply」(日本語名「物資調達員」)や「Victoria」(日本語名「ウィクトーリア」)のヒット数は抑えられるはず。
しかし「Wolf」(日本語名「オオカミ」)や「Hyo」(日本語名「氷」)はいずれにしろ強いので不十分。
- カード名と「遊戯王」とのAND検索時とそうでないときとの差を使用
例えば、
「”オオカミ”」の検索ヒット数は22,000,000 件。
「”オオカミ” AND “遊戯王”」の検索ヒット数は10,700,000 件。
「”青眼の白龍”」の検索ヒット数は4,510,000 件。
「”青眼の白龍” AND “遊戯王”」の検索ヒット数は4,020,000 件 。
「遊戯王」をAND検索したことで、
「オオカミ」の検索ヒット数は49%に半減したのに対して、
「青眼の白龍」の検索ヒット数は89%も維持している。
これは、カード名と「遊戯王」という単語の紐付きの強さを表し、
これが小さい場合、遊戯王カードとは関係ないページが多くヒットしていると考えられる。
この値を係数として最終的な知名度の計算に利用する方法はなかなか良さそう。
2.1. 改善案の問題点
しかし上記の改善案には検索パターンの増加につれてAPIの料金が増えるという問題がある。
実は今回の実験だけで無駄に8000円も使っている。
「Google Custom Search API」高すぎる。
3. 関連リンク
続き