遊戯王OCG全カードの知名度ランキングを作る(1/2) ~Custom Search APIで実験~

遊戯王OCG全カードの知名度ランキングを作る(1/2) ~Custom Search APIで実験~

遊戯王OCG全カードの知名度(≒Google検索ヒット数)を調べる

「青眼の白龍」、「ブラックマジシャン」など数ある有名カードのうちどれがどのくらい有名なのか、
あるいはどのカードの知名度が低いのか。
知名度を数値化することでカード間の比較を行いたい。

ここで「知名度」の指標として「Google検索ヒット数」を使用する。
「Google検索ヒット数」はWEB上でどれだけその言葉が使用されているかを表す。
イコールではないが相関が高そうに思われる。

前回の記事は今回の実験に向けた準備。

本当は複数の検索エンジンで調べて平均を取るなどしたい、

1. 実験

  1. 「遊戯王カードAPI」によって全てのカード情報を取得

  2. 全カードに対して「Google Custom Search API」により検索ヒット数を取得

  3. 検索時は下記条件を付けることでカード自体の知名度を調べられるようにする

  • カード名と”yu-gi-oh”とのAND検索
  • 完全一致検索

カード情報付きで表を作ったのでいろいろ集計できる。

遊戯王カードAPIを使った都合上英語検索。

1.1. 上位10件

とりあえずトップ10。

順位card nameカード名Google検索ヒット数
17731300000
2Contactコンタクト18000000
3NEXTNEXT17400000
4Questionクイズ12400000
5Return差し戻し11400000
6Wolfオオカミ10500000
7Storm9430000
8Forest8410000
9Fine罰則金8220000
10Mountain8150000

残念な結果。
一般名詞が上位を独占。
検索オプションにより遊戯王関連のみを検索したはずだがあまり効いていないようだ。

この表を見て「遊戯王カードだ!」と気づく人の方が少ないだろう。

1.2. モンスター上位30件

モンスターに絞って上位30件。

一般名詞モンスターたちの中に「青眼の白龍」、「ブラックマジシャン」の2つがランクイン。
さすがだ。

順位card nameカード名Google検索ヒット数
1Wolfオオカミ10500000
2Supply物資調達員7650000
3Victoriaウィクトーリア7480000
4Evaイーバ7040000
5Batバット6520000
6Scannerスキヤナー6250000
7Hyo5290000
8Infernoインフェルノ5250000
9Merlin伝説の預言者マーリン4900000
10BOXerBOXサー4880000
11Overdriveガトリングバギー3970000
12Mojaモジャ3770000
13Honestオネスト3750000
14Dark Magicianブラック・マジシャン3680000
15Trentトレント3620000
16Athenaアテナ3270000
17Blockerブロッカー3220000
18Lord of the Redロード・オブ・ザ・レッド3200000
19Chakraチャクラ3100000
20Peacockクジャック3060000
21Code Generatorコード・ジェネレーター3030000
22Blue-Eyes White Dragon青眼の白龍3000000
23Gigantesギガンテス2910000
24The Creator創世神2840000
25Firebird火炎鳥2800000
26Jellyfish海月-ジェリーフィッシュ-2480000
27Slot MachineスロットマシーンAM-72210000
28Doki Doki怒気土器2170000
29Charlemagneシャルル大帝2160000
30Sporeスポーア2140000

2. 改善案

現在の手法では一般名詞カードばかり上位に来てしまい、カードの知名度を図る目的が達成できなかった。

以下の方法での改善を考えている。

  1. 日本語カード名での検索結果も利用

少なくとも「Supply」(日本語名「物資調達員」)や「Victoria」(日本語名「ウィクトーリア」)のヒット数は抑えられるはず。
しかし「Wolf」(日本語名「オオカミ」)や「Hyo」(日本語名「氷」)はいずれにしろ強いので不十分。

  1. カード名と「遊戯王」とのAND検索時とそうでないときとの差を使用

例えば、
「”オオカミ”」の検索ヒット数は22,000,000 件。
「”オオカミ” AND “遊戯王”」の検索ヒット数は10,700,000 件。

「”青眼の白龍”」の検索ヒット数は4,510,000 件。
「”青眼の白龍” AND “遊戯王”」の検索ヒット数は4,020,000 件 。

「遊戯王」をAND検索したことで、
「オオカミ」の検索ヒット数は49%に半減したのに対して、
「青眼の白龍」の検索ヒット数は89%も維持している。

これは、カード名と「遊戯王」という単語の紐付きの強さを表し、
これが小さい場合、遊戯王カードとは関係ないページが多くヒットしていると考えられる。

この値を係数として最終的な知名度の計算に利用する方法はなかなか良さそう。

2.1. 改善案の問題点

しかし上記の改善案には検索パターンの増加につれてAPIの料金が増えるという問題がある。
実は今回の実験だけで無駄に8000円も使っている。



「Google Custom Search API」高すぎる。

3. 関連リンク

続き

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×