遊戯王OCG全カードの知名度ランキングを作る(2/2) ~すごく改善!~

遊戯王OCG全カードの知名度ランキングを作る(2/2) ~すごく改善!~

遊戯王OCG全カードの知名度が調べられた!

前回挑戦したが微妙な結果だった知名度ランキング。

しかし「知名度」の指標として「Google検索ヒット数」を使用するアイディアは良かった。
前回をベースとして改善した結果いいかんじのランキングができた。

遊戯王OCG全カードの知名度ランキングを作る(1/2) ~Custom Search APIで実験~

遊戯王OCG全カードの知名度ランキングを作る(1/2) ~Custom Search APIで実験~

遊戯王OCG全カードの知名度(≒Google検索ヒット数)を調べる

「青眼の白龍」、「ブラックマジシャン」など数ある有名カードのうちどれがどのくらい有名なのか、
あるいはどのカードの知名度が低いのか。
知名度を数値化することでカード間の比較を行いたい。

ここで「知名度」の指標として「Google検索ヒット数」を使用する。
「Google検索ヒット数」はWEB上でどれだけその言葉が使用されているかを表す。
イコールではないが相関が高そうに思われる。

前回の記事は今回の実験に向けた準備。

本当は複数の検索エンジンで調べて平均を取るなどしたい、

Google Custom Search APIでGoogle検索ヒット数を取得する

Google Custom Search APIでGoogle検索ヒット数を取得する

Google検索ヒット数を取得したい

Google検索で単語を検索したときに表示される

約 00,000 件 (0.00 秒)

のような検索ヒット数を取得したい。
数十個なら手作業でなんとかなるが数千個だと無理。

はじめはスクレイピングしようと思ったがGoogleはガチガチのスクレイピング対策してて難しそう。
調べたところ「Google Custom Search API」を使えばできそうなのでこれを使う。

PythonでBigqueryを操作

PythonでBigqueryを操作

Bigqueryのテーブル作成→サービスアカウント作成→PythonでBigquery操作

BigqueryはGoogle Cloud Platform(GCP)の提供するデータベース。
Pythonでquery操作してデータ取得できると便利なので実験。

PythonでGoogle Cloud Storageを操作

PythonでGoogle Cloud Storageを操作

GCSバケット作成→サービスアカウント作成→PythonでGCS操作

Google Cloud Storage(GCS)はGoogle Cloud Platform(GCP)の提供するストレージサービス。
AWSでいうところのS3。

Pythonでファイル操作できると便利なので実験。

日本語音声認識API主要5社比較

日本語音声認識API主要5社比較

5種類の音声認識APIを性能評価して比較

音声認識技術によって音声から文字起こししたい。
既存のAPIが複数あるため実験により性能を比較した。

基本情報↓


名前対応フォーマット無料枠料金備考
Microsoft Azure
Speech-to-Text
wav, ogg5時間/月1ドル/1時間
AWS
Amazon transcribe
wav, ogg, flac, mp3 など60分/月1.44ドル/1時間課金対象は1秒単位
Google Cloud
Speech-to-Text
wav, ogg, flac, mp3 など60分/月1.44ドル/1時間課金対象は15秒切り上げ
アドバンスト・メディア
AmiVoice
wav, flac, mp3 など60分/月99円/1時間課金対象は音声データ中の発話区間のみ
Apple
SpeechFramework
m4a1000リクエスト/1時間無料iOS
iPadOS
macOS限定

認識精度↓


実験対象Microsoft AzureAWSAmiVoiceGoogleApple
全部92.31%89.18%83.57%82.86%89.67%
ナレーション93.63%90.35%85.63%85.22%89.22%
セリフ90.78%87.83%81.21%80.14%90.19%
男性94.58%91.44%90.03%86.13%90.79%
女性89.97%86.85%76.92%79.49%88.52%

最も認識精度が高いのは「Microsoft Azure」。
安いのは「AmiVoice」。
AppleはiOSアプリなどに組み込んで使用する形式で使いづらいが無料。

最も精度の良かった「Microsoft Azure」の音声認識APIの使い方は以下の記事に記している。

以降、実験の詳細を記す。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×