Google検索ヒット数を取得したい
Google検索で単語を検索したときに表示される
約 00,000 件 (0.00 秒)
のような検索ヒット数を取得したい。
数十個なら手作業でなんとかなるが数千個だと無理。
はじめはスクレイピングしようと思ったがGoogleはガチガチのスクレイピング対策してて難しそう。
調べたところ「Google Custom Search API」を使えばできそうなのでこれを使う。
1. Google Custom Search API 準備
「Google Custom Search API」を使用するための準備。
GCPのアカウントが必要。
- 新しいプロジェクトを作成
「Google Cloud Console」の上部の欄から「新しいプロジェクトを作成」をクリック。
適当な名前を付けて新しいプロジェクトを作成。
https://console.cloud.google.com/
そのまま作成したプロジェクトを選択。
- 「Custom Search API」を有効にする
Custom Search APIのページ(https://console.cloud.google.com/apis/library/customsearch.googleapis.com)
から「Custom Search API」を有効にする。
- API キーを作成
「API とサービス → 認証情報」(https://console.cloud.google.com/apis/credentials)
から「+認証情報を作成」をクリック。
「APIキー」を選択すると下記のようにAPIキーが作成される。
APIキーをあとで使うので控えておく。
「APIキーを編集」のところを押して編集画面へ行く。
- APIキーの編集
IPアドレスの制限。
特定のIPアドレスからしかAPIを使用できないように設定する。
これにより他人にAPIを使用されないようにする。
IPアドレスは適当なサイトで調べられる。
https://minsoku.net/ip_confirmations
APIキーから呼び出せるAPIを制限する。
ここで「Custom Search API」を使えるようにする。
- 検索エンジンの作成
「プログラム可能な検索エンジン」(https://programmablesearchengine.google.com)
から「追加」をクリック。
適当に設定して「作成」。
表示されるスクリプトに「検索エンジンID」が記載されている。
「カスタマイズ」からも調べられる。
「検索エンジンID」はあとで使うので控えておく。
- 検索エンジンの設定
さっき作った検索エンジンから「プログラマティックなアクセス」→「開始する」をクリック。
2. Python コード
上記で取得した
- 「APIキー」
- 「検索エンジンID」
の2つが必要。
2.1. 最低限動くコード
1 | import requests |
これを動かすとquery = "キラッCHU"
にいれた通り、キラッCHUのGoogle検索ヒット数が表示される。
1 | ヒット数 キラッCHU: 191000 |
response['searchInformation']
の中にヒット数以外にもいろいろ情報があるので必要に応じて使う。
2.2. エラー例
1 | "message": "The provided API key has an IP address restriction. The originating IP address of the call () violates this restriction.", |
この辺のメッセージが出たときはIPアドレスの許可がされていない。
「APIキーの編集 」に問題がある、私の場合はIPv6設定に問題があった。
- IPv4だけでなくIPv6も設定する
- 設定してから5分待つ