AIに遊戯王の裁定が分かるのか? ChatGPT PLUSで実験
OpenAIから「GPT-4」が公開された。
従来のモデルである「GPT-3.5」に比べてより正確な回答をしてくれるらしい。
ここで誰もが気になる「AIに遊戯王の裁定が分かるのか?」という疑問について実験。
「GPT-4」を使うためにOpenAIに月20ドルを支払う。
AI本人は乗り気だ。
1. 実験概要
- 「遊戯王OCGカードデータベース」のQ&Aから回答と質問を入手
- 「GPT4」と「GPT3.5」にそれぞれ質問
- 答え合わせ
以上の手順で実験を行う。
せっかくなので「GPT4」だけでなく「GPT3.5」にも質問して性能比較する。
2. 実験
2.1. 初級問題
まずは簡単な質問からスタート。
- 自分のデッキが0枚になった場合、その時点でデュエルに敗北しますか?
- 正解:
ただちにデュエルに敗北する事はない。ドローを行う際に、デッキが0枚でドローする事ができなかった時に、デュエルに敗北する。
さっそく意見が分かれた。
「GPT-3.5」くんは明らかに間違いだとして「GPT-4」くんの回答も怪しい。
「ドローできず」に触れているのでおまけで正解とする。
- モンスターゾーンに裏側表示で存在するモンスターに装備魔法カードを装備させる事はできますか?
- 正解:
装備できない。
「GPT-4」くん正解。
これくらいは答えてほしい。
- デュエル中に、墓地のカードの順番を入れ替える事はできますか?
- 正解:
できない。
両者正解。
一言一句違わず。
- 自分のライフポイントが8000の時、「治療の神 ディアン・ケト」など、自分のライフポイントを回復するカードや効果を発動する事はできますか?
- 正解:
できる。
両者正解、素晴らしい。
- 自分のライフポイントが相手より少なく、「巨大化」の効果によって、攻撃力が倍になるような時に、手札が5枚である場合、「秒殺の暗殺者」の攻撃力はいくつになりますか?
- 正解:
2000(攻撃力2000、巨大化により2倍、効果によりマイナス400*5)
「GPT-4」くんはちゃんと途中式を出してくれてえらい。
おかげで間違っていることが分かる。
2.3. 中級問題
初級問題はおおむね正答してくれた。
少し難易度を上げていく。
- デッキを構築する際に、「海」「伝説の都 アトランティス」「忘却の都 レミューリア」をそれぞれ3枚ずつデッキに入れる事はできますか?
- 正解:
同名カードとして扱うため合計で3枚までしか入れられない。
「GPT-3.5」くんの地元では「海」が禁止されているらしい。
「海竜神-リバイアサン」の制圧力を恐れたか。
「GPT-4」くんは何も間違ったことを言っていないのに不安を感じる回答。
「それらのカードはフィールド魔法カードであり、」が無ければ問題なかったが、まあ間違ってないから正解。
- 「増殖するG」の効果適用中に、ペンデュラム召喚によって、2体のモンスターを同時に特殊召喚した場合、「増殖するG」の効果でドローできる枚数は何枚になりますか?
- 正解:
1枚。同時に1度だけ特殊召喚されるため。
「GPT-4」くん解説まで含めて完璧。
これが分かるとは思わなかった。
- 自分のライフポイントが125の状況で「ダイノルフィア・インタクト」を発動・適用したのち、攻撃力100の相手モンスターの直接攻撃によって自分が戦闘ダメージを受けた場合、自分のライフポイントはどのように変化しますか?
- 正解:
125 → 63 → 31
125→63(「ダイノルフィア・インタクト」のコスト:半減切り上げ)→31(戦闘ダメージ:「ダイノルフィア・インタクト」の効果により現在のライフの半分四捨五入の32ダメージ)
2023年に登場したカードの質問。
ChatGPTは2023年を知らないので分からなくても仕方がない。
- 相手が「デビル・フランケン」のモンスター効果を発動した時、チェーンして手札の「灰流うらら」のモンスター効果を発動できますか?
- 正解:
できない。「灰流うらら」の効果は「エクストラデッキ」からの特殊召喚を防げない。
両者不正解。
問題を理解したうえで間違えたのか、分からなくて適当に肯定したのか気になる。
- 「エフェクト・ヴェーラー」のモンスター効果が適用されているモンスターを対象として、セットされている「無限泡影」を発動できますか?
- 正解:
できない。既に効果が無効になっているモンスターの効果を無効にすることはできない。
「GPT-3.5」くん勝利。
下剋上だ。
2.3. 上級問題
既に雲行き怪しいがさらに難易度を上げる。
問題は準備してあるから使わないともったいない。
- 4体のモンスターを素材としてリンク召喚された「召命の神弓-アポロウーサ」が③の効果を合計3回発動し、攻撃力が2400ダウンした際に、「月鏡の盾」を装備し、相手モンスターと戦闘を行いました。そのダメージ計算後、攻撃力はどうなりますか?
- 正解:
3200になる。「アポロウーサ」の②の効果により元々の攻撃力が3200になっているため。
「GPT-4」くん惜しい、2体でリンクしてたら正解だった。
「GPT-3.5」くんの方はもはやどこから出てきた数字か分からない。
- 「ブラック・ガーデン」と「邪神ドレッド・ルート」がフィールドにあります。この時、召喚・特殊召喚されたモンスターの攻撃力は元の何分の一になりますか?
- 正解:
8分の1になる。
「ドレッド・ルート」で半減→「ブラック・ガーデン」で半減→何故かまた「ドレッド・ルート」で半減。
普通はそうなると思う。
何も悪くない。
- 自分フィールドに、表側表示の「スキルドレイン」と、それにより効果が無効化されている「電脳堺狐-仙々」が存在しています。この状況で、自分はその「スキルドレイン」をコストとして墓地へ送って「禁じられた一滴」を発動できますか?
- 正解:
発動できない。(と「遊戯王カードデータベース」に書いてある、多分「スキルドレイン」が無くなると「仙々」の永続効果が復活して墓地に送れなくなるから、だけどタイミング的に納得できない)
「GPT-4」くん正解。
人間を超えた、シンギュラリティは近い。
- 「御前試合」の効果によって、フィールド上に存在できるモンスターの属性が1種類になった場合、表側表示で存在している「精霊術師 ドリアード」は、墓地に送られますか?
また、「精霊術師 ドリアード」を特殊召喚する事はできますか?
- 正解:
墓地へ送られる。フィールド上の「精霊術師 ドリアード」は複数の属性を持つため。
特殊召喚できる。手札や墓地の「精霊術師 ドリアード」は1種類の属性のみを持つため。
両者不正解。
さっきより簡単なのに。
- 「禁止令」の効果によって、カード名を「封印されしエクゾディア」と宣言した後、手札に、「封印されしエクゾディア」を含む、「封印されし者の左足」等5種類のカードが揃った場合、デュエルに勝利する事はできなくなりますか?
- 正解:
勝利できる。「禁止令」では防げない(らしい)。
「GPT-3.5」くん勝利。
たまに勝つ。
3. 実験結果
モデル | 正解率 |
---|---|
「GPT-3.5」くん | 4/15 |
「GPT-4」くん | 7/15 |
「GPT-4」くんの勝利。
「GPT-4」は「GPT-3.5」と比較して正しい回答を返す確率が40%向上したみたいな記事をどこかで読んだが近い結果だ。
次回、「GPT-4」の新機能も実験。