GPT-4 VS 遊戯王の裁定

GPT-4 VS 遊戯王の裁定

AIに遊戯王の裁定が分かるのか? ChatGPT PLUSで実験

OpenAIから「GPT-4」が公開された。
従来のモデルである「GPT-3.5」に比べてより正確な回答をしてくれるらしい。

ここで誰もが気になる「AIに遊戯王の裁定が分かるのか?」という疑問について実験。
「GPT-4」を使うためにOpenAIに月20ドルを支払う。

AI本人は乗り気だ。



もちろん、遊戯王OCGの裁定についての質問に対してお手伝いできます。どのカードや状況についての質問ですか?具体的な質問を教えていただけると、簡潔にお答えできます。

1. 実験概要

  • 「遊戯王OCGカードデータベース」のQ&Aから回答と質問を入手
  • 「GPT4」と「GPT3.5」にそれぞれ質問
  • 答え合わせ

以上の手順で実験を行う。
せっかくなので「GPT4」だけでなく「GPT3.5」にも質問して性能比較する。

2. 実験

2.1. 初級問題

まずは簡単な質問からスタート。

  1. 自分のデッキが0枚になった場合、その時点でデュエルに敗北しますか?
  • 正解:
    ただちにデュエルに敗北する事はない。ドローを行う際に、デッキが0枚でドローする事ができなかった時に、デュエルに敗北する。
はい、自分のデッキが0枚になった場合はデュエルに敗北します。
不正解×
はい、デッキが0枚になった場合、デッキからドローできず、その時点でデュエルに敗北します。
正解〇

さっそく意見が分かれた。
「GPT-3.5」くんは明らかに間違いだとして「GPT-4」くんの回答も怪しい。
「ドローできず」に触れているのでおまけで正解とする。

  1. モンスターゾーンに裏側表示で存在するモンスターに装備魔法カードを装備させる事はできますか?
  • 正解:
    装備できない。
はい、裏側表示で存在するモンスターに装備魔法カードを装備させることはできます。
不正解×
いいえ、裏側表示のモンスターに装備魔法カードを装備させることはできません。
正解〇

「GPT-4」くん正解。
これくらいは答えてほしい。

  1. デュエル中に、墓地のカードの順番を入れ替える事はできますか?
  • 正解:
    できない。
いいえ、デュエル中に墓地のカードの順番を入れ替えることはできません。
正解〇
いいえ、デュエル中に墓地のカードの順番を入れ替えることはできません。
正解〇

両者正解。
一言一句違わず。

  1. 自分のライフポイントが8000の時、「治療の神 ディアン・ケト」など、自分のライフポイントを回復するカードや効果を発動する事はできますか?
  • 正解:
    できる。
はい、自分のライフポイントが8000の時でも、「治療の神 ディアン・ケト」など、自分のライフポイントを回復するカードや効果を発動することはできます。
正解〇
はい、自分のライフポイントが8000でも、自分のライフポイントを回復するカードや効果を発動することができます。
正解〇

両者正解、素晴らしい。

  1. 自分のライフポイントが相手より少なく、「巨大化」の効果によって、攻撃力が倍になるような時に、手札が5枚である場合、「秒殺の暗殺者」の攻撃力はいくつになりますか?
  • 正解:
    2000(攻撃力2000、巨大化により2倍、効果によりマイナス400*5)
「秒殺の暗殺者」の攻撃力は4000になります。
不正解×
「秒殺の暗殺者」の攻撃力は2000になります。(手札5枚 × 200) × 2 = 2000
不正解×

「GPT-4」くんはちゃんと途中式を出してくれてえらい。
おかげで間違っていることが分かる。

2.3. 中級問題

初級問題はおおむね正答してくれた。
少し難易度を上げていく。

  1. デッキを構築する際に、「海」「伝説の都 アトランティス」「忘却の都 レミューリア」をそれぞれ3枚ずつデッキに入れる事はできますか?
  • 正解:
    同名カードとして扱うため合計で3枚までしか入れられない。
いいえ、禁止カードとなっているため、デッキに入れることはできません。
不正解×
いいえ、それぞれ3枚ずつデッキに入れることはできません。それらのカードはフィールド魔法カードであり、同名カードはデッキに最大3枚までしか入れられません。
正解〇

「GPT-3.5」くんの地元では「海」が禁止されているらしい。
「海竜神-リバイアサン」の制圧力を恐れたか。

「GPT-4」くんは何も間違ったことを言っていないのに不安を感じる回答。
「それらのカードはフィールド魔法カードであり、」が無ければ問題なかったが、まあ間違ってないから正解。

  1. 「増殖するG」の効果適用中に、ペンデュラム召喚によって、2体のモンスターを同時に特殊召喚した場合、「増殖するG」の効果でドローできる枚数は何枚になりますか?
  • 正解:
    1枚。同時に1度だけ特殊召喚されるため。
「増殖するG」の効果でドローできる枚数は2枚になります。
不正解×
「増殖するG」の効果でドローできる枚数は1枚です。ペンデュラム召喚は一度に複数体召喚するため、1回の効果発動とみなされます。
正解〇

「GPT-4」くん解説まで含めて完璧。
これが分かるとは思わなかった。

  1. 自分のライフポイントが125の状況で「ダイノルフィア・インタクト」を発動・適用したのち、攻撃力100の相手モンスターの直接攻撃によって自分が戦闘ダメージを受けた場合、自分のライフポイントはどのように変化しますか?
  • 正解:
    125 → 63 → 31
    125→63(「ダイノルフィア・インタクト」のコスト:半減切り上げ)→31(戦闘ダメージ:「ダイノルフィア・インタクト」の効果により現在のライフの半分四捨五入の32ダメージ)
「ダイノルフィア・インタクト」を発動・適用した場合、自分のライフポイントは250になります。
不正解×
自分のライフポイントは増えません。ダイノルフィア・インタクトの効果で戦闘ダメージが0になります。
不正解×

2023年に登場したカードの質問。
ChatGPTは2023年を知らないので分からなくても仕方がない。

  1. 相手が「デビル・フランケン」のモンスター効果を発動した時、チェーンして手札の「灰流うらら」のモンスター効果を発動できますか?
  • 正解:
    できない。「灰流うらら」の効果は「エクストラデッキ」からの特殊召喚を防げない。
はい、チェーンして手札の「灰流うらら」のモンスター効果を発動することができます。
不正解×
はい、「灰流うらら」のモンスター効果をチェーンして発動できます。
不正解×

両者不正解。
問題を理解したうえで間違えたのか、分からなくて適当に肯定したのか気になる。

  1. 「エフェクト・ヴェーラー」のモンスター効果が適用されているモンスターを対象として、セットされている「無限泡影」を発動できますか?
  • 正解:
    できない。既に効果が無効になっているモンスターの効果を無効にすることはできない。
いいえ、対象となっているモンスターの効果が無効化されているため、「無限泡影」を発動することはできません。
正解〇
はい、「エフェクト・ヴェーラー」のモンスター効果が適用されているモンスターを対象として、「無限泡影」を発動できます。
不正解×

「GPT-3.5」くん勝利。
下剋上だ。

2.3. 上級問題

既に雲行き怪しいがさらに難易度を上げる。
問題は準備してあるから使わないともったいない。

  1. 4体のモンスターを素材としてリンク召喚された「召命の神弓-アポロウーサ」が③の効果を合計3回発動し、攻撃力が2400ダウンした際に、「月鏡の盾」を装備し、相手モンスターと戦闘を行いました。そのダメージ計算後、攻撃力はどうなりますか?
  • 正解:
    3200になる。「アポロウーサ」の②の効果により元々の攻撃力が3200になっているため。
攻撃力は2800になります。
不正解×
ダメージ計算後、「召命の神弓-アポロウーサ」の攻撃力は1600になります。月鏡の盾は戦闘ダメージを受けた後に元の攻撃力に戻ります。
不正解×

「GPT-4」くん惜しい、2体でリンクしてたら正解だった。
「GPT-3.5」くんの方はもはやどこから出てきた数字か分からない。

  1. 「ブラック・ガーデン」と「邪神ドレッド・ルート」がフィールドにあります。この時、召喚・特殊召喚されたモンスターの攻撃力は元の何分の一になりますか?
  • 正解:
    8分の1になる。
    「ドレッド・ルート」で半減→「ブラック・ガーデン」で半減→何故かまた「ドレッド・ルート」で半減。
「ブラック・ガーデン」と「邪神ドレッド・ルート」がフィールドにあり、攻撃力が元の1/4になります。
不正解×
召喚・特殊召喚されたモンスターの攻撃力は元の1/4になります。(1/2 × 1/2 = 1/4)
不正解×

普通はそうなると思う。
何も悪くない。

  1. 自分フィールドに、表側表示の「スキルドレイン」と、それにより効果が無効化されている「電脳堺狐-仙々」が存在しています。この状況で、自分はその「スキルドレイン」をコストとして墓地へ送って「禁じられた一滴」を発動できますか?
  • 正解:
    発動できない。(と「遊戯王カードデータベース」に書いてある、多分「スキルドレイン」が無くなると「仙々」の永続効果が復活して墓地に送れなくなるから、だけどタイミング的に納得できない)
はい、「スキルドレイン」をコストとして「禁じられた一滴」を発動することができます。
不正解×
いいえ、「スキルドレイン」をコストとして墓地へ送ることはできません。「禁じられた一滴」を発動できません。
正解〇

「GPT-4」くん正解。
人間を超えた、シンギュラリティは近い。

  1. 「御前試合」の効果によって、フィールド上に存在できるモンスターの属性が1種類になった場合、表側表示で存在している「精霊術師 ドリアード」は、墓地に送られますか?
    また、「精霊術師 ドリアード」を特殊召喚する事はできますか?
  • 正解:
    墓地へ送られる。フィールド上の「精霊術師 ドリアード」は複数の属性を持つため。
    特殊召喚できる。手札や墓地の「精霊術師 ドリアード」は1種類の属性のみを持つため。
いいえ、「御前試合」の効果によって、表側表示で存在している「精霊術師 ドリアード」は墓地に送られることはありませんが、特殊召喚することはできません。
不正解×
「精霊術師 ドリアード」は墓地に送られません。また、特殊召喚することも可能です。ただし、「御前試合」の効果によってフィールド上に存在できる属性が1種類に制限されているため、違う属性のモンスターがすでに存在している場合、特殊召喚できなくなります。
不正解×

両者不正解。
さっきより簡単なのに。

  1. 「禁止令」の効果によって、カード名を「封印されしエクゾディア」と宣言した後、手札に、「封印されしエクゾディア」を含む、「封印されし者の左足」等5種類のカードが揃った場合、デュエルに勝利する事はできなくなりますか?
  • 正解:
    勝利できる。「禁止令」では防げない(らしい)。
いいえ、「封印されしエクゾディア」を含む5種類のカードが手札に揃った場合、デュエルに勝利することができます。
正解〇
はい、「禁止令」の効果によって「封印されしエクゾディア」が使用禁止になった場合、手札に5種類のカードが揃ってもデュエルに勝利することはできません。
不正解×

「GPT-3.5」くん勝利。
たまに勝つ。

3. 実験結果

モデル正解率
「GPT-3.5」くん4/15
「GPT-4」くん7/15

「GPT-4」くんの勝利。
「GPT-4」は「GPT-3.5」と比較して正しい回答を返す確率が40%向上したみたいな記事をどこかで読んだが近い結果だ。

キミはAIに勝てたかな?

次回、「GPT-4」の新機能も実験。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×