【no.393】ポーカーの複数人対戦でAIがプロに圧勝、初の快挙が世界にもたらすインパクト

ポーカーの複数人対戦でAIがプロに圧勝、初の快挙が世界にもたらすインパクト

ポーカーで最も上級者向けとされる「ノーリミット・テキサスホールデム」の複数人対戦で、人工知能AI)が初めてプロに圧勝した。この米大学とフェイスブックの研究者が共同開発した技術の応用範囲は広く、自律走行車の行動予測や不正検出アルゴリズムの改良、そして軍事戦略においても重要な意味をもってくるという。

POKER

JOHN LAMB/GETTY IMAGES

ダレン・エリアスはポーカーを熟知している。彼は32歳にして「ワールドポーカーツアー」で4度の優勝を果たした唯一のプレイヤーであり、これまでに大会で獲得した賞金の総額は700万ドル(約7億5,400万円)を超える。その腕前にもかかわらず、エリアスはこの春、人工知能AI)から新たな学びを得た。

エリアスは、カーネギーメロン大学とフェイスブックの研究者が共同で開発した最新のAIのテストに参加した。エリアスと、もうひとりのプロプレイヤーであるクリス・“ジーザス”・ファーガソンは、それぞれインターネット上で5つのAIとの6人対戦という形式で5,000ゲームを行った。このAIの名は「Pluribus(プルリブス)」という。

その結果はAIの大勝だった。ゲームの最中にエリアスは、あることに気づいた。機械は単調な動きをすると考えられがちだが、Pluribusは典型的なプロプレイヤーより大胆な行動を見せたのだ。「Pluribusは、よくポット(賞金プール)の2~3倍の額をベットするのです。人間はあまりこういう手を打ちません」とエリアスは語る。「この高額なベットには興味を引かれますね。自分の戦術に取り入れてみようと考えています」

このように、Pluribusはベテランのプロプレイヤーが目を見張るような戦術を展開した。しかし、注目されているのはそれだけが理由ではない。実はPluribusは、複数人対戦でノーリミット・テキサスホールデムでトッププレイヤーを破ったのだ。

ノーリミット・テキサスホールデムとはポーカーのなかで最も上級者向けの形式で、これはAIとしては世界初の偉業だ。7月11日付で『サイエンス』誌に掲載された論文では、Pluribusがエリアスやファーガソンと対戦した際の様子や、プロプレイヤー5人を相手にした6人対戦で1万ゲームを行い、たやすく勝利を収めた様子が記述されている。

「Pluribusを人間のプロ5人と試合させれば、Pluribusは5人を打ち負かし、賭け金を巻き上げることになるでしょうね」と、フェイスブックのAI研究所の研究者で、Pluribusの共同開発者であるノーム・ブラウンは語る。「Pluribusはまさにポーカーの世界を代表するような存在になったと言えます」