【no.399】「わざと負けようとしても無理」と話題　プロも挑戦する“世界最弱のオセロAI”、生みの親に聞く開発の裏話 (1/2)

「わざと負けようとしても無理」と話題　プロも挑戦する“世界最弱のオセロAI”、生みの親に聞く開発の裏話 (1/2)

「負けられるなら負けてみてくれ！」――。AIの開発やAI人材の育成を手掛けるベンチャー「AVILEN」（東京都千代田区）は7月25日に、強化学習を使ってAIを極限まで弱くしたブラウザゲーム「最弱オセロ」をリリースした。AIが対局中に「あえて角を取らない」「石を少なく取る」といった行動を取り続けるため、人間は負けることが難しいのが特徴だ。このゲームを開発した、AVILENの吉田拓真CTO（最高技術責任者）は、Twitter上で「世界最弱」とその弱さをアピールする。

どう頑張っても、角を取るよう誘導される

人気YouTuberのはじめしゃちょーさんが動画で紹介したこともあり、リリースから2週間で約100万回プレイされたが、AIの勝ちはわずか約3000回。オセロのプロではない一般人はどんな工夫をしても負けられず、ネット上では「あまりにも弱い」「わざと負けようとしても無理」と話題になっている。筆者も挑戦してみたが、何度やっても角を取るよう誘導され、圧勝させられてしまった。

吉田CTOは、このゲームを開発した背景について「大学生だった2年半前に、趣味と勉強を兼ねて約半年間で作りました。使用言語は『C＋＋』のみです。その後はしばらく放置していましたが、ふと『Web上で公開して遊んでもらおう』と考え、少し調整してリリースしました。ユーザー数は100人くらいを想定していたので、反響には驚いています」と話す。

AlphaGoのオセロ版を目指していた

AVILENは20代の若手を中心としたベンチャーで、吉田CTOも東京大学大学院を休学して参加している。化学を専攻していたものの、プログラミングにはまったという吉田CTOは2017年ごろ、世界最強クラスの棋士を続々と打ち破っていた囲碁AI「AlphaGo」に興味を持ち、好きなオセロで再現したいと考えた。

「AlphaGoは、人間の脳を模した『ニューラルネットワーク』というアルゴリズムや、自分自身と対局を繰り返すことで強くなる強化学習の手法を採り入れています。これらの技術に興味を持ち、AlphaGoのオセロ版を作ろうと決め、勉強を始めました。最初は人間よりも強いAIを目指していました」（吉田CTO、以下同）

自分ならもっと弱くできる

そんな吉田CTOが「弱いAIをつくりたい」と思い立ったきっかけは、YouTubeやニコニコ動画でとある動画を目にしたことだった。その動画は、投稿者が「わざと負けようとするオセロ用AI」を構築し、人間と戦わせてみるという内容だった。

吉田CTOはそのコンセプトに引かれたものの、動画ではAIが勝つケースがやや多かったため、「自分ならもっと弱くできる」と開発を決意。ニューラルネットワークや強化学習を使って、自分の手でとことん弱いAIを作ることにした。

「コードの内容を言葉で説明すると、私が参考にした動画の投稿者は、オセロを『石を多く取った方が勝ち』と定義した上で、最も悪い手を打つようにAIを設計していました。一方私は発想を変え、『石を少なく取った方が勝ち』というルールの中で、最も良い手を打つAIを作りました」

設計の工夫もあり、吉田CTOが開発したAIは、自分自身との対局を繰り返す中でどんどん弱くなっていった。「最弱オセロ」は現在、角の1～2つ隣のマスに積極的に石を置いたり、「石が密集しているが、1マスだけ空いている」といった状況をつくったり――といった戦法をよく使うが、これらは他のAIにはみられない動きだという。