【no.378】進化する倉庫ロボット、レジなし店舗–アマゾンに聞くAIと自動化の未来

進化する倉庫ロボット、レジなし店舗–アマゾンに聞くAIと自動化の未来

英語で「照明を点けて」(turn the lights on)というフレーズが「テンダーロイン」(tenderloin)という言葉と同じように耳に聞こえるのは偶然のことだ。だが、そうした一見重要ではなさそうに思える音のつながりは、Amazonの「Alexa Shopping」チームにとって早期の課題となった。Amazonは、照明を点けようとしているだけのユーザーに肉を届けて驚かせることは何としても避けたいと考えたからだ。

そこで、同社は音声コマンドのランキングシステムを考案し、使用頻度の高い、照明に関するリクエストを、頻度の低いテンダーロインに関するリクエストよりも上位に位置付けた。このシステムに磨きをかけるために、同社はAlexaにもコンテキスト認識機能を持たせ、会話の話題がスマートホームの制御ではなく食料品であるかどうかをAlexaが判別できるようした。

Amazonのカンファレンス「re:MARS」にて
Amazonのカンファレンス「re:MARS」にて
提供:Ben Fox Rubin/CNET

Alexa Shopping担当バイスプレジデントのChuck Moore氏は、6月にラスベガスで開催されたAmazonの人工知能(AI)とロボット工学に関するカンファレンス「re:MARS」で筆者に対し、次のように語った。「われわれはユーザーの会話のコンテキストを特定した後、そのコンテキスト内でランク付けを行い、ユーザーが実際に言った言葉が『テンダーロイン』であることを認識する」

この精密な音声認識処理は、倉庫のロボット、レジ係のいない小売店、そしてもちろんAlexaなど、自社事業のほぼすべての層にAIに関する専門知識と自動化を組み入れようとするAmazonの取り組みの一環だ。ユーザーの目に触れないこうした裏側のテクノロジーはすでに、Amazonの顧客に対してより短時間での配達を提供し、買い物リストの作成や牛乳の購入など、人々の雑事を効率的に処理するのに役立っている。

Amazonによる新しい倉庫向けロボットのデザイン
Amazonがre:MARSで披露した、新しい倉庫向けロボットのデザイン
提供:Ben Fox Rubin/CNET

Amazonは、AIにリソースを投入している多くの大手テクノロジー企業の1つにすぎない。AIを利用することで、コンピューターやボットは意思決定や顧客のニーズの予測といった、より高度なタスクを実行できる。AIは私たちの生活を一変させ、向上させることができる、とMicrosoftやGoogle、Apple、Facebookも宣伝している。

re:MARSで、米CNETはAmazonのさまざまな事業を統括する4人の幹部に話を聞いた。彼らはAmazon社内でのAI開発の仕組みの一部について、特別に情報を教えてくれた。そして、AIがいかにして、同社にとってWalmartのようなライバルの小売業者やMicrosoft、Googleのようなクラウドサービスプロバイダーと競うための極めて重要な要素となったかについて、経緯を説明してくれた。

【no.377】アイデア出しまくるAI”を開発、博報堂が考える「創造力の限界突破」

アイデア出しまくるAI”を開発、博報堂が考える「創造力の限界突破」

人間がAI(人工知能)よりも優れているのは「創造力」である――そのような考えを持つ人もいますが、果たして本当でしょうか。

例えば2017年4月に行われた、将棋の「電王戦」。プロ棋士の佐藤天彦叡王(当時)と将棋ソフト「PONANZA」(ポナンザ)の対局で、先攻のポナンザは、いきなり「3八金」というあまり見慣れない手を打ちました。しかし、その後に「中住まい」と呼ばれる強固な守りを築き、結果的に自然な展開になっていったのです。この打ち筋を想定できていた人はどれだけいたでしょうか。

こうした「常識では思いつかない発想」は、将棋に限らずさまざまな領域に広がってきています。例えば、ビジネスの現場でも私たちは日々「斬新なアイデア」を求められます。「そんなに毎日新しいビジネスアイデアなんて思いつかないよ。それこそ、代わりにAIが考えてくれよ」と思ったことは一度や二度ではありません。

AIと創造性をめぐる議論は、この連載でも何度か取り上げてきました。

上記の対談で紹介した電通のAIコピーライター「AICO」などは、コピーライターの仕事をサポートするクリエイティブツールの1つです。

最近では博報堂とシステム開発のTISが、企画担当者のアイデア出しを支援するサービス「AIブレストスパーク」を共同開発しました。博報堂が培った知見を基に、アイデアやコンセプトのきっかけとなるワードやフレーズを大量に自動生成してくれます。

AIAIブレストスパーク」(公式サイトより)

「発想する」「アイデアを出す」という領域は人間にしかできないように思いますが、AIはどのように人間をサポートしてくれるのでしょうか。AIブレストスパークの開発担当者に話を聞きました。

【no.376】ディープラーニングを超える汎用AIツール「Gen」を開発、MIT

ディープラーニングを超える汎用AIツール「Gen」を開発、MIT

マサチューセッツ工科大学(MIT)の研究チームは、2019年6月下旬に米アリゾナ州フェニックス市で開催されたカンファレンス「Programming Language Design and Implementation」で、新しい確率的プログラミングツール「Gen」に関する論文を発表した。

Genを使えば、初学者でも簡単に人工知能(AI)に触れることができ、専門家は高度なAIプログラミングが可能になる。Genユーザーは方程式を扱ったり、高度なコードを記述したりすることなく、コンピュータビジョンやロボット工学、統計など、AIが適用されるさまざまな分野のモデルやアルゴリズムを作成できる。専門研究者であれば、Genを用いてこれまで実現できなかった、予測タスクに使われる洗練されたモデルや推論アルゴリズムを作成できる。

研究者は論文で、3次元空間内のヒトの姿勢を(不十分なデータから)推論する短いGenプログラムを紹介した。これはコンピュータビジョンにおける難しい推論タスクだ。この問題を容易に解くことができれば、自律システムや人と機械のやりとり、拡張現実(AR)などに応用しやすくなる。

Genは、グラフィックス描画やディープラーニング、ある種の確率シミュレーションを実行するコンポーネントを含んでいる。こうした多様な技術の組み合わせが、推論タスクの高い精度と、処理速度の改善につながっている。

Genのアーキテクチャ(左)と一般的な確率的プログラミングアーキテクチャ(右端)の違い(出典:Gen: a general-purpose probabilistic programming system with programmable inference

研究者によれば、シンプルであること、さらに場合によっては自動化のおかげで、初心者から専門家まで、誰でもGenを容易に利用できる。

「Genを開発した動機の一つは、コンピュータ科学や数学の専門知識が少ないユーザーでも、自動AIにアクセスできるようにすることだった。さらにわれわれは、専門家が簡単かつ迅速に、AIシステムの反復開発やプロトタイピングを行えるようにすることも目指している」(MITのElectrical Engineering and Computer Scienceで博士課程に所属するMarco Cusumano-Towner氏)

【no.375】画像内のオブジェクトを自然に置き換えるAIをMITとIBMが開発

画像内のオブジェクトを自然に置き換えるAIをMITとIBMが開発

画像の中から指定の被写体を認識したり、その領域を自動で切り抜いたりといったことは、すでに画像編集ソフトや、スマートフォンのカメラアプリで実現していますが、そこからさらに進んで、オブジェクトを置き換えるなど自然な編集を行うAIが登場しました。

MITとIBMの研究者チームは、AIを用いて写真などの画像の中に、自然な形で他のオブジェクトを埋め込んだり、消したりできるツールを作成しました。現在、GANpaint Studioとしてオンラインデモが公開されています。

AIの学習にはGAN(敵対的生成ネットワーク)が用いられています。これは、生成ネットワークと識別ネットワークの2つのネットワークを使い、それ自身に学習をさせるというもの。

たとえば、生成ネットワークが猫の画像を生成し、識別ネットワークはそれが猫であるかどうかを判定。生成ネットワークは、識別ネットワークに本物だと判定させるためにより精度の高い画像を生成するよう学習し、識別ネットワークは、より正確に判定するために学習を行います。

GANにより学習したAIは、木や芝生、ドアなどのオブジェクトの種類やサイズを指定し、それを挿入したい箇所を選択すると、元の画像に溶け込むようにそれを配置します。ただし、不自然な形の画像挿入は行いません。たとえば、空に芝生や、地上に雲を描いたりはしないわけです。

興味深いことに、これは研究者が予想していたものではなく、AI自身が物体の配置についての規則性を学習したとのこと。

研究チームの1人で、MITの学生であるDavid Bauは、いまのところ、機械学習はブラックボックスであり、常に改善方法が分かっているわけではないと言います。しかし、GANpaint Studioの研究が、ニューラルネットワークとその基礎となる構造を理解するに役立つ可能性があるとしています。

また、この技術を使うことで、編集された偽の画像を識別できる可能性があるとのことです。

GANpaint Studioに関する論文は、8月にロサンゼルスで開催されるSIGGRAPHのカンファレンスで発表される予定です。

【no.374】AI関連発明の特許出願状況を調査しました

AI関連発明の特許出願状況を調査しました

特許庁は、近年注目されているAI(Artificial Intelligence;人工知能)関連発明の特許出願について、国内外の状況を調査しました。

1.背景

深層学習(ディープラーニング)を中心としたAI技術の発展に伴い、AI関連発明(※1)の特許出願に対する関心が高まっています。そこで特許庁は、AI関連発明の特許出願について、国内外の状況を調査しました。

※1 AIのコア技術に関する発明(国際特許分類G06Nに対応するもの)に加え、AIを各技術分野に適用した発明を含めたもの。

2.調査結果概要

(1)AI関連発明の国内特許出願件数は、第三次AIブームの影響で2014年以降急増しており、2017年は約3,100件(前年比約65%増)でした。そのうち、AIのコア技術に関する出願は、約900件(前年比約55%増)でした。

図1 AI関連発明の国内特許出願件数の推移

(2)近年のAI関連発明に用いられている主要な技術は機械学習です。その中でも深層学習(ディープラーニング)に言及する出願は2014年以降急増しており、2017年の国内のAI関連発明の特許出願は、約半数が深層学習に言及するものです。

図2 深層学習に言及するAI関連発明の国内特許出願件数の推移

(3)AIの適用分野としては、画像処理や情報検索・推薦、ビジネス関連、医学診断分野が目立っています。また、近年は特に制御・ロボティクス分野への適用が増加しています。

図3 AI関連発明の適用分野の推移(2017年の出願件数を表記)

(4)AIのコア技術に関する出願は、五庁(日本、米国、欧州特許庁、中国、韓国)及びPCT国際出願(※2)のいずれにおいても増加傾向であり、中でも米国と中国の出願件数は突出しています。
※2 1つの出願願書を条約に従って提出することによって、PCT加盟国であるすべての国に同時に出願したことと同じ効果を与えるもの。

図4 五庁及びPCT国際出願における、AIのコア技術に関する出願件数の推移
(JP:日本、US:米国、EP:欧州特許庁(EPO)、CN:中国、KR:韓国、WO:PCT国際出願(出願人国籍問わず))

【no.373】「AIウイスキー」「AI俳句」も可能、人工知能が“発想と開発”を劇的に変える

「AIウイスキー」「AI俳句」も可能、人工知能が“発想と開発”を劇的に変える

新商品開発に人工知能(AI)を導入することで、AIと協働して新たなアイデアを生み出すことはできないだろうか。たとえば、新たな商品をAIから提案されたらどうだろう。消費者の好み、ニーズ、これまでの販売数を加味し、その傾向を踏まえた商品を開発するのだ。我々は提案された多様な商品から選択し、さらにその上で創造力を発揮することにより、これまで以上に受け入れられる商品を生み出せるかもしれない。

武蔵野大学 データサイエンス学部 データサイエンス学科長 准教授 中西 崇文

photo

商品開発をAIと進めるようにするとどんなことができるだろうか

(Photo/Getty Images)

AIが考え出す新しいウイスキー

スウェーデンのウイスキー会社マックミラは、米マイクロソフトやフィンランドのコンサルティングファーム フォーカインドと連携して、新たなウイスキーを機械学習によって考案する「AIウイスキー」の提供を開始した。

ウイスキー作りといえば、樽の状態や形、その配列、原酒やブレンドの方法など、その組み合わせにより、さまざまな個性を持った酒が生み出せることで知られる。新しいウイスキーを完成させるには、専門家や熟練した職人の知識、勘やコツが必要になることが多いのだ。

そのような専門家とAI連携して新たなウイスキーを考案することにどんな意義があるだろうか。AIウイスキーでは、既存の味や樽の組み合わせ、消費者の好み、販売数などを機械学習にかけることで、7000万件以上のレシピを自動生成した。この中から専門家や熟練職人が最適なウイスキーを選び出す作業を担っている。

AIが新商品開発に参加する意義

画像

AIウイスキーが示す、商品開発分野におけるAIの可能性とは

(Photo/Getty Images)

7000万件以上のレシピから専門家や熟練職人が選び出す作業はいかにも大変そうだ。逆に作業が増えてしまうのではないか。

専門家や熟練した職人は、過去の経験に基づいた知識、勘やコツから、どのような組み合わせがどのような味になるのかだいたい予測がつくのだそうだ。そのため、過去に発売したことのあるラインアップに近い味だけど新しいものを作りたい場合に役立つのだという。

過去に発売したラインアップから、共通の樽の状態や形や配列、原酒やブレンドの方法などの項目について、7000万件から「絞り込み検索」をかける。絞り込まれた中から発想できなかったような組み合わせを選べば、「これまでのラインアップに近いけれど新しい味」を簡単に選択できるというわけだ。

そのように選ばれたレシピを専門家や熟練した職人によって検証していけば、一から樽の状態や形や配列、原酒やブレンドの方法の組み合わせを考えるよりも簡単に新しい味にたどり着くことができる。

つまり、AIを利用することで消費者の好み、販売数などの制約条件から「新たな味」を膨大に生み出すことができる。それを発想の源として人間が最終的に新たなウイスキーの味を決めるのだ。

AIウイスキーにより、人間では考えつかないレシピが生まれ、既存のメニューの改善に生かせれば、製品開発のスピードが上がる可能性もある。製品の改良が進めば既存のウイスキーファンの満足度も向上し、新たな購買層獲得に寄与できるだろう。

AIによる製品開発を実現できたのはウイスキーには限らない。ウイスキーのブレンドなど「組み合わせ」によりその性質が決まるような製品やサービスなら応用される可能性が十分ある。

ここで注目したいのは、AIウイスキーが生み出した「レシピ数」である。7000万件というレシピ数は、人間には到底出せない。AIは制約条件を満たす解を大量に列挙するような「創造」は非常に得意だ。ただ、先ほど述べた通り、現状のAIでは大量に生み出したアイデアの中から「どれがよいか」を判断する機能を実現することは難しい。

このような「創造性を発揮するAI」を有効活用するには何が必要なのだろうか。他のAIなどとの比較から考察しよう。

【no.372】【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI

【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI

AI(人工知能)は遠い存在ではない。普段身近に使っているソフトウエアやWebサービスにも組み込まれており、誰もが利用している。そうした身近な技術を見直すことで、AIで何が実現でき、どんな新ビジネスを生み出せるかも見えてくる。AIの広がりについて、博士が新人の助手に指南する。

身近に利用しているAIの代表と言えば、迷惑メールの自動振り分け機能。ベイズ推定といわれるAIの一種が使われている
身近に利用しているAIの代表と言えば、迷惑メールの自動振り分け機能。ベイズ推定といわれるAIの一種が使われている
[画像のクリックで拡大表示]
【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

柔裸瑠(にゅうらる)博士
クロトレ大学教授。コンピューターの黎明(れいめい)期からAI一筋で研究をしてきた。最近ついに還暦を迎える。昔は鬼博士と呼ばれていたが、最近は丸くなってきた。 

【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

助手のアミ
ある中堅ベンチャー企業で社長秘書をやっていたが、まったく新しい道を進もうと、クロトレ大学の助手として転職してきた。学生のころから数学や理科系は苦手。

 

【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

AIってとても広い概念なんだね。ディープラーニングだけがAIじゃないんだと分かったよ。

 

【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

うん、それはよかった。AIっていうと最新技術のようじゃが、いわゆる機械学習はすでにいろんな場面で使われているのじゃ。

 

【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

えー。そうなんだあ。例えばどんなところ?

 

【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

前回も紹介したが、迷惑メールの識別、ネット通販でのレコメンデーションとか、デジタルカメラの顔認識が代表的じゃ。

 

【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

ディープラーニングも実用化されているの?

 

【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

うん。身近なものでは、機械翻訳がそうじゃな。「Google翻訳」のようにディープラーニングを活用することで、より自然な翻訳を実現しているサービスがあるのじゃ。

 

メールの言葉解析で「迷惑」スコアを診断

前回は、AIの歴史や分類の仕方について解説した。今回は、AIがどんなところに使われているのかを説明しよう。AIの中でも、機械学習は最近登場した技術のように考えてしまいがちだが、実は比較的長い歴史を持つ。さまざまな問題に対処するために、多くのアルゴリズム(問題を解くためのプログラミング上の手法)が考案されてきた。

身近なところでは、迷惑メールの判別、クレジットカードの不正利用の検出、株価予測、郵便の宛先自動認識などに機械学習が導入されている。

迷惑メールの判別には、ベイズ推定という理論に基づくベイジアンフィルターを使う。このベイズやベイジアンとは何だろうか。ちょっとだけ詳しく紹介しよう。

ベイズ推定のもととなっているベイズの定理は、1700年代の数学者トーマス・ベイズが提唱したもの。ある観測結果を得ることで、別の事象が起こる確率が変わるときに、成り立つ定理である。これによって最終的な結果を推定する。

例えば、街中を次に通る人が男性か女性かという問題を考える。何も情報がなければ、確率は50%ずつだと予想される。その街が秋葉原である、あるいは男子校が近くにある、という情報を事前に得ているなら、男性である確率が高いと考える人が多いだろう。また、男性が1人通過し、その次も男性が通過したという情報を加味すれば、男性が通る確率が更新されて、さらに高くなると推定できる。

【no.371】中国のAIファッションデザイナー、「DeepVogue」の実力

中国のAIファッションデザイナー、「DeepVogue」の実力

気になる服の写真を撮影してウェブ上に投稿すると、人工知能(AI)が該当商品やおすすめを提案する──。ファッション業界では、そのような画像認識技術を応用したサービスが実用化されてきた。これはユーザーの検索やショッピングをサポートする技術のひとつだが、今後はAIがファッション業界においてより中心的な役割を果たしていくかもしれない。

中国でDeepBlue Technologyというスタートアップが注目を浴びている。2014年に上海を拠点に設立され企業で、服をデザインするAI「DeepVogue」を開発している。

DeepBlue Technologyは、先ごろ開催された「中国ファッションデザイン革新大会」に参加。約50名の審査員が見守るなか、16チーム中2位の成績を上げた。同大会は、中国服装協会と上海ファッション都市推進センターが共同で主催した大々的なイベントで、フランスのESMOD、ヨーロッパ・デザイン学院(Istituto Europeo di Design)、 北京服装学院(Beijing Institute Of Fashion Technology)、清華大学美術学院、香港理工大学などファッション名門学校が参加チームとして名を連ねていた。

DeepBlue Technologyの“AIデザイナー”が生み出した作品は、審査員から高い評価を受けた。中国ファッション業界の開拓者として呼ばれるMark Cheung氏は、DeepVogueがデザインした作品は、国際的なファッションショーのランウェイに登場してもおかしくないと賛辞を送っている。

他の審査員たちも、人工知能がデザイナーを完全に代替することは難しいかもしれないが、ビックデータを活用しユーザーの美的感覚をデザインに落とし込むというアプローチには未来的な展望があると評価した。

DeepBlue Technologyは、4月に開催された「アジア太平洋地域・知識発見およびデータマイニング学術界」(PAKDD 2019)の「Automatic Machine Learning Challenge」でも優勝を果たしている。同大会には、北京航空宇宙大学、清華大学など中国の代表する研究チームが参加していた。

なおDeepBlue Technologyは、ファッションに特化したAI企業というわけではない。今後、スマートロボット、自動車、流通、セキュリティ、スマートシティなど、より広範に自社のAIを実装していく計画だとしている。中国では、センスタイムやアイフライテックなど世界的な知名度を誇るAI企業があるが、DeepBlue Technologyもその一角となるか注目したい。

【no.370】表情を読み取る「AIお姉さん」が画面から話しかけてくる

表情を読み取る「AIお姉さん」が画面から話しかけてくる

2019年6月末、モニター画面から話しかけてくる等身大のAI(人工知能)エージェントを街角に置く実証実験が行われる。ユーザーが「この近くに授乳室はある?」と聞くと「(最寄りの商業施設の名前である)トリエA館の4階にあります」と回答してくれる。あるいは「ところで私、みなさんに楽しんでもらうため、いろんなクイズを用意しました。どうでしょう。私とクイズを、やってみますか?」と自ら話題を振ってくる。

「レイチェル」の様子。デジタルサイネージのモニター画面にほぼ等身大の人型として映し出される

この実証実験でモニター画面(デジタルサイネージ)から語りかけてくるのは、スタートアップ企業のクーガー(東京・渋谷区)が開発を進めてきたバーチャル・ヒューマン・エージェント(VHA)「レイチェル」である。表情を備えた顔、身振りによる表現ができる体を備え、通行客に話しかけ、表情を読み取りながら対話する。

実証実験の日程は2019年6月29日〜30日、場所は京王線調布駅近くの商業施設「トリエ京王調布 C館」。シネマコンプレックス「イオンシネマ シアタス調布」や、猿田彦珈琲の旗艦店「調布焙煎ホール」などが入居する施設だ。実証実験の実施にあたり、電通国際情報サービスが協力。また街角への設置やコンテンツでは京王電鉄が協力した。

実証実験では「レイチェル」がその場に居合わせる人々を対象に、「感情を表現しながら話しかける」「調布の魅力や周辺情報を伝える」「クイズ形式で、地元で行われるオリンピック競技の知識などを伝える」などのコミュニケーションを試みる。デジタルサイネージ広告の新たな使い方を開拓する狙いがある。実験の結果を受けて、デジタル広告やアミューズメント施設の情報案内などに利用範囲が広がっていく可能性もある。

【no.369】ピザの写真からレシピを推測するAI

ザの写真からレシピを推測するAI

認識した具材から調理方法を逆工程にさかのぼって分析。

機械学習の一種で、ふたつののニューラル・ネットワークが競い合う「敵対的生成ネットワーク(GAN)」を使うと、たとえば存在しないポケモンが生成できたり、逆にニューロンをひとつずつ切りながらAIに人間の顔をイメージングさせるとおどろおどろしい結果を招いたりと、いろんな画像を作ることが出来るようになります。

ですがMITでは、ニューラル・ネットワークを使ってコンピューターにピッツァの作り方を教える研究をしているのだそうです。

その名は「PizzaGAN」計画

その研究の題名は「How to make a pizza: Learning a compositional layer-based GAN model」と呼ばれ、訳すと「ピッツァの作り方:複合的なレイヤベースのGANモデルの学習」となります。これはZDNetがarxiv.orgの論文を取り挙げたもので、総じて「PizzaGAN Project」というプロジェクト名で呼ばれています。

この研究では、作り方ひとつずつの手順を反映した生成モデルを構築することによって、機械にピッツァの作り方を教えます。平たくいうと、ピッツァはチーズや具材のを重ねて作られているので、研究者たちは具材ごとにピッツァの画像を分析し、調理の各段階を認識する方法を機械に教えることにしたのでした。なので具材のないピッツァは1通りにしか認識されません。ですがそこにトッピングや具材を載せていくと、見た目の結果が変わることになります。その見た目の違いを鑑定することで、理論的にニューラル・ネットワークがピッツァを作る手順を逆に追ってリヴァース・エンジニアリングすることが出来るようになるのです。

学習方法

研究者たちはまず、合成データセットのピッツァ画像のクリップアートを、およそ5,500枚作成しました。続いて、Instagramで「#pizza」のハッシュタグを打ち込み、本物の写真を検索。それから好ましくない写真を除外し、最終的に9,213枚ものリアルなピッツァ写真をゲットすることに成功しました。

それから「PizzaGAN」がやったことはふたつ。ひとつ目は、AIにたとえばペパロニなど個別の具材をどのように追加/除去するのかを教え、合成画像を作成しました。次に、別のモデルで出てきたトッピングを検出し、それが置かれている深さを計算することで、調理過程にどのトッピングがいつ現れるのか、その順番を予測しました。なのでもし、マッシュルームとペパロニとオリーヴのピッツァ写真があったとしたら、「PizzaGAN」はその3種を検知できます。そしてマッシュルームが一番上にのっていることがわかれば、それが最後にトッピングされたことを理解するのです。(サイトでは、具材の追加と除去、調理の前後をインタラクティヴに比較できるようになっています)