【no.375】画像内のオブジェクトを自然に置き換えるAIをMITとIBMが開発

画像内のオブジェクトを自然に置き換えるAIをMITとIBMが開発

画像の中から指定の被写体を認識したり、その領域を自動で切り抜いたりといったことは、すでに画像編集ソフトや、スマートフォンのカメラアプリで実現していますが、そこからさらに進んで、オブジェクトを置き換えるなど自然な編集を行うAIが登場しました。

MITとIBMの研究者チームは、AIを用いて写真などの画像の中に、自然な形で他のオブジェクトを埋め込んだり、消したりできるツールを作成しました。現在、GANpaint Studioとしてオンラインデモが公開されています。

AIの学習にはGAN(敵対的生成ネットワーク)が用いられています。これは、生成ネットワークと識別ネットワークの2つのネットワークを使い、それ自身に学習をさせるというもの。

たとえば、生成ネットワークが猫の画像を生成し、識別ネットワークはそれが猫であるかどうかを判定。生成ネットワークは、識別ネットワークに本物だと判定させるためにより精度の高い画像を生成するよう学習し、識別ネットワークは、より正確に判定するために学習を行います。

GANにより学習したAIは、木や芝生、ドアなどのオブジェクトの種類やサイズを指定し、それを挿入したい箇所を選択すると、元の画像に溶け込むようにそれを配置します。ただし、不自然な形の画像挿入は行いません。たとえば、空に芝生や、地上に雲を描いたりはしないわけです。

興味深いことに、これは研究者が予想していたものではなく、AI自身が物体の配置についての規則性を学習したとのこと。

研究チームの1人で、MITの学生であるDavid Bauは、いまのところ、機械学習はブラックボックスであり、常に改善方法が分かっているわけではないと言います。しかし、GANpaint Studioの研究が、ニューラルネットワークとその基礎となる構造を理解するに役立つ可能性があるとしています。

また、この技術を使うことで、編集された偽の画像を識別できる可能性があるとのことです。

GANpaint Studioに関する論文は、8月にロサンゼルスで開催されるSIGGRAPHのカンファレンスで発表される予定です。