【no.330】AIで顔や広告を自動生成――サイバーエージェントは学習データをどのように集めたか? (1/2)

AIで顔や広告を自動生成――サイバーエージェントは学習データをどのように集めたか? (1/2)

広告事業を展開するサイバーエージェントは、「細分化が進むターゲティング対象に合わせて大量の広告を作成しなければならない」という課題に対し、バナー画像などの広告をAIで大量生成したり、広告に必要な人物画像を自動生成したりして乗り越えようとしている。

“おいしいデータ”で、成果が出るAIモデルを育てる」第3回は、2019年3月に開催された「SIX 2019」において、サイバーエージェントでインターネット広告事業本部の毛利真崇氏が講演した内容を、要約してお伝えする。

AIモデル開発に利用したいデータが社内に散在

現在、さまざまなサービスで、ユーザーのプロフィールやニーズに合わせた広告を配信する「ターゲティング」が用いられている。検索履歴や位置情報、購買履歴などの個人データを用いたターゲティングの細分化も進んでいる。

サイバーエージェント インターネット広告事業本部 セントラルアカウントデザイン室 & クリエイティブAICG研究所 責任者 毛利真崇氏サイバーエージェント インターネット広告事業本部 セントラルアカウントデザイン室 & クリエイティブAICG研究所 責任者 毛利真崇氏

「従来の広告は、全ユーザーに対して同じ広告を配信していた。しかし、ターゲティング手法の登場と細分化で、ターゲットに合わせて配信する広告を変えるのが当たり前になった。その結果、多くの広告を作成する必要が出てきた」

サイバーエージェントでは、広告作成に必要な画像収集システムを内製して3カ月間に約10万本の広告を作成している。それでも、広告の制作時間の不足に悩まされているという。

そこでサイバーエージェントのクリエイティブAI研究所では、今まで制作してきた広告を学習データにして、広告を自動生成するAIモデルの開発に取り組んでいる。しかし、開発には2つの課題があった。

1つ目は、広告を自動で生成するAIモデルを開発しようとしても、開発に必要なデータが社内に散在していたことだ。社内で働くクリエイターが「広告の素材」「広告の制作、編集データ」を持っていたり、コンサルタントや営業が「広告効果レポート」を持っていたり、1カ所にデータを集められていなかった。

2つ目は、広告の制作データが複雑なことだ。社内では広告を「Adobe Photoshop」を用いて制作し、PSD形式で保存している。PSD形式では文字や画像などのデータをレイヤーごとに管理する。そのため、PSDデータの中に、広告で使っていない編集途中のデータが含まれている場合がある。そのようなPSDデータを学習に利用すると、AIモデルが、編集途中の広告を生成する可能性があった。

そこで、AI開発のために必要なデータを集約して、学習できるデータに変換するためだけの専門部署「データクレンジンググループ」を発足。広告の素材と効果をひも付けるためのデータ基盤の開発や、不必要な制作データを削除したPSDデータと広告画像をひも付けてデータベースに格納する作業を行い、研究者やAIエンジニアがそれらのデータを活用して開発できる環境を整備したという。

「データクレンジンググループによるデータ集約作業の結果、広告素材と広告効果のデータがつながった。どのような広告素材を使ってどれくらいの広告効果があったのかということが分かるようになったので、今後、価値のある広告を自動生成できるAIモデルの開発が行えるだろう」