【no.358】AI分野の技術発展戦略の策定に向けた会合、財政措置など議論

AI分野の技術発展戦略の策定に向けた会合、財政措置など議論

米国や中国を中心として世界的に人工知能(AI)への関心が高まり、多くの国でAI分野の政府戦略・プログラムが策定される中、ロシアでも同様の動きがみられている。プーチン大統領は5月30日、AI分野の技術発展戦略策定に向けた会合を開催。戦略の方向性や実現に向けた財政措置について議論を行った。

冒頭で、プーチン大統領は「AIはビッグデータ分析に基づく最適結果を導き出すもので、マネジメント、教育、ヘルスケアなど国民生活・経済・労働生産性に衝撃を与えるもの」と述べ、既に多くの国がAIに関する行動計画を策定している中で、ロシアでは携帯電話・インターネットの高い普及率と世界的にみて安価な通信料、豊富な数学・物理に強い人材供給とIT専門家育成システムが確立されており、国産技術が潜在的な競争力(ポテンシャル)を有していると指摘した。この競争力をAI分野にも生かすために、a.新しい数学的手法などの基盤創設や人間脳に類似するAI作業の確立、b.複雑な課題の解決に向けた人材育成のための国際数学センターの開設(モスクワ、サンクトペテルブルク、ソチ)、才能ある人材の引き留めや海外からの専門家誘致、それに向けた金銭・就労面でのインセンティブの供与、c.AI開発・活用に向けた知財保護面を含む柔軟な法制度整備とAI分野への民間投資誘致、d.データの加工・保管に関する法制度改正、e.AI導入に関する国民への啓発、の5点が重要だと強調した。

デジタル経済政策を担当しているマクシム・アキモフ副首相は、AI技術発展戦略の実現に関する手法と財政措置について言及。戦略の実現に向けた各種措置が明記される、連邦プログラム「AI」を2019年10月までに策定し、先進的な研究機関支援を含むアルゴリズム、数学的方法分野の研究支援、官民での技術開発・複製の試験実施などに向け、6年間で900億ルーブル(約1,530億円、1ルーブル=約1.7円)の財政拠出を行うと述べた。

他方、デジタル経済戦略策定に参画する、ロシア最大手行ズベルバンクは本会合開催前の5月20日に、AI分野の発展(注)には、2024年までに1,000億ルーブル、2030年までに1,800億ルーブルの予算が必要だと試算し、900億ルーブルでは足りないとしている。ズベルバンクの評価によると、AI技術の開発・商業化への投資は主に、横断技術(AI分野で横断的活用できる技術)に向けることが肝要とし、投資額は解決課題の内容や、活用する横断技術の完成度合、完成品の技術的複雑性次第としながらも、2030年までに基礎調査に200億ルーブル、横断技術の試作開発支援に400億ルーブル、全分野の横断技術支援に1,200億ルーブルが必要としている(電子メディア「プライム」5月20日)。

(注)ズベルバンクが策定に携わっている「AI発展戦略」では、AI技術の定義を「コンピュータビジョン(コンピュータによるデジタル画像・動画の理解に向けた人間の視覚システムの自動化を追求するもの)」「自然言語処理(人間が用いている自然言語をコンピュータに処理させる技術。自然言語をコンピュータが理解しやすい表現に変換、その逆の処理が含まれる)」「レコメンダシステム(特定ユーザーが興味を持つと思われる情報を「おすすめ」として提示するもの)」「音声認識」「自動機械学習技術」などとしている。

【no.357】ロボットに触覚を与える「AI手袋」 MITが開発

ロボットに触覚を与える「AI手袋」 MITが開発

MITコンピュータ科学・人工知能研究所が、映像データから学習する「AI手袋システム」を開発した。「STAG」(Scalable Tactile Glove)と名付けられており、実際の手と同様に、さまざまな刺激を検出することができると説明されている。

研究をリードするCSAILの研究員、Subramanian Sundaram氏はこれまで、人間と同じように皿を拭くことができるなど、ロボットに鋭敏な触覚機能を備わせる研究をしてきた人物だ。AI手袋の研究成果をさらに向上させれば、「完璧な触覚を持ったロボットアーム」を製作できるようになっていくはずだと今後の見通しを語る。

研究チームは、AI手袋を開発するために伸縮性のある約15ドルの手袋を用意。そこに、対象やモノゴトを検出するため548個のセンサーを取り付けた。人の手には、約1万7000本の機械受容器神経線維があり、外部から加わるさまざまな物理的刺激を触感信号に変換している。その機能を、大量のセンサーを使って代替しようという試みだ。

courtesy of MIT

なお、Sundaram氏によれば、既存の研究過程においてもロボットアームにセンサーを取り付けたケースがあったが、その数は50個ほどにとどまっていたという。今回は約10倍の量のセンサーを搭載することになった。しかも、生産コストを10ドル台で調整できるのも特徴のひとつとされている。

今回開発されたAI手袋は単にセンサーが多いだけではなく、映像から得られた情報を学習することでスマートになっていく。人間は視覚から得た情報と触覚を連動させ、対象の状態を覚えていくが、同じプロセスを再現しようということになろう。現時点で、空き缶、はさみ、テニスボール、スプーン、ペン、マグカップなど26個のモノと関連した、13万5000フレームの触覚データセットを識別するまで能力が拡充された説明されている。

Sundaram氏は、「ロボットがこのAI手袋を着用すれば、人間のようにモノゴトを感知し対応することができる」とする。対象物を動かす、掴み上げる、下ろす、意図的に落とすなどのアクションがそれにあたる。

既存の産業用ロボットや協働ロボットでは、無造作に置かれた形が異なる物質を自由にピックアップ、もしくは分別するタスクを処理することが難しいとされてきた。今後、人間のような細かい手作業を再現することがひとつの課題とされている。同分野では、すでにディープラーニングを使った学習などさまざまなアプローチで研究が進んでいる。大量の細かいセンサーと機械学習を組み合させた、AI手袋の技術革新にも期待したい。

【no.356】大丈夫? AIは、ただの「落書き」に呆気なくダマされる

大丈夫? AIは、ただの「落書き」に呆気なくダマされる

映画『ターミネーター』シリーズには、どんなに追い払おうとしても追いかけてくる、恐怖のロボットが登場する。ターゲットとなる人物の顔を認識し、どこに逃げ隠れしようが追跡し、その人物の命を奪おうとする――これはさすがに極端な例だが、人がAI(人工知能)に不安を抱くとき、こんなイメージを抱くのではないだろうか。絶対にミスを犯すことのない、神(あるいは悪魔)のような存在というわけだ。

ところがいま、むしろAIの方が簡単に撃退されてしまうのでないかという懸念が出てきている。しかもそのために、強力な武器も溶鉱炉も必要ない。ステッカーがあれば十分なのである。

2017年7月、ワシントン大学など4つの研究機関の研究者たちが、とある論文を発表した。その論文で示されていたのは、ごく簡単な手法によって、ロボットカー(自動運転車)に搭載されたAIが騙されてしまう可能性である。

彼らがテストした「騙し」のテクニックのひとつが、実際の道路標識に対して、落書きを模してステッカーを貼るというものだ。

上の画像は実際の論文から引用したものだが、実際に研究者たちが作成し、ロボットカーのAIに読み取らせた一時停止標識である。白と黒の四角形に見えるのは、何の変哲もないステッカーを貼り付けたもので、何か特殊な加工がしてあるわけではない。

しかし人間の目で見れば何の違和感もない、そして人間であれば何の苦労もせず「これは一時停止標識だ」と認識できるこの画像、実はロボットカーの「目」にはまったく違うものに映るよう計算されてつくられている。実際に実験を行ってみたところ、ロボットカーはこの標識を「制限速度45マイル(約72キロメートル)」と勘違いしたそうだ。

なぜロボットカーに搭載されたAIは、こんな簡単なトリックに騙されてしまったのだろうか。

この実験で騙す対象となったAIは、ディープラーニングという手法で構築されたものだ。簡単に言うと、ディープラーニングではAIに大量の学習用データを与え、AIはそれをもとに独自の「思考回路」を形成する。そしてその思考回路を使って、現実の世界から与えられるデータを処理し、適切な判断をしていくわけだ。

しかし人間の目にも錯覚という現象があるように、構築されたAIの思考回路も、与えられたデータから誤った判断をしてしまう場合がある。そうした誤った判断を引き出すようなデータを設計して、AIに与えることによって、意図的にミスを引き出すことができるのだ。そしてこのような、意図的にAIを混乱させる手法を、「敵対的攻撃(Adversarial Attack)」と呼ぶようになっている。

【no.355】ピザ界でもAIは大活躍。ドミノ・ピザが人工知能で出来栄えを鑑定

ピザ界でもAIは大活躍。ドミノ・ピザが人工知能で出来栄えを鑑定

人工知能が完璧なピッツァを目指します。

出前で届けてもらったピッツァが別モノだったり、具が足りなかったり、配置に偏りがあった経験ってありますか? あんまり聞いたことがないかもしれませんが、オーストラリアだとそんなこと、無きにしもあらずらしいんですよね。

そこでドミノ・ピザが開発したのが、AIの力を借りて出来栄えをスキャンで鑑定する「DOMピッツァ・チェッカー」。まずはどんなモノなのか、プロモーション映像でチェックしてみてください

 

Video: Domino’s Australia/YouTube

なるほど。ちゃんと注文通りに、しかも綺麗に焼けたかどうかをAIがデータベースと照らし合わせるってことなんですね。もし出来ていなかったら、作り直してくれるそうです。

designboomいわく、このマシーンは2017年に予告されていたのだそうです。ですがやっと完成し、これからオーストラリアとニュージーランドの店舗に配備されるとのこと。ゆくゆくは、スキャンしたほかほかのピッツァ写真を、配達先のお客さんに送信することも計画しているとか。きっとそれを、お客さんがSNSに投稿するんでしょうね。

まさかこんな形でピッツァに未来がくるとは思いませんでした。

【no.354】AIアナウンサー「荒木ゆい」を地上波テレビ局が採用。放送現場の働き方が変わる?

AIアナウンサー「荒木ゆい」を地上波テレビ局が採用。放送現場の働き方が変わる?

高知県を放送エリアとする地上波テレビ局(フジテレビ系列)「高知さんさんテレビ」に、AIアナウンサー「荒木ゆい」が番組アナウンサーとして採用された。

「荒木ゆい」は、株式会社Specteeが開発した音声読み上げサービスだ。文章を音声で読み上げる「Text to Speech」技術にディープラーニング(深層学習)を取り入れることで、より人間に近い滑らかな発音での音声読み上げを実現している。

スタジオの空きやアナウンサーの拘束時間から開放される

これまでの番組制作では、ニューススタジオでアナウンサーなどが読み上げる音声を録音する必要があった。そこで課題となっていたのが、人員確保やスタジオスケジュールの調整だ。

「荒木ゆい」を採用することで、原稿をPCに文字入力するだけでアナウンス音声を準備できるようになる。スタジオの空きやアナウンサーの拘束時間を気にすることなく、効率的な番組制作が可能となる。

社員等の拘束時間の削減、一般的なスペックのPCでもアナウンス音声を作成でき、効率的な業務分担も実現しているという。

高知さんさんテレビでは今後、「荒木ゆい」を放送以外のイベントやウェブサイトでも活用することで、さらに効率的な働き方を推進する予定だ。

めざましテレビで「AI天気」の実証実験も

2019年4月、「荒木ゆい」の開発元であるSpecteeは、フジテレビ系列「めざましテレビ」、日本気象協会と連携し「AI天気」の実証実験も行った。

近年、異常気象などにより、季節外れの寒さや高温の日が多く発生している。日本気象協会が実施した調査では、「あなたがこの1週間の中で、天気予報を見る目的や理由をお選びください」と質問を行ったところ、傘などの持ち物の参考のために天気予報を利用している人が最も多く(69.3%)、続いて、服装を決めるために参考にしている人が多い(46.5%)との結果がでている。

上記の結果から、日本気象協会は、天気予報において体感を重視した服装や持ち物に関する情報が重要であると考えた。そうして、お天気情報カメラなどのカメラ映像をリアルタイムに解析し、服装などの判定をする「AI天気」が実証実験として行われたのだ。

【no.353】電通と双日、AIがマグロの尾部断面画像から品質判定するシステムを開発

電通と双日、AIがマグロの尾部断面画像から品質判定するシステムを開発

日本の伝統産業における長い歴史で培われてきた職人の技は、人類の経験知が集積された貴重な資源だ。これらのノウハウは、「職人の勘」と形容されるように、体系化や言語化ができない暗黙知であるとされ、担い手である職人も高齢化しており存続が危ぶまれている。

そんななか、電通と電通国際情報サービス、双日は、天然マグロの尾部断面画像からAIが品質判定を行うシステム「TUNA SCOPE」を開発し、今年3月に実証実験を行った。

電通と電通国際情報サービスが取り組む、熟練の職人が持つ技能継承が課題となっている産業において、職人の技能をAIなどの技術を活用して継承する取り組み「プロジェクト匠テック」の一環だという。

マグロの尾部断面画像からAIで品質判定し、「AIマグロ」としてブランド化

今回に実証実験では、一人前になるまで10年は必要といわれるマグロ仲買人の「目利き」のノウハウに着目。マグロの尾部断面の目視により品質判定を行う「尾切り検品」と呼ばれる職人技から得た膨大なデータを機械学習により継承した。

実証実験は、

  • ①「TUNA SCOPE」のβ版をマルミフーズ株式会社の尾切り検品業務に適用し、判定精度を検証
  • ②同システムが最高品質と判定したマグロを「AIマグロ(商標出願中)」としてブランド化し市場性を検証

の2段階で実施された。

①「TUNA SCOPE」のβ版開発と適用

マグロの尾部断面写真と、職人の4〜5段階の品質評価の結果を紐づけて尾切り検品のデータを取得し、画像解析を行うためのシステムを構築。

収集したデータを基にチューニングとディープラーニング・アルゴリズムの選定を行い、スマートフォンアプリとして実装した「TUNA SCOPE」β版を開発した。これをマルミフーズ焼津工場での検品業務で試験運用した結果、職人と85%の一致度でマグロの品質判定に成功。

②AIが最高品質と判定した「AIマグロ」の販売および市場性検証

「TUNA SCOPE」の運用で最高ランクと判定されたマグロを「AIマグロ」とし、商品ブランドロゴを開発。「産直グルメ回転ずし 函太郎Tokyo」で5日間にわたって提供し、約1,000皿を販売した。

アンケートの結果、注文客の約89%から「AIマグロ」に対する高い満足度を示す回答が得られたという。

電通グループは「TUNA SCOPE」のさらなる精度向上と実用化に向け、学習モデルの教師データの継続的な収集、解析アルゴリズムの最適化に向けた取り組みを続けていく。

また得られたノウハウをほかの産業分野でのAIによる「目利き」の継承に応用し、社会や企業の課題解決に貢献していくという。

【no.352】中国でパンダの「AI顔認証技術」を開発。一般向けにアプリも準備

中国でパンダの「AI顔認証技術」を開発。一般向けにアプリも準備

パンダ赤ちゃん

どれも同じに見えるパンダをAIで識別する技術が開発された。

Reuters

パンダの繁殖や保護を担う成都ジャイアントパンダ繁殖研究基地は今月、シンガポールの南洋理工大学、四川師範大学と共同で、パンダの画像や動画からAI顔認識技術を用いて個体識別する技術を開発したと発表した。

顔認証技術

成都ジャイアントパンダ繁殖研究基地

パンダと飼育員

パンダの個体識別は、研究者だけでなく飼育係のニーズも高いという。

Reuters

同基地によると、中国ではこれまで、4回にわたって専門家による野生パンダ大規模調査を実施し、パンダが約1800頭生息しているなどの基本状況を把握。多数の資料も収集した。

現在は捕獲や人の目のよる識別、毛髪や糞便からのDNA収集を通じてパンダの調査を行っているが、野生パンダは山奥の広い面積に生息しているため、人間による追跡や観測は効率が悪く、かつ危険を伴うという問題がある。

RTX1TGLO

Reuters

兄弟パンダ

同じにしか見えない2頭も識別可能に。

shutterstock.com

パンダの群れの様子や分布状況、年齢や性別、出産、死亡をより正確に把握するために、同基地は大学と協力し、2017年に画像によるパンダの個体識別技術開発に着手。2年かけて12万点の画像と数万点の動画をデータベース化し、映っているパンダにタグ付けを行うなどして、画像から個体を自動識別する技術を確立した。

同技術によって、パンダの生息区域内にカメラを設置することで、パンダの個体の状況をより正確に把握できるようになる。研究チームは今後、ビッグデータ分析を通じて、健康観察や群れの調査のより効率的な方法を開発するほか、近く、パンダの顔認識アプリも発表し、一般向けに提供する予定。

【no.351】1枚の写真が表情豊かにしゃべりだす。サムスンのAIが作る驚きのディープ・フェイク技術

1枚の写真が表情豊かにしゃべりだす。サムスンのAIが作る驚きのディープ・フェイク技術

1枚の写真が表情豊かにしゃべりだす。サムスンのAIが作る驚きのディープ・フェイク技術
Image: Egor Zakharov/YouTube

単なる口パクではなく、超リアルに動きます。

今の人工知能技術は、人の声を解析して任意のセリフをオバマ元大統領に喋らせたり、可愛い赤ちゃんの顔をイーロン・マスクにすげ替え不気味の谷のズンドコに突き落としたりと、思い付くことは何でも簡単に出来てしまう時代になりました。

たとえば教育目的で美術館がサルヴァドール・ダリを復活させたり、ネットやアプリ内で動くアバターを生成などという無害で素晴らしいディープ・フェイクもありますが……悪意があれば偽ポルノ映像を作って誰かに嫌がらせをすることも可能だったりして、光と闇が強い技術かと思われます。

ディープ・フェイクをお手軽に作れるという研究

この度、モスクワにあるSamsung(サムスン)の AIセンターに勤める科学者たちと、スコルコボ研究所がディープ・フェイクに関する報告書「Few-Shot Adversarial Learning of Realistic Neural Talking Head Models」を発表しました。これはたった数枚の写真(または絵画)に写った顔を、仮想的に喋らせるというものです。

科学者たちは昨年、機械学習を利用して超絶リアルな誰かの映像を生成するなど、何通りもの新しい方法でディープ・フェイクを生み出してきました。ですがまだ、そうした映像を作るために重要な前提条件がひとつあります。それはAIに学習させるべく、フェイク映像を生成したい人物の資料を、リアルにしたければしたいほど大量に集めないといけない、ということなんです。

学習素材を集める苦労

もちろん、これはもしオープンソースの画像収集ソフトや、モデルにしたい人物がネット上に充分な量の写真や映像を投稿していれば、大量の資料を集めることは不可能ではありません。しかしそれらはまだお手軽な作業ではありませんし、何より偽ポルノを作るときなどは、被害者になるかもしれない人たちが、どれほど自らが悪用可能なデータをシェアしているか注意深くなるようになりました。

ですがこの新システムは、結構な時間を費やすことが必須だった、資料集めの作業から開放してくれるのです。

190527_fakephoto2
Image: Egor Zakharov/YouTube

少ない資料と短時間で生成する

報告書にて、科学者たちはこのシステムが「限られた時間内」「一握りの写真からおしゃべりする頭」を生み出せる、と書いています。もし誰かがディープ・フェイクを作る場合、モデルになる人の大量の写真(トレーニング用データ・セット)をディープ・ニューラル・ネットワークに入力する必要があります。ですがこの科学者たちは、彼らのシステムが必要とするのは少しの写真でそんなに時間を要さず、フェイク映像を吐き出せる、というのです。

また研究結果には、「完璧なリアリズム」を作るため32枚の画像で訓練した、とあります。これは従来よりとても少ない上、今のネットでは簡単に集められる枚数ですよね。モデルにしたい人のFacebookページに行けば、それくらいの枚数を見つけるのは難しくないってことは、簡単に想像できちゃいます。さらに重要なのは、この技術は急速なスピードで開発が行なわれているってことだったりします。

こちらの映像では、たった8枚の画像から重点となる顔のパーツを見つけ、かなり自然なフェイク映像が出来上がった様子などが見られます。

Video: Egor Zakharov/YouTube

1枚からでも生成は可能ですが、8枚、32枚と資料が多いほどより良い映像が出来ることも比較してますね。16枚の自撮り写真からも自分のアバターを生成したり、ダリやアインシュタイン、マリリン・モンローといった実在した人物の写真だけでなく、イワン・クラムスコイの『見知らぬ女』やダ・ヴィンチの『モナ・リザ』といった絵画までもが生き生きと、表情豊かに動いていました。

1枚の静止画ですら、このシステムが命を吹き込めるのは凄いですよね。これらの例には、簡単にフェイクだと断言するのが難しいものもありました。

190527_fakephoto3
Image: Egor Zakharov/YouTube

応用が期待できる

報告書ではまた、科学者たちはこの種の技術の先には「ビデオ会議やマルチプレイヤー用ゲーム、それに特殊効果を扱う業界などでの遠隔配信にて実用的」かもしれない、と記しています。

テック企業がアニメ化したアバターやバーチャル・リアリティーへ移行するように、この技術はより個人的で現実的なヴィジュアルへと向かう、次の段階への自然な一歩のように感じられます。それに映像業界でも、たとえば亡くなった役者の復元ための大幅な時間短縮ができるようになるかもしれません。

一例として、映画『ローグ・ワン/スター・ウォーズ・ストーリー』では、かつてターキン総督を演じた故ピーター・カッシングと、若き日のレイア姫を再現して話題になったこともありましたが、この技術を利用すれば、そのVFXが時短できるわけです。

使い方は良心に委ねられる

しかしながら、フェイク映像として悪用のモデルにされた被害者に与える本当の脅威に目を向けず、ただこの技術を褒め称えるのは無責任かと思われます。実際にディープ・フェイクが世間に認知され始めた頃、ネット上の女性にとってこの技術がどれほど牙を剥くのかは、目と鼻の先といわれていたくらい。ネットには、こういう技術を悪用しようという輩が必ずいる、という厳しい現実が待っています。

ですが技術者たちは、日々もっと簡単に、もっと効果的に、と向上を目指すものなのです。何事にも当てはまりますが、使い方はその人の良心次第ですね。

【no.350】メルカリのAI経営術 サービス磨き不正防ぐ

メルカリのAI経営術 サービス磨き不正防ぐ

フリマアプリ最大手のメルカリがテクノロジー活用に力を注いでいる。マイクロサービスを全面採用し、継続的なサービスの強化と変化に強い組織づくりを目指す。AI(人工知能)の活用も強化し、利用者向け機能からシステム開発、従業員の日常業務まで効率を引き上げる。不正利用を防ぎ、信頼されるテックカンパニーに成長できるか。

図 メルカリの月間利用者数と流通総額の推移
利用者数は4年前の15倍に
[画像のクリックで拡大表示]

売上高は3年間で3倍に増え、月間利用者数(MAU)は4年前の15倍、従業員数は2年前の3倍に――。メルカリの事業と組織が急拡大している。2018年6月に東証マザーズに上場、2019年2月にはスマホ決済サービス「メルペイ」を始めた。2014年に進出した米国事業のアクセルも踏み込む。サービス強化に加え、2019年は認知度やブランドイメージの向上へ投資を増やす。

急成長する一方、経営幹部や社員の中には先行きへの危機感が広がる。事業強化や意思決定のスピード、サービスの使い勝手や品質――。サービスを動かすシステムの構造が複雑になり社員数が増え続ける中、これまでの勢いを維持できるのか。

「今のままエンジニア数が1000人を超えたらメルカリのアーキテクチャーは崩壊しかねない」。2017年初夏、CTO(最高技術責任者)を務める名村卓執行役員は山田進太郎会長兼CEO(最高経営責任者)と同社の先行きを議論した。当時のエンジニア数は100~120人。山田会長は1000人を超えるのは2020年ごろと見ていた。2018年10月時点のエンジニア数は350人である。

組織としての停滞を回避し「世界的なマーケットプレイス」になる目標を達成するため、メルカリはテクノロジーに活路を見いだす。目指すは「日本を代表するテックカンパニー」だ。2018年6月、マザーズ上場の記者会見で山田会長はこう宣言した。GAFA(グーグル、アップル、フェイスブック、アマゾン・ドット・コム)が目標であり想定するライバルだ。

製品やサービスの水準でGAFAを目指すだけではない。浜田優貴取締役CPO(最高プロダクト責任者)は「エンジニアのスキルでも差異化し、システム開発などに関する新たな技術を生みだせる企業を目指す」と意気込む。

【no.349】AIが電話予約する「Google Duplex」、通話の25%は人間によるもの?

AIが電話予約する「Google Duplex」、通話の25%は人間によるもの?

Googleが2018年に「Duplex」を発表したとき、人間そっくりに話す人工知能(AI)を利用して予約を取るためのシステムだとうたっていた。

Google Assistant
Googleアシスタントがユーザーの代わりに電話でレストランや美容院の予約を取る
提供:James Martin/CNET

だが、Duplexによる通話のおよそ25%はロボットではなく実際は人間が開始していることが分かったという。Googleが米国時間5月22日にそう述べたと報じられている。また、およそ15%はAIソフトウェアが通話した後に人間が引き継いで予約を完了しているという。The New York Times(NYT)は先にこの数字について報じていた。

このサービスが正常に機能する場合、人間のように話すボットが同社のデジタルアシスタントソフトウェア「Googleアシスタント」のユーザーのためにレストランや美容院の予約を取る。Duplexは「uh」(ええと)や「um」(うーん)といった言いよどみを用いたり、特定の語を間延びさせたり、声を上げ下げしたりして人間のように話す。

Googleの最高経営責任者(CEO)であるSundar Pichai氏が2018年5月にDuplexのデモを披露したときから、同社はAIの倫理をめぐる議論に巻き込まれることになった。このソフトウェアは、会話の相手がコンピュータではなく人間かもしれないと人間に思い違いをさせる可能性があるのではないかと懸念する声があった。Googleはその後、人々に話し相手がロボットだと伝える機能を構築すると述べた。

だがあらゆる議論にもかかわらず、Duplexの実際の成功率は、このサービスが依然として大いに人間に依存していることを示している。Googleはロボットの代わりに人間に通話させることを決定する際、複数の兆候を考慮するとNYTは報じている。例えば、レストランが予約を受け付けているかどうかが定かではない場合、Duplexは人間を用いる可能性があるという。

その一方で、GoogleはDuplexを拡張し、レストラン以外の予約にも対応させている。同社は2019年5月、Duplexのサービスを拡張した「Duplex on the web」を発表した。Duplex on the webは、「Googleカレンダー」や「Gmail」の情報を利用して、モバイルウエブ上の予約ページでユーザーの個人情報のフォームへの入力を自動的に行う。レンタカーや映画のチケットの予約に利用できる。