【no.347】オンデヴァイスのAIは、音声認識のゲームチェンジャーになるか

オンデヴァイスのAIは、音声認識のゲームチェンジャーになるか

グーグルがこのほど、音声認識をスマートフォンなどのデヴァイス側で実行できる技術を開発した。ソフトウェアを25分の1に圧縮したことで、これまでサーヴァーで実行していたプログラムをデヴァイスに搭載できるようになったのだ。データをクラウドに送る必要がないため、通信が不要で処理速度が速いこの技術は、音声認識の利便性を飛躍的に高めるゲームチェンジャーになる可能性を秘めている。

TEXT BY TOM SIMONITE
TRANSLATION BY CHIHIRO OKA

WIRED(US)

Assistant

BENSIB/GETTY IMAGES

人工知能AI)による音声アシスタントに、毎日のように話しかけている人は多いだろう。でも結果はいつも思い通りというわけにはいかず、イライラさせられることもあるはずだ。

こうしたなか、グーグルが音声認識の精度を著しく向上させる新技術を明らかにした。音声認識ソフトウェアのサイズを25分の1に圧縮できたことで、音声操作などが飛躍的に便利になるという。

おかげで、これまでクラウドのサーヴァー側で動かしていたプログラムを、スマートフォンにインストールできるようになる。つまり、処理速度が格段に速くなるわけだ。これを最高経営責任者(CEO)のスンダー・ピチャイは「大きなできごと」だと説明した。

多くの処理がデヴァイス側で完結

開発者カンファレンス「Google I/O」の基調講演で披露されたデモでは、話した瞬間にデヴァイスがその内容を理解していく様子が示された。音声データをクラウドに送信する必要がないため反応が非常に速く、これなら確かにスマートフォンの操作方法が根本から変わる可能性もあるかもしれないと思わせる。

実際、グーグルのAIアシスタントは、アップルの「Siri」のような競争相手よりはるかに優れた能力を発揮した。シニアプログラムマネジャーのメギー・ホリンガーが、音声コマンドで何ができるかをひとつひとつ紹介していく。すべてのタスクで、競合他社の音声アシスタントより処理が速かった。しかも、毎回「OK、Google」というウェイクワードを言う必要がないという。

ホリンガーは、2回のタップと3つの短いフレーズだけで旅行の写真を友達に送ることに成功した。彼女が「イエローストーン(国立公園)の写真を見せて。動物の写っているやつ。ジャスティンに送って」と言うと、数秒もしないうちに「Google Photo」でバイソンを撮った写真が表示される。タップとスワイプだけでこの写真を探し出すのは、かなり骨が折れるだろう。

グーグルのAI部門を率いるジェフ・ディーンは、音声認識をデヴァイス側で完全に処理できるようになったことで「スマートフォンの使い方が変わる」とツイートしている。これまではサーヴァーでの処理とデヴァイスでの処理が併用されていたが、今後は多くの場合でデヴァイアス上ですべてが完結するようになる。

デヴァイスとの会話という体験が変わる

消費者テクノロジーの世界では、新しい技術が生活に必須なものへと進化するためには、処理速度の向上とバグをなくすことが重要課題とされる。ヴィデオチャットやマルチプレイのオンライゲームが当たり前となる上で、高性能パソコンとブローバンド接続が果たした役割を考えればわかるだろう。

デヴァイスだけで完結する音声認識システムについては、まだ提供が始まったわけではないし、当初はハイエンドモデルでしか利用できない。ただ、この新しいテクノロジーにより、デヴァイスとの会話という体験が完全に変わる可能性はある。

グーグルの音声アシスタントは2012年に始まったAI研究の成果のひとつであり、なかでも深層学習と呼ばれる手法が確立されたことで、エラー率は25パーセントも低下した。しかし、当時はまだデータはサーヴァー上でしか処理できなかった。クラウドに送ることで時間的な制約がかかるだけでなく、ネットワークエラーによるバグも生じる。

グーグルはこの問題を解決するため、深層学習のソフトウェアの圧縮に取り組んできた。そして、音声認識モデルにおいてはマイルストーンに到達したというわけだ。サーヴァーで動かしている音声認識プログラムは全体で2GBもあり、スマートフォン側で走らせるのはほぼ不可能だ。これに対し、最新版は同じパフォーマンスをわずか80MBで実現している。サイズにすると実に25分の1だ。

「ゲームチェンジャー」になる技術

クラウドベースより動作性が明らかによくなれば、ユーザーが音声コマンドやAIアシスタントを利用する頻度は増えるだろう。また、他社が同様の技術を開発して追いついてくるまでは、グーグルが市場を主導できるかもしれない。なお、アップルは2017年に「オフラインで使える個人アシスタント」の特許を出願している。

市場調査会社ガートナーのワーナー・ガーツは、オンデヴァイスの音声認識は「ゲームチェンジャー」であり、既存技術を利用したシステムを採用するアップルやアマゾンにとっては大きな脅威となるだろうと説明する。ガーツは「データ処理の遅延はこれまで常に大きな問題でした」と言う。たいていの人はこの遅延(レイテンシー)を感じたことがあるはずだ。

グーグルは、この新技術を別のアプリケーションにも活用している。端末で再生される音声の字幕化機能「Live Caption」だ。この機能では、友人から送られてきた動画からポッドキャストまで、どんなメディアでもリアルタイムで自動的に字幕を付けられる。デヴァイス側で処理が完結するため、機内モードでも使うこともできるという。

プライヴァシーの強化にもつながる取り組み

一方、グーグルは現在、「Euphonia」という研究プロジェクトに取り組んでいる。例えば、脳卒中などで発話機能に問題を抱える人が音声認識を使えるようにする研究で、対象者に音声サンプルの提供を呼びかけている。

プロダクトマネージャーのジュリー・キャティオウは、音声認識のデータ処理がオンデヴァイスでできるようになればデヴァイスの所有者に合わせたパーソナライゼーションが可能になり、汎用化が進むだろうと説明する。

データ処理を端末側で行うことは、プライヴァシーの強化にもつながる。字幕化したテキストデータは強制的にグーグルに送信されることもあるようだが、今年の開発者カンファレンスのメインテーマが「プライヴァシー保護」であったことに変わりはない。

ピチャイもほかの経営幹部も、個人情報の大量収集を巡る悪評をなんとかしようと躍起になっていた。具体的には、プライヴァシー設定の再編や、Googleアカウントにログインした状態でも検索履歴を残さないシークレットモードを一般検索やGoogleマップでも提供する方針が明らかにされている。

【no.346】AI業界の「白人男性偏重」がなくならない根本的な理由

AI業界の「白人男性偏重」がなくならない根本的な理由

人工知能(AI)業界において多様性がいかにひどく欠如しているかは、数字が物語っている。主要なAI会議で論文著者に占める女性の割合はわずか18%、AIの教授職では20%、フェイスブックとグーグルの研究職ではそれぞれ15%、10%だ。人種の多様性はさらにひどい。黒人の労働者は、グーグルの全労働者のうちのわずか2.5%で、フェイスブックとマイクロソフトでは4%だ。トランスジェンダーや他のジェンダーマイノリティのデータは手に入らないが、多様性が欠如しているという点では似たり寄ったりだろう。

このことは、AI産業の影響が、雇用や住宅供給から刑事裁判や軍に至るまでのすべてに影響するほど劇的に増大した今日、非常に厄介な問題となっている。ここに至るまで、テクノロジーは、その作成者のバイアスを驚くほど効果的に自動化してきた。女性の履歴書を低く評価することや、雇用と住宅供給での差別を永続化すること、人種差別主義的な取り締まり刑事裁判の有罪判決を維持することなどだ。

非営利団体のAIナウ研究所が4月に出した新しい報告書によると、問題解決のために異なる手法を用いない限り、こういった傾向は悪化する一方だという。

「テック業界における多様性欠如の問題は、急を要する新たな変曲点に到達しました」とAIナウの共同創設者であるメレディス・ウィテカーは語った。「何百万人もの人々が、これらのツールの影響を感じており、ツールに作り込まれたあらゆるAIのバイアスに影響されています」。

AIナウのチームは、多様性欠如に対応する取り組みが失敗に終わった2つの主要な理由を指摘する。1つは、「テック業界における女性」の増加に重点を置き、人種、ジェンダー、その他の分野での多様性の改善を軽んじたこと。2つ目は、「パイプラインの修正」、つまり、学校から業界への多様性のある志願者数を増加させるというアイデアに過度に集中したことだ。その結果、嫌がらせや不公平な給与、不均衡な権限など、女性とマイノリティがAI分野に留まるのを妨げているその他の制度上の不都合を軽視することになっている。

AIナウの研究者は、より包括的な方法で職場の多様性を改善するためのいくつか提言している。給与と機会の差を埋めるための手段、各部署に渡るリーダー職での少数グループの人を増やす対策、少数グループの人々を雇用し、職に留め続けることに対する経営層のインセンティブを変更する方法などだ。

しかし、この問題は、雇用や給与の実践よりも根が深い。そう語るのは、データ&ソサエティ研究所で人種差別とテクノロジーの関わりを研究しているジェシー・ダニエルズ特別研究員だ(ダニエルズ特別研究員は、今回のAIナウのレポートには関わっていない)。テック業界は基本的に、テクノロジーは社会とは独立して存在するという理念の上に構築された。

「90年代初頭、インターネットが、人種やジェンダー、それに障害のようなものから私たちを解き放つだろうと考えられていました。人々が『サイバー空間』と呼んでいるところへ行けば、身体性やアイデンティティについて、もはや考えなくてすむというアイデアです」。

そのアイデアは、今日までこの業界とともにあり続けてきた。そして、従業員の多様性を増加させることに対して繰り返される失敗と、AIのバイアスが原因で繰り返されるスキャンダルの根源になっている。テック企業は、自分たちを取り巻く性差別、人種差別、社会状況とは独立して自分たちは存在しているという「幻想の信念」に基づいて構築され、テック製品もまた、その信念に基づいて設計されている。

「これはバグではなくて、仕様なのです」とダニエルズ特別研究員はいう。

【no.345】イスラエルのAIチップメーカーが最新ディープラーニングチップを発表

イスラエルのAIチップメーカーが最新ディープラーニングチップを発表

Hailoは、テルアビブに本拠を置くAIチップメーカーだ。米国時間の5月14日、同社初のディープラーニングプロセッサとなるHailo-8チップのサンプル出荷を開始すると発表した。このチップは、1秒あたり最大26テラオペレーション(TOPS)が保証されている。現在、何社かの選抜された顧客とともにテスト中で、その多くは自動車業界だ。

Hailoは、昨年になって表舞台に登場した会社で、シリーズAラウンドで1250万ドル(約13億7000万円)を調達した。その時点では、まだチップのサンプル出荷もできていなかった。同社によれば、Hailo-8は他のあらゆるエッジプロセッサの性能を凌駕し、しかもより小さなチップサイズ、より少ないメモリサイズで、その性能を達成できるという。「ニューラルネットワークの中核的な性質に特化したアーキテクチャを設計することにより、エッジデバイスはディープラーニングのアプリケーションをフルスケールで、しかも従来のソリューションよりも効率的かつ効果的に、さらに持続可能な状態で実行できるようになりました」と、同社は説明している。

Hailoでは、自社のチップが、Nvidiaの競合するJavier Xavier AGXよりも、いくつかのベンチマークで優れていると主張している。しかも、消費電力も少ないので、比較的低温で動作するという。これは、小さなIoTデバイスでは特に重要な特長と言えるだろう。

もちろん、さらに多くのエンジニアがこうしたチップを手にしたとき、それらが実際にうまく動作するのか、ということも確かめる必要があるだろう。しかし、エッジ領域でのAIチップに対する需要が増え続けることは疑いようがない。なにしろ市場は数年前に、演算処理をクラウド内に集約化することをやめ、エッジに分散することにシフトしたのだから。それは、応答時間を短縮し、バンド幅のコストを削減し、ネットワーク性能に依存しない安定したプラットフォームを提供するためだ。

後にIntelに買収されたMobileyeという先例と同じように、Hailoも自動車業界のOEMや1次サプライヤと協業してチップを市場に供給することになる。しかしHailoでは、スマートホーム製品などの垂直市場も視野に入れている。実際には、物体の検出や識別のために高性能のAIチップを必要としている、あらゆる業界が対象となりうる。

「近年、ディープラーニングが応用可能な分野が増加し続けるのを目の当たりにしてきました。それはサーバークラスのGPUによって可能となったことです」と、HailoのCEO、Orr Danon氏は述べている。「しかし、産業はAIによってますます大きな力を獲得し、むしろかき回されているような状況もあります。そのため、類似したアーキテクチャで過去のプロセッサを置き換え、エッジ領域のデバイスでディープラーニングを可能にすることが、切実に必要となっているのです。Hailoのチップは、最初から、まさにそのために設計されたものなのです」。

【no.344】グルメレビューアプリ「LINE CONOMI」がリリース AI技術でレシート撮影だけで投稿可能に

グルメレビューアプリ「LINE CONOMI」がリリース AI技術でレシート撮影だけで投稿可能に

LINEとLINE CONOMIはグルメレビューアプリ「LINE CONOMI」サービス開始した。“店舗選びの煩雑さ”や“食べたいものを見つける難しさ”をAI技術によって解決するグルメレビューアプリを目指す。

LINE独自のAIを使った画像認識技術により、テキストを入力しなくても“レシートを撮影するだけ”で、店名やメニューを自動入力できるほか、位置情報の活用により料理写真をアップするだけで店舗情報が候補一覧として自動表示されるなど、ユーザーが簡単にグルメ記録を投稿することができる機能を充実させている。

これにより、「投稿したいけどテキストを打つのが面倒」、「さっき食べた料理の詳細(メニュー名や金額)がわからない」といったことが解消され、より多くのユーザーが手軽に投稿できる環境を提供することが可能となる。

また、お店ではなく、フードやドリンクなどのメニュー単位で口コミできるので、メニュー単位で情報を入手することができるのも特徴だ。

さらに、ユーザーからの良質なレビュー投稿や投稿アクションには「LINE CONOMI coin」が付与される。未登録の店舗を新たに登録すると50 LINE CONOMI coin、お店のメニュー表の登録で100 LINE CONOMI coinが手に入る。報酬としてゲットできる「LINE CONOMI coin」は、「LINEポイント」に交換することができ、全国各所で利用可能な「LINE Pay」でLINEポイント1ポイント=1円として活用できるほか、LINEサービスでの購入・決済時に利用できる。

今後は、投稿されたグルメ記録をベースにAI機能を活用してユーザーに食の好みをオススメしてくれるレコメンド機能や、ユーザー同士のフォロー機能、地域・店舗ごとに人気のメニューがわかるメニュートレンドランキング機能、ユーザー同士で行きたいお店・食べたいメニューを共有できる機能、さらには予約機能も追加予定。

【no.343】AI規制を求め新法案、 米国議会の「本気度」

AI規制を求め新法案、米国議会の「本気度」

米国の連邦議員が4月10日、人工知能(AI)を規制する米国初の主要な取り組みの1つとなる新法案を発表した。こうした動きは今後も増えそうだ。

新法案は、今世紀の極めて強力なテクノロジーの1つ、AIに対する米国政府の立ち位置の劇的な変化を示している。ほんの数年前まで、議員らにAIを規制しようという意識は薄かった。だが、その影響がより具体的になりつつある現在、議会の一部はAIの手綱を握るための幅広い戦略の展開に動いている。

こうした動きは米国だけではない。最近になって、英国やフランス、オーストラリアをはじめとする国々でも、テック企業にアルゴリズムの責任を負わせる法案が提出されたり成立したりしている。だが、シリコンバレーを抱える米国には、AIの国際的な影響を形作るユニークなチャンスがある。「欧州の問題の1つは、欧州がAI開発の第一人者ではないことです」。欧州議会の元テクノロジー政策顧問で、現在はプリンストン大学テクノロジー政策センターの客員研究員であるベンダート・ゼーフェンベルゲンはそう話す。「欧州はある意味、多くの点でAIテクノロジーの受け手です。欧州は間違いなく二番手集団です。一番手は米国と中国ですから」。

新法案「アルゴリズム説明責任法(Algorithmic Accountability Act)」は、大企業に対して、自社の機械学習システムのバイアスと差別に関する監査を実施し、問題が見つかった場合には適切な対応を求めるものだ。また、機械学習だけでなく、センシティブなデータ(たとえば、個人を特定できる情報、指紋や声紋などの生体識別情報、遺伝子情報など)が関連するすべてのプロセスにおいて、プライバシーとセキュリティのリスクについての監査も求める法案となっている。法案が成立すれば、消費者保護と反トラスト規制に責任を持つ米国連邦取引委員会(FTC)が監督権限を持つことになる。

【no.342】先物取引に蔓延するAI運用の増加がとまらない

先物取引に蔓延するAI運用の増加がとまらない

AI運用にボット売買。

そんな用語がトレンドのようです。先物取引もすっかりAIが人気なんですね。人間の頭脳とアルゴリズムを組み合わせて、機械でしか実現できないような「ナノ秒」といったごく短い時間で投資のチャンスを見逃さない、そんな未来派の投機スタイルが先物市場を席巻しつつあるようです。

投機には興味はあるけど、ボット売買や自動トレードってどうなんでしょう。米GizmodoのBrian Merchantの報告です。


世界の先物市場にオートメーションが蔓延してるって知ってました?

ミリ秒やナノ秒といった高頻度・超高速取引はまだしも、一部には理解に窮するようなはちゃめちゃな取引もはびこっているよう。 米商品先物取引委員会のレポートによれば、先物市場の取引の自動化の増加が止まらない勢いのようです。まず、家畜先物取引の三分の一以上がボットなどの自動化で行われているとのこと。通貨先物にいたっては91パーセントがボット取引で、人間が介入しない取引の方が多くなっているというありさまです。

  • 映画『アベンジャーズ/エンドゲーム』を見る前に知っておくべき5つの知識

Financial Times(有料のレポートです)が見出しにしているように「先物市場の未来は自動化がにぎっている」のかもしれません。

米商品先物取引委員会の市場監視局市場諜報部が行なった調査です。この調査は8つの市場にわたり、世界最大のオプション取引会社CMEグループが監修しています。この調査によれば、先物取引には自動化が大きくかかわっていることがわかっています。

2
自動化された先物・オプション取引のトランザクション増加率

先物取引とは、石油、とうもろこし、金など、未来の日付で一定の価格と数量の物品を売買する取引です。金属商品、エネルギー商品、金融先物、エクイティ(株主資本)、穀物、大豆油など、いずれの市場にも自動化が台頭しています。

家畜先物の自動化率は実はこの中でももっとも低く、取引の70パーセント以下しか自動化されていない唯一の市場となっています。 この報告書の作成者はこの6年間で自動化は「一定の勢いで増加してきている」としています。

1秒以下というスピードで取引が自動的に行われることの何が問題なのでしょうか。もっとも大きな懸念は市場のボラティリティ(金融商品価格の予想変動率)が高まってしまうことと、市場のトレンドが変わることに対し巨大な結果がもたらされる可能性です。高頻度取引のアルゴリズムが過剰に解釈されることで、金融不況が悪化してしまう可能性があるのです。

高頻度取引のプログラムの不具合で大損失を招いた例は少なくありません(2012年8月のBBCの記事によれば、プログラムの不具合が元でボットの高頻度取引が不具合を引き起こし、あっという間に損失が4億4千万ドルまで拡大)。オートパイロットで動作しているシステムが多くなれば、ひとつを引き金に次々と不具合で生じた間違いに導かれ、大きな破滅と混乱を引き起こす可能性があるのです。その結果、経済は大打撃を受けるでしょう。

先物取引の報告書のケースでは、規制当局は「終値のヒストリカルボラティリティは1日の平均価格変動数と正の相関がある」ことを認めていますが、自動売買とボラティリティの間に同じ相関関係があるかどうかは決定的ではありません。先物市場における取引で自動化が台頭する一方で、人間が介入しなくなることにより市場がどう変わっていくのか、実はまだよくわかっていないのです

【no.341】蒸留所がMicrosoftと提携して世界初の「AIウイスキー」が爆誕、人工知能がフレーバーなどのレシピを考案

蒸留所がMicrosoftと提携して世界初の「AIウイスキー」が爆誕、人工知能がフレーバーなどのレシピを考案

人工知能(AI)は医療・金融・セキュリティなど、さまざまな分野で活躍する技術です。2019年5月12日、スウェーデンのウイスキーメーカー「Mackmyra」はMicrosoftとフィンランドの人工知能を活用したコンサルタント企業Fourkindと提携し、既存のフレーバーやタルの組み合わせや、販売数、顧客の好みなどを機械学習したAIによって考案される「AIウイスキー」の製作を開始したと発表しました。

Mackmyra AI whisky
https://ai-whisky.com/

Here Comes the World’s First AI-Generated Whisky
https://www.popularmechanics.com/home/food-drink/a27434076/artificial-intelligence-whisky/

ウイスキーの歴史は古く、15世紀にはラテン語で「命の水(aqua vitae)」と呼ばれてアイルランドやスコットランドで愛飲されていました。ものづくりの分野にも広がるAIの躍進によって、人類が製造し飲んできたウイスキーの長い歴史にも変革が訪れたといえます。

2019年の秋から生産が開始されるAIウイスキーは、香りは「トフィーとクリームバニラ、上質なオロロソ風で、シトラス・洋梨・リンゴ・アニス・ジンジャー・ホワイトペッパーにオーク樽」に、味は「オーク材の風味のバニラ、かんきつ類と洋梨、ハーブにわずかにタバコの葉のよう」で、フルーティーでオークの風味とわずかな塩気が感じられるドライな飲み口のウイスキーとなるそうです。

By Mackmyra

AIをウイスキー作りに活用する利点として、AIは人間よりもレシピの考案や改善の速度が速いという点と、人間では考えられなかった新しい革新的組み合わせを提示してくれるという点が挙げられています。ウイスキーの製造法では、「何をフレーバーとして入れるか」など多数の選択肢があり、今回AIが考案したレシピの総数は7000万件以上にものぼったとのこと。

その7000万件以上のレシピから最適なウイスキーを作り出すために、人間の専門家も活躍しています。Mackmyraでウイスキーの味付けを担当するAngela D’Orazioさんは「今回、ウイスキーのレシピを考案したのはAIですが、どのレシピにするのかを決定したのは人間です。まだまだ人間の役割は重要です」とコメントしています。

By Mackmyra

また、Fourkindは「ウイスキーは始まりにすぎません。お菓子・香水・飲料、果てはスニーカーなど、AIが活躍できる分野はさまざまに考えられます。AIは企業のブランドイメージや精神を損なうことなく、新しくユニークな製品を考案してくれます」と語っています。

【no.340】人間VSアレクサ:AIに頼むより自分でやったほうが早い3つのこと

人間VSアレクサ:AIに頼むより自分でやったほうが早い3つのこと

「アレクサ、音楽かけて」「アレクサ、今日の天気は?」など、音声に反応していろいろと私たちの生活をサポートしてくれるAIアシスタント。でも、AIに頼むより自分でやった方が早いことってあるんじゃない?

というわけで、米GIZMODOのヴィクトリア・ソンが米Lifehackerのアブ・ザファーに協力してもらってAI vs DIYをしてくれましたよ。

果たして結果はどうなったのでしょうか?

一概にこう、とは言えませんが、アレクサはタイマーをセットしたりライトをつけたりするのは大得意な反面、新聞を読むことをはじめとする「読み上げ行為」は冗長になりがちみたい。

ではまとめです。

【アレクサを使うと早い】

1)タイマー

2)スマートホーム

3)インターカム

【自分でやった方が早い】

1)時間チェック

2)ニュースを読む

3)算数

マルチタスクの時や、待つのが気にならない人はアレクサを使うと良いのでしょう。朝食準備中なら、アレクサのスローなニュース読み上げだって助かりますよね(テレビつけてニュースを流すという選択肢が無い場合ならね)。

【no.339】グーグルがAIと音声認識で進める「アクセシビリティ」向上の取り組み

グーグルがAIと音声認識で進める「アクセシビリティ」向上の取り組み

Googleは、人工知能(AI)と音声認識の最先端の技術を利用して、障害のある人々の生活を楽にする新しい製品やアプリを開発している。同社は米国時間5月7日、年次開発者会議「Google I/O」で、そうした取り組みの一部を発表した。

Googleの最高経営責任者(CEO)のSundar Pichai氏は基調講演で、「Android Q」によって実現される新しい「Live Caption」機能のデモを披露した。これは、スマートフォンで再生中の動画や音声をリアルタイムで文字に起こす機能だ。Live Captionは、ユーザーがYouTubeを視聴したり、ポッドキャストを聴いたり、Skypeでビデオチャットをしたりしているときに、バックグラウンドで動作させることができる。録音した音声や動画にも対応する。

Pichai氏は、障害のある人々のアクセシビリティー問題の解決を目指す3つの新しい取り組みも発表した。「Project Euphonia」は、AIを利用して、発話障害のある人々を支援する。「Live Relay」は、聴覚障害者や難聴の人も電話をかけることができるようにするプロジェクトだ。「Project Diva」は、音声起動アシスタントを発話障害者にも使いやすいものにする。

GoogleはAIを活用して、発話障害のある人々のコミュニケーションを容易にしようとしている
GoogleはAIを活用して、発話障害のある人々のコミュニケーションを容易にしようとしている
提供:Google

Googleはかなり前からアクセシビリティー問題に取り組んできた。例えば、同社の「Googleマップ」チームには、車椅子の人のためのスロープや入り口がある場所を探し出す地元のガイドがいる。2018年のGoogle I/Oでは、「Android」用アプリ「Lookout」を発表した。このアプリは、周囲にある物体や文字、人について音声で情報を伝えることで、視覚障害者を支援する。

Pichai氏は基調講演で、「あらゆる人を想定して開発された製品ということは、あらゆる人が当社の製品にアクセスできるということだ。テクノロジーは私たちのインクルーシブ性(包括性)を高める助けになるとわれわれは考えている。そして、AIは障害のある人々の体験を劇的に改善する新しいツール群を私たちに提供してくれている」と語った。

【no.338】メルカリから学ぶ、事業にAIを導入する術

メルカリから学ぶ、事業にAIを導入する術

2019年3月28日、「メルカリAI技術説明会」が行われた。AI(人工知能)時代に向け、テックカンパニーを目指すメルカリの技術に関する取り組みが紹介された。

登壇したのは、メルカリ取締役兼最高製品責任者(CPO)の濱田 優貴氏、AI Engineeringチームディレクター 木村 俊也氏、AI Engineeringチームマネージャー 山口 拓真氏だ。メルカリの技術面を担うメンバーが、世界のAIトレンドやテックカンパニーとしてメルカリが目指す世界、メルカリを支える最新のAI技術について説明した。

売ることを空気にする「AI出品の進化」

メルカリで商品を売るためには「出品」という作業が必要になる。しかし、出品したいモノを撮影し、カテゴリを選び……という作業はユーザーにとっては負担になる。

そこでメルカリが進めるのが「AI出品の進化」だ。売ることを空気にするというビジョンのもと、AIを活用した出品機能を開発中だという。

今回はそのプロトタイプ段階のものが紹介された。

撮影した物体を解析し、「商品」「価格」を特定する

紹介されたのは、物体を動画撮影するだけで、瞬時に「物体名」を特定し、それが現在いくらで取引されているか、「価格」が表示される機能だ。

ユーザー自身がカテゴリの入力や価格を調査するのは面倒だ。そういった面倒を物体認識の技術などで解決していくという。

ほしい商品を物体認識で見つける

メルカリは、出品に限らず購入体験も進化させていく。

ほしい商品があっても、名前がわからいケースがある。写真をアップロードするだけで写っている物体を特定し、購入ができる機能だ。

スマホをかざすだけで売れる世界観

AIを活用したしたメルカリのアップデートは、さきに紹介した機能にとどまらない。

――濱田
「今後は、『セリングAI』という機能の実装も考えています。ユーザーは、商品を売るために価格を下げたり、あるいは市場の動きにあわせて価格を上げたりします。そういった価格をユーザーではなくAIが自動的に交渉してくれる機能が『セリングAI』です。物の価値は日々変わります」

――木村
「メルカリは、テクノロジーを通じて『売る』という体験を進化させます。『売る』ことを圧倒的に簡単にし、まるで『空気』のようにあたりまえにする。目指すのは、『スマホをかざすだけで売れる世界観』です」