【no.152】AIの「ワードプレス化」目指す、スウェーデン企業の野望

AIの「ワードプレス化」目指す、スウェーデン企業の野望

スウェーデン発のAIスタートアップ「Peltarion」には、人気ゲーム「キャンディークラッシュ」の開発に携わったエンジニアをはじめ、スポティファイやKlarna、Truecallerなどスウェーデンを代表するテック系ユニコーン出身の上級エンジニアが多く参画している。

ストックホルム本拠のPeltarionは、これまでに投資家から1600万ドル(約18億円)を調達している。顧客にはBMWやNASA、Ocadoといった大手企業が顔をそろえ、今後の利用を希望する企業数は800を超えるという。

CEOのCrnkovic-Friisによると、多くの企業がグーグルの「TensorFlow」やアマゾンの「Sage Maker」、マイクロソフトの「Azure Machine Learning」などのフレームワークを使って画像認識や自然言語処理のシステム開発を試みているが、ツールが非常に複雑でAIの専門家がいないと運用は難しいという。

そこでCrnkovic-Friisが考えたのは、HTMLが使えなくてもウェブサイトを構築できるワードプレスのようなAIツールだった。Peltarionでは、グラフィックを用いたインターフェースで独自のニューラルネットワークが構築でき、専門知識を持たないソフトウェア開発者でもAI開発が可能だ。

Crnkovic-Friisは筆者にノートPCを使って操作方法を見せてくれたが、真っ白なページにダイアグラムやバブルとそれらを結ぶ線が表示されていた。バブルはニューラルネットワークの「レイヤー」を意味するという。

個々のバブルにはパラメータが含まれ、ソフトウェアがニューラルネットワークを構築するためのステップとして機能する。データはそれぞれのステップを経由して送られ、ネットワークが答えを間違えた場合には、鎖状につながったバブルを逆流して修正が行われる。

ニューラルネットワークには、未知のデータからも正しい答えを導き出す「汎化能力」がある点が、フレームワークに基づくソフトウェアと大きく異なる。Peltarionでは、データの複雑さに応じて汎化に数分から数時間を要する。

AIがワードプレスのように、特別な知識がなくてもアイデアを具現化できるようになったらとてもいいですね、、「AIの民主化」と題されていました。
次回の更新も楽しみにして頂けますと幸いです!

【no.151】1秒で2万行を生成する「AIコピーライター」、中国アリババが発表

1秒で2万行を生成する「AIコピーライター」、中国アリババが発表

中国のEコマース大手、阿里巴巴(アリババ)は現地時間7月3日、1秒で2万行のキャッチコピーを作成できるという人工知能(AI)を発表した。小売業者が人間の作業を必要とせずに販売サイトで商品情報を生成するのに役立つものだ。

このAIコピーライターは、傘下のデジタルマーケティング企業アリママを通じて発表された。アリババによると、ディープラーニング(深層学習)モデルと自然言語処理の技術を活用して同社のオンラインプラットフォーム「天猫(Tmall)」および「淘宝(Taobao)」上の「数百万の既存サンプル」を学習し、コンテンツを生成するという。

アリママのゼネラルマネージャーであるChristina Lu氏はこのAIについて、人間の創造力を置き換えることはできず、「極めて創造的な作業」に人間がさらに集中できるようにするものだと説明している。例えば、コピーライティングに関わる反復的で低価値な作業を代行することができるという。

アリママによると、このツールはチューリングテストに合格しているという。

ツールにアクセスするには、商品のページにリンクを挿入して「Produce Smart Copy」ボタンをクリックすると、複数のキャッチコピー候補が表示される。

服飾チェーンのEspritや衣料ブランドのDickiesなどがこの新ツールを利用しており、キャッチコピーの長さや口調を調整することもできるという。

このツールはまた、アリババが保有するTaobaoやTmall、Mei.com、1688.comなどのウェブサイトを利用する小売企業やマーケターによって、1日に平均100万回近く使われているという。

文章の精度についてはどうなんだろうと思いますが、1秒で2万行というのは、本当に
人ではかなわない速度ですね。何かの部分を任せられるようになるといいなと感じました。
次回の更新も楽しみにして頂けますと幸いです!

【no.150】可変乗り物型AIロボット「CanguRo(カングーロ)」 千葉工大が開発

可変乗り物型AIロボット「CanguRo(カングーロ)」 千葉工大が開発

千葉工業大学は4日、乗り物に変形する新型の人工知能(AI)ロボットを開発したと発表した。ロボットのときは人間の後についてきて買い物を手伝ったり、乗り物のときは自ら姿勢を傾けて旋回をサポートする。さらに改良研究を重ねて企業と共同で実用化を目指す。

同大未来ロボット技術研究センターの古田貴之所長は「かつて人間のパートナーであり、乗り物だった馬を目指した。AI時代のイノベーティブな乗り物に進化させたい」と話している。

新型ロボットの名称は「CanguRo(カングーロ)」で、デザイナーの山中俊治氏と共同開発した。全長はロボットモードが550ミリメートル、乗り物モードが750ミリメートルで重さは64キロ。最高時速は10キロ。

ロボットモードでは空間の中で自分の現在位置を把握する「SLAM」と呼ぶ技術を活用し、指定した場所に自動で迎えにいく機能も搭載した。乗り物モードでは、旋回の際に人間の体幹移動に合わせてボディーを傾けることができる。古田氏は「あたかもスキーでスラロームを滑るような感覚が味わえる」と話す。

今後、会話機能やシーンに応じて自動的にモードを切り替える機能などを盛り込む計画だ。

自力で買い物に行くのが難しい高齢者の方にとって頼もしい乗り物になりそうですね。こういう物がもっと普及していく時代になっていくのでしょうか。

次回の更新も楽しみにしていただけますと幸いです!

【no.149】残念な営業、AIが見抜く コグニティ

残念な営業、AIが見抜く コグニティ

優秀な営業マンと残念な営業マンは何が違うのか。コグニティ(東京・品川)は人工知能(AI)を使い、人間が持つ曖昧さを解き明かそうとしている。音声や文字情報を一定の規則性に基づいて仕分け整理することで本質をつかむ。デジタルの最先端の取り組みだが、河野理愛社長(36)は起業のきっかけはアナログ。2冊の本との出合いだった。

事業の根幹となるAI「コグストラクチャー」の仕組みはこうだ。まず音声や文字情報を「アイデア・意見」や「データ・事実」など13の指標に沿って分類。その分類情報を各ブロックごとに関連づけ整理していくことで問題点をあぶり出したり、評価したり、解決策を導き出したりする。

例えばスピーチをした際に、テーマに沿った情報を論理的に提供しているかなどを解析できる。ビジネスの営業分野では、成績上位と下位の人の情報を比べることで営業手法の違いを浮き彫りにし、効果的な改善策を立案できるようになる。

既に情報分析と改善提案の2種類のサービスを展開しており、70社以上に導入した。創業から6年、従業員は150人を超え、データを分類するための専門部隊は国内外で100人以上までに増えた。

河野社長の起業のきっかけは1995年に本屋で手に取った「走る科学」(小林寛道著)という1冊の本だった。苦手の運動を何とかしたいとの思いから、同著を参考にトレーニングなどの方法を考えたが、結局は情報を整理しきれず、苦手克服には至らなかった。

同じような悩みを持つ人は多いのではないか。河野氏は独学でプログラミングを学び、ホームページ「あっと驚く研究のページ」を開設。スポーツ社会学や心理学、トレーニングなどの項目を作り、全国から情報を募った。やがてホームページはアスリートや大学の研究者などが集う場となり、悩みが投稿されると解決方法が提示されるような好循環が生まれた。

そんな時に1本の電話がかかってきた。徳島県を本拠地とするサッカーチーム「徳島ヴォルティス」のキャプテンだった笠原健氏からで、試合のデータ収集と分析を依頼したいとのことだった。

河野氏は毎週スタジアムに通い、試合中の選手とボールの動きをつぶさに集計、パスミスなどが起きたケースをまとめた。シーズン前半終了時点でデータをチームに返し、後半の戦略づくりに生かされた。

こうした経験を基に、19歳の時にスポーツトレーナーを紹介したり、運動器具を開発したりする会社を設立。学生起業家として注目を集め、事業は軌道に乗ったが、最終的には就職し事業は譲渡する道を選んだ。「ビジネスなのに無償で仕事を受けてしまうなど甘さがあった。こんなことでは通用しない」との思いからだった。

就職先はソニーで、デジタルビデオやデジカメ部門の経営戦略を担当した。やりがいのある仕事だったが、スマートフォンなどモバイル機器の急速に押され、部門が徐々に勢いを失っていく現状も目の当たりにした。

新規事業創出部門に異動し情報処理技術とビジネスの進化の過程を研究。「情報の根源を考えていくうちに、認知の限界が訪れるということを感じていた」。ふつふつと新たな思いが生まれ10年にソニーを退職、充電期間に入った。

この時期に、コグストラクチャーのヒントになる「議論の技法」(スティーヴン・トゥールミン著)という本に出合う。論理的な思考を結論、事実、修飾語に分ける手法を紹介しており、河野氏はこれを基に論文やスピーチなど約300件のサンプルを調査したところ、80%程度の精度で分類できることが分かった。

次にトゥールミン氏の手法では分類できなかったサンプルを分類するための手法の開発に取りかかる。「単語帳のようなものにすべて手作業で一つ一つ分類していく」といった地道な努力の結果、現在の13に分類する手法を確立した。

その後も試行錯誤を繰り返し、16年から本格的にサービスを始めた。中古車売買大手に導入した際には「買い取りで優秀な人と、販売で優秀な人では効果的な営業手法がまったく違うことが鮮明になった」という。

サービスの導入先では、分析結果を基に教育プログラムを作り、営業力の底上げを支援する。現在は医薬やコンサルタントなど高い技術を要する業界からの引き合いが強いが、「今後はサービスの裾野を広げていきたい」と意気込む。

AIはまだまだ成長の余地を残しているとも話す。「例えば、AIがどう思考して答えを出したのかなどを教えてくれれば、ユーザーはAIと対話しながら満足感を得られる」。見据えるゴールは先にある。

13の指標に沿って分類するということで、そのもう一歩踏み込んだロジックの中身やや、実際分析してみたらどんな結果が出るのか気になるところですね。
次回の更新も楽しみにして頂けますと幸いです!

【no.148】人工知能は地震を予測できるのか? 村井教授が進める「AI地震予測」

人工知能は地震を予測できるのか? 村井教授が進める「AI地震予測」

長年研究が進められてきた「地震予測」の世界も、ついに「人工知能(AI)」が活躍する時代に突入する可能性が出てきたようだ。

昨今、大阪北部を震源とした最大震度6弱の地震が発生するなど、絶えず大規模な地震の危険性と隣り合わせの日本列島。その被害を少しでも軽減させるために、ここ数年は国などから研究費の補助を受けない民間団体による地震予測の研究が活発となっている。

それらの団体のなかでも先駆け的な存在といえば、2013年に設立されたJESEA(ジェシア・地震科学探査機構)だ。

JESEAの創始者である村井俊治氏は、もともと測量界では世界的に名を知られた土木工学者で、長年勤めた東京大学を定年退官した後に、地震の事前予測に関する研究を開始。国土地理院の設置した電子基準点のデータを解析し、地表の異常変動を捉えて地震を予測するという新たな手法を生み出した人物だ。

JESEAが毎週配信しているメルマガ『週刊MEGA地震予測』は、これまで数々の大規模地震の前兆となる地殻変動を事前捕捉してきたことでも知られるが、今年3月の配信から“人工知能(AI)を使った地震予測”が参考資料として新たに加わった。

試験段階で震度4以上の地震を80%以上捕捉
この“人工知能(AI)を使った地震予測”とは、日本全国を30の地区に分け、その各地区ごとに大規模な地震が起こる危険度を0~5の数値で表示したもの。

予測の根拠となるデータは、従来までの『週刊MEGA地震予測』と同様に電子基準点などから得られる地表変動のデータで変わりはない。画期的なのは、そのデータの分析に統計数理に基づくAI技術の一手法である「MT法(マハラノビス・タグチ法)」を活用している点だ。

このMT法とは、もともとは自動車などの製造工場における設備監視の用途で広く使われているもの。簡単に説明すると、平常時に得られるデータの固まりをひとつの基準として定め、そのうえで日々刻々と変遷していくデータを一つ一つ計算し、平常時との違いをマハラノビス距離というひとつの指標にして出す。その指標が、あらかじめ定めたしきい値を超えた際、さらにその値が大きいほど、異常が起きていると判断される。つまり、品質管理の世界では“良品と不良品”を見分ける際に利用されるMT法を、AI地震予測では“地震発生の前兆が出ているか否か”で活用しているわけだ。

今回、MT法の技術を提供したのは、工学博士・手島昌一氏が代表を務めるアングルトライ株式会社。同社のMT法の技術は製造工場のみならず、JAXAのイプシロンロケットに搭載されている「自動・自律点検システム」にも活用されていることでも知られている。JESEAとアングルトライの両社は、AI地震予測導入に向けての研究・開発を約2年間に渡って重ね、その結果今年初めにほぼ完成形にまで到達。現在は地道な検証作業を続けているという。

というわけで、現状では本格運用のレベルには達していないとされるAI地震予測だが、実は今年2月~5月に発生した震度4以上の地震17件に関して、AI地震予測はそのうち14件を“危険度3以上”と事前予測していたという。まだ試験段階であるが、早くも捕捉率80%以上をマークと、来るべき正式公開に向けて着々と予測精度を上げている。

地震が多い日本だからこそ進歩していきそうな技術なのでしょうか。ぜひとも
実現していって欲しい技術ですね。。
次回の更新も楽しみにして頂けますと幸いです!

【no.147】裁判所でもAI活用の中国、音声認識で証言をテキスト化

裁判所でもAI活用の中国、音声認識で証言をテキスト化

先端的テクノロジーのあらゆる領域への導入が進む中国で、また新たな試みが始動した。それはAI(人工知能)技術の裁判所での活用だ。安徽省に本拠を置く「iFlytek(アイフライテック)」は中国の上級裁判所とパートナーシップを結び、音声認識や画像認識テクノロジーを裁判所の審理過程に投入しようとしている。

これにより裁判所の業務を効率化させ、審理の正確さを向上させようとしている。「人工知能+裁判所」と名づけられたこの試みは、既に中国各地の400に及ぶ法廷でテストが重ねられている。

iFlytekのAI技術は現在、画像や音声認識テクノロジーを用いた証拠物件の確認やフィルタリング、審理過程の効率化や裁判の進行管理に用いられている。同社のテクノロジーは特に中国語の音声認識に強みを持ち、声による身元確認や裁判に関わる人々の発言の書き起こしに役立てられる。原告や被告、事件の目撃者らの証言をリアルタイムでテキストに記録することが可能だ。

AIの裁判所での活用はまだ始まったばかりだが、iFlytekのテクノロジーは法廷審問にかかる時間を、30%短縮できたというデータもある。音声認識技術の活用で、審理内容を正確に記録し管理できることは大きな前進といえる。

iFlytekのテクノロジーは中国科学院によると、中国語の音声認識技術においてはアップルのSiriを上回る性能を持つという。同社は裁判所以外にも地方政府や警察、銀行などからAIベースの管理プラットフォーム開発を受注している。現地のベンチャーキャピタリストによると、これらの分野はセキュリティ上の理由から外資企業の参入が極めて困難だという。

1999年創業のiFlytekは中国科学技術大学とも提携を結び、上海の高級人民法でもトライアルを行なった。同社会長のLiu Qingfengは現地メディア「China Daily」の取材に対し次のように述べている。

「我が社のテクノロジーは現在、裁判所で4つの分野の審理において活用されている。殺人や窃盗、電話を用いた詐欺事件や違法な資金調達といった分野だ」

Liuによると裁判所でのAI技術の適用領域は、今年の年末までに79種類の分野に拡大する見込みだという。
裁判所での導入実績があったとしたら、企業での議事録作成などにはすぐに導入できそうですね。民間で利用できるとしたらどういったサービス体系になるのか気になります。
次回の更新も楽しみにして頂けますと幸いです!

【no.146】車内でAIスピーカー LINEがトヨタ車に導入

車内でAIスピーカー LINEがトヨタ車に導入

LINE(ライン)は28日、人工知能(AI)「クローバ」を活用した対話型スピーカーの機能を車の中で使えるサービスを始めると発表した。今年冬以降に発売されるトヨタ自動車の新型車に導入し、他のメーカーの車へも拡大を目指す。

サービス名は「クローバオート」。対応する通信機器を搭載した車が対象で、スマートフォン向けの専用アプリで接続すれば使えるようになる。手を使わず声で指示するだけで、メッセージの送受信などができるほか、目的地の天気を教えてくれたり、音楽を再生したりすることもできる。

LINEの舛田淳取締役は千葉県浦安市で開いた事業説明会で「両手が拘束されている車内こそ、AIスピーカーを最も生かせる」と語った。

確かに、声での操作しか出来ない場面、というと車の運転はぴったりですね。
家の中では使わなくとも、シーンを選ぶとまた違った活用がありそうです。
次回の更新も楽しみにして頂けますと幸いです!

【no.145】トランスコスモス、コンタクトセンターにおける応対品質の自動判定AIを開発

トランスコスモス、コンタクトセンターにおける応対品質の自動判定AIを開発

トランスコスモスとAI研究所のCommunication Science Labは、共同で進める機械学習プロジェクトの取り組みとして、コンタクトセンターにおける応対品質を自動で判定するAIを開発した。最初の取り組みとなる実証実験に成功し、業務における実用の見込みを得たため、今後2018年度内のサービス化を目指す。

トランスコスモスは、コンタクトセンターの応対品質における要素を、作法や礼儀にあたる「応対マナー」、応対の中核である「案内内容」、そして付加価値にあたる「プラスアルファの対応」の3つに分類。今回の実証実験では「応対マナー」を対象とした。

同社が蓄積したコンタクトセンターの運用ノウハウをもとに良質な学習データを大量作成し、Communication Science Labの先進的な技術力を用いた結果、人間の精度を維持しながら、大量かつ高速に応対マナーを自動判定するAIの開発に成功した。

これにより、特定のキーワードのみでNG通話を検出する音声認識システムと比べ、極めて高精度な自動判定・検出が可能となった。

同社はこの実証実験の成果を踏まえ、長年の難題であった2つ目の要素の「案内内容」における応対品質自動判定AIのサービス化にも着手。

コンタクトセンターでは、約款や注意事項などの案内においては特に正確な案内が求められるため、業務に精通した管理者による聞き起こしチェックと再発防止のための指導が不可欠だ。しかし、それには非現実的な工数を要し、品質の維持や管理をシステマティックに行うことは困難だった。

同社は、こうした中核業務における難題のAI化を推進し、2018年度内のサービス化と本格展開を目指す。

どういったルールなのか、判別の仕方や具体的な内容はまだよくわかりませんでしたが、コンタクトセンターの教育・管理体制に大きく変化をもたらしてくれそうな取り組みですね。
次回の更新も楽しみにして頂けますと幸いです!

【no.144】AIとの対話で業務システムをコントロールする「ConcieLink」 TISが提供開始

AIとの対話で業務システムをコントロールする「ConcieLink」 TISが提供開始

TISは2018年6月25日、AIとの対話インタフェースでさまざまな業務システムをコントロールできる「ConcieLink(コンシェリンク)」の提供を開始すると発表した。

ConcieLinkは、社内システムやデータベース、「Microsoft Office 365」や「Google G Suite」などのクラウドサービスなどと連携し、従業員のスケジュール検索・確保、商品や顧客の情報検索、各種申請システムへの入力などの作業を、AIとの対話で処理できるようにするサービス。

ConcieLinkの対話機能は、1つの文書指示で必要な情報(日付、人名など)を読み取り、不足している箇所を聞き返す高度な対話が可能で、業務指示を最小限のステップで実現できるという。

業務システムやクラウドサービスとの接続には、APIを利用する。接続先のAPIの知識と簡単なJavaの知識があれば、最短1カ月程度で利用可能になるという。テキスト入力だけの統一したユーザーインタフェースが提供されるため、新たなインタフェースの開発やユーザーへの教育も必要ない。

また、対話を起点に業務を実行できるようにするポータル基盤も用意。このポータル基盤は、ノンプログラミングで対話コマンドを構築できる管理機能や、ユーザー単位のメニューカスタマイズやメッセージ通知機能などを備える。

TISでは、ConcieLinkを導入することで、システム操作に費やす業務時間を削減し、優先すべき業務に注力できるようになることで、生産性向上につなげられるとしている。

また、対話インタフェースはモバイルファーストで設計されており、ブラウザ経由でさまざまな業務システムと連携できるため、新たなユーザーインタフェースの開発の必要がなく、モバイルシステム開発の負荷軽減や業務システムのモバイル化推進も可能になるという。

利用例としては、Office 365カレンダーやGoogleカレンダーと連携した会議の設定、ERP(Enterprise Resources Planning)やスクラッチシステムと連携した商品や販促品などの手配、経費精算システムと連携した各種精算業務、営業日報や顧客情報と連携した営業業務などの効率化を挙げている。

クラウド型は、ConcieLinkへの接続環境を用意するだけで利用でき、簡単にサービスを試行できる3カ月間無償の「Freeプラン」の他、最大リクエスト数と保存データ量に応じた6つの料金体系で提供する。

サブスクリプション型は、顧客のサーバやクラウドサービスに導入する形態で、1カ月当たりのリクエスト数に応じて、4つの料金体系で提供。導入支援サービスやオンサイト講習などのオプションサービスも用意する。

価格例(税別)は、クラウド型が最大リクエスト数1万、保存データ量1GBまでの「small.1」プランで月額5万円(最低契約期間が3カ月)。サブスクリプション型が最大リクエスト数10万までの「middle.1」で年額120万円(最低契約期間は1年間)。どちらも初期費用は無料。2018年9月28日まで、クラウド版の年間利用料を1年間無償にするリリース記念キャンペーンを実施する。

最初の作りこみが肝心かとは思いますが、上手く使えば社内の業務の時短に繋がりそうですね..!次回の更新も楽しみにして頂けますと幸いです!

【no.143】AIが音だけを頼りに情景を推定する!NTTが最新の開発技術を公開

AIが音だけを頼りに情景を推定する!NTTが最新の開発技術を公開

NTT コミュニケーション科学基礎研究所が、開発中のユニークな技術を報道陣に公開した。基礎研究段階の技術から実用化間近の技術まであり、今後どのようなサービスに結びついていくのか、期待が膨らむ内容だった。同技術は、NTT京阪奈ビルにおいて5月31日・6月1日に実施された一般公開イベント「オープンハウス2018」で紹介された。

浮像は、プロジェクターから影を投影することで、絵や手書きの文字などに奥行きを与える光投影技術。これにより印刷された対象を浮き上がるように見せる、不透明な印刷物に透明な質感を持たせる、といったことが可能になる。実際にデモを見たが、思わず触りたくなるほどリアルで驚いた。

担当者によれば、様々な角度から投影できるとのことで、壁に貼られた印刷のポスターや、紙の商品パッケージの見せたい部分だけを強調することも可能。人の注目を集めたい、インパクトのあるメッセージを伝えたい、そんな場面で活用されそうだ。

続いては、(カメラを使わずに)集音マイクだけを使って、まるでカメラで撮影したかのような情景を推定する技術。マイクアレイ(複数のマイク)で音を収録して、音を発している物体の種類、形状、動きなどをAI(人工知能)が予測している。担当者は「たとえば人は目をつぶっていても、喋っている人との距離感などを想像できます。それは経験で学んでいるから。この経験と知識をAIに与えています」と説明する。

ブースでは2つのデモが紹介された。ひとつは、円形のレールの上を玩具の電車が走る空間に、マイクが4本挿入されたシチュエーション。担当者は「ここでAIは、どんな音がどの角度から飛んできているか情報を取得しつつ、ディープラーニングに基づいた予測を働かせています。この音は電車だ。この方向に、この速度で走っている。そうした予測から、モニターに走る電車の影を映しています」と説明する。

なるほどモニターでは、ほぼリアルタイムで青い影が円を描いて動いているのが確認できた。もうひとつは、これを人に応用したもの。カメラを置いていない部屋で男女2人が会話をしているシチュエーションで、AIは予測結果を画像として出力した。

将来的には、カメラの設置が好ましくないような生活環境や公共空間での見守り、防犯といった利用シーンを想定している。また、カメラとの組み合わせでセンシングの質を上げる、といった利用方法も考えられている。

このほか興味深かったのは、複数の人の声が混ざった音声から、目的話者の声の特徴に基づき、その人の声だけを選択的に抽出する技術「SpeakBeam」。たとえ混雑するパーティ会場で録音した、複数人が同時に大声で喋っているような音源からでも、個人に切り分けて会話を抽出できる。

担当者は「カクテルパーティー効果、という言葉をご存知でしょうか。そもそも人間の脳に備わっている、選択的聴取能力です。人は声の高さ、声質などで聞きたい話者の声のみを聞いているわけですが、これをコンピュータで実現します」と説明する。

従来の技術でこれに近いことを実現するには、目的話者の音声データとして数時間ぶんの音源が必要となり、実用化にはほど遠かった。ところが人間の脳の仕組みを模したニューラルネットワークで機械学習を実施することで、10秒程度の音声データがあれば話者の声の特徴を抽出できるようになったという。

今後の展開として、担当者は「人の会話を理解する音声認識・ロボット技術に応用できます。また、聞きたい声だけを抽出できるボイスレコーダーや補聴器もつくれるでしょう」とアピールしていた。

音から情景を判断し、音を選択していく、というのは革新的ですね。
これからの展開が非常に楽しみです。
次回の更新も楽しみにして頂けますと幸いです!