【no.529】テキストAIの学習データ不足 ―アメリカに遅れを取る日本が講ずべき対策

テキストAIの学習データ不足 ―アメリカに遅れを取る日本が講ずべき対策

アメリカの動向
GAFA(Google, Amazon, Facebook, Apple )と呼ばれるアメリカ発の世界的IT企業群は大量のテキスト情報を保持しています。デジタル化されている昨今では、いったんデータが集中して集まると、他企業が参入しても追いつけません。GAFAが世界を席巻しているのは、この圧倒的なデータ量によるものです。

そしてデータを活用して価値を生み出すのが機械学習などのAI技術です。大量のテキストデータがあるからこそ自然言語処理の精度が上がります。アメリカはプラットフォームに集まる大量データを武器に、AIの開発で世界を牽引してきました。主要なAI会議で論文を発表したAIの研究者数を地域別に見ると、アメリカは全体の46%を占めています(日本は3.6%)。

また、データ以外にも日本とアメリカのAI開発の差を開いているのが、投資の差です。サービスを成長させ、得た資金を活用して技術に積極的に投資するからこそ、ベンチャー企業は資金を調達でき、研究が続けられます。

文部科学省の資料によると、AIに対するアメリカの政府予算は5000億円(日本は770億円)、民間投資は7兆円以上(日本は6000億円以上)となっています。

民間投資に開きがあるのは、GAFAをはじめとしたアメリカのIT企業がAI開発に巨額の投資をしていることが反映されていると言えます。

日本の動向
日本では2019年に政府が「AI戦略 2019」を発表し、高校生・大学生に対するリテラシー教育、研究開発体制の再構築、AIの社会実装促進などを打ち出しました。合わせて人材育成の取り組みも進み、経済産業省を中心に実務で活躍できる人材育成を目指した「AI Quest」プロジェクトが進むなどの取り組みも進んでいます。

確かに、日本はAI先進国と比較して後れを取ってはいるものの、AIのデータの活用という面ではまだ黎明期であり、日本も挽回可能であるとする意見もあり、今後も人材育成だけでなく積極的なスタートアップへの投資を行うなど、AIに対する取り組みを強化していく必要があります。

また、日本にはAIで解決するべき深刻な問題があります。それは、人口減少による労働力の低下です。生産年齢人口(15歳以上65歳未満の労働力になり得る人口)は1995年をピークに、総人口は2008年をピークに減少に転じています。少子高齢化に歯止めがかからないことはもはや明確である現在においては、AIなどの最先端技術を活用して労働力を補っていく必要があります。

しかし、日本ではAI活用は十分ではありません。日本オラクルが発表した世界10カ国・地域の企業の人工知能(AI)の利用状況調査によると、日本の職場におけるAIの利用率は29%で10カ国最下位となっています。

とはいうものの、日本でもAI開発が徐々に活発になりつつあります。2018年に199億5000万円だった国内のAI市場、2023年度には640億円とおよそ3.2倍に成長する見通しになっています。

特に製造業の企業はAIに意欲的に投資しています。画像認識を活用して、不良品の検知や作業員の安全対策を行うことで、品質を高め、生産性の向上を図っています。もともと製造業では自動化への取り組みを早くから行われており、その延長線上としてAIが導入されているため、事例も増えています。

日本のテキストAI開発の課題はデータ不足
多くのビジネスは文章や言葉を通じて行われています。AIがメールの内容を人間同等に理解できるようになったり、会議の内容を認識して議事録を作成したり、社内に蓄積されたデータから必要な情報を抜き出すなど自然言語処理が不可欠なものとなるでしょう。

また、グローバル化が進むなか、AIを活用した翻訳の精度向上も重要です。