【no.625】データサイエンスから機械学習エンジニアリングへの移行

データサイエンスから機械学習エンジニアリングへの移行

機械学習とソフトウェアの世界は変わりつつある
過去20年間、 機械学習は1つの疑問を問い続けてきた。何事かを実行するモデルを訓練することはできるのか。

「何事か」と言うからには、もちろんどんなタスクであってもよい。文章の次の単語を予測する、写真の中の顔を認識する、特定の音を発生させる。機械学習が機能するかどうか、あるいは正確な予測ができるかどうか、ということが目標だったのだ。

データサイエンティストによる何十年にもわたる研究のおかげで、今では多くの「何事か」を実行できるモデルが、以下のようにたくさんある。

OpenAIのGPT-2(現在はGPT-3)は、なかなかに人間らしいテキストを生成することができる。
(公式版をめぐる議論はさておき(※訳註1))YOLOv5のようなオブジェクト検出モデルは、毎秒140フレームの動画からオブジェクトを解析することができる。
Tacotron 2のようなテキスト音声合成モデルは、人間の声のように聞こえる音声を生成することができる。
データサイエンティストや機械学習の研究者たちの仕事は驚くべきもので、その結果、自然と第二の疑問が生まれてきた。

これらのモデルで何が作れるのか、そして、どうやって作れるのか。

この疑問は、明らかにデータサイエンスの問題ではない。工学的な問題である。それに答えるために、機械学習エンジニアリングという新しい専門分野が登場した。