機械学習について知っておくべきことすべて[データサイエンティストインタビュー]

公開: 2022-05-25

サイエンスフィクションは、世界を支配する機械の未来について多くの恐ろしい絵を描いてきました。全能の機械に関するこれらの厳しいビジョンは、AIと機械学習について人々が抱く多くの誤解の一部です。

この記事では、機械学習スペシャリストのJuuso Lassilaが、機械学習に関して最もよくある質問に答え、機械が世界を引き継ぐ準備が整っていない理由を説明します。

1.機械学習とは何ですか？

機械学習とは、機械がプログラムされていなくても学習できることを意味します。機械学習とAIは、誤って同義語として使用されることがよくありますが、同じではありません。機械学習は実際にはAIのサブセットです。

「AIは非常に明確に定義されていない用語です。それはなんでも意味があります」とLassilaは説明します。

機械学習とAIの大きな違いは、AIが常にデータを必要とするわけではないということです。たとえば、地図上で最適なルートを見つけることはAIであると言う人もいます。このプロセスはデータベースではなく、アルゴリズムです。

一方、機械学習は、データを使用して学習するAIです。機械学習の利点は、プログラマーがモデルが問題をどのように解決するかを知る必要がないことです。これは、プログラマーが気付いていなかった手法をマシンが使用できることを意味します。今日、機械学習は多くの業界で重要な役割を果たしています。

2.機械学習はどのように使用されますか？

機械学習は、データとその中の構造を理解しようとします。簡単に言うと、インターネットが大好きなもの、猫と犬の写真を撮りましょう。したがって、お気に入りの毛皮のような友達の画像がランダムな順序で何百枚もある場合は、機械学習を使用してこれらの画像を区別できます。たとえば、猫の写真だけが表示されるように、マシンはデータを整理できます。

「機械学習は、フィードしたデータから値を予測し、そのデータを理解します」とLassila氏は言います。

機械学習を使用する一般的な方法は、上記の猫と犬の写真の例のように、データを分類することです。ただし、機械学習はAIチャットボットでも使用され、さまざまなタイプの予測を行います。たとえば、機械学習を使用して、家のサイズ、場所、建てられた年などの情報に基づいて家の価値を見積もることができます。

3.機械はどのように学習しますか？

機械学習は通常、モデルのエラーを最小限に抑えようとしています。まず、ランダムな答えから始まります。それから人間はそれに正しい答えを与えます、とLassilaは説明します。

マシンが与えた答えでどれほど間違っていたかを測定する方法があります。一部の機械学習モデルでは、エラーを最小限に抑えるために微分が使用されます。

微分を使用すると、誤差関数の値を減らすためにパラメーターを変更する必要がある方向を計算できます。

「次に、関数の値が減少するようにパラメーターを変更する方法を知っています。次に、パラメータを変更して、エラーを小さくするための小さな一歩を踏み出します。そうすれば、エラーを最小限に抑えることができます」とLassila氏は言います。

4.マシンにエラーがないことはありますか？

理論的にはエラーが発生しない可能性がありますが、現実の世界では実際には発生していません。最良の場合でも、マシンはデータの99.9％しか正しく取得できません。

「分類のために、精度を測定することができます」とLassila氏は言います。通常、90〜95％の精度は非常に良いと見なされます。エラーマージンが十分に低い場合、マシンは生産に入る準備ができています。製品を稼働させる前に許容誤差をどれだけ低くする必要があるかは、マシンが実行することになっているタスクによって異なります。

AIチャットボットについて話すとき、AIチャットボットはできるだけ多くの例の質問をすることができるので、ボットが迷惑になるよりもいつ役立つかを言うのは難しいです。マシンは常に利用可能な答えの中で最良のものを選択する必要があります。マシンがどれだけ正しいかは、質問の例がいくつあるかによって異なります。

「質問が1つある場合、マシンは常に正しいです。 2つある場合は、それが正しいことが多いと思いますが、100の質問がある場合、マシンは間違った答えを選択する可能性が非常に高くなります」とLassila氏は説明します。

5.ディープラーニングとは何ですか？

深層学習は、モデルのレイヤーを使用する機械学習の方法です。 1つのレイヤーが出力を生成し、その出力が2番目のレイヤーに転送されます。ディープラーニングは通常、ニューラルネットワークで行われます。

「ニューラルネットワークは、さまざまな入力形式と出力形式にうまく適応するため、非常に便利です」とLassila氏は言います。

ニューラルネットワークは非常に用途が広く、そのため多くのユースケースがあります。 AIチャットボットは通常、ニューラルネットワークも使用します。

「私たちは、空間内の単なるベクトル点であるメッセージからそれらの文の埋め込みを作成します。次に、それらの類似性を測定します。ニューラルネットワークを使用します。たくさんのレイヤーがあり、最後に出力を出します」とラッシラは説明します。

深くない機械学習の方法もたくさんあります。サポートベクターマシンや決定木など。

6.機械学習のボトルネックは何ですか？

データは、機械学習に制限をもたらすものの1つです。データがない場合、機械学習は機能しません。計算リソースも必要です。多くの場合、モデルにも制限があります。

「分類などの基本的なタスクには、モデルが適しています。そしてそのような場合、あなたはデータと計算リソースによって制限されます。しかし、一部のドメインでは、モデルはまだそれほど良くありません」とLassilaは言います。

そのデータを計算するためのリソースがある限り、データが多いほど良いです。ただし、データは高品質である必要があります。また、モデルは、取得する可能性のあるすべての複雑な入力を処理できるように、大きくする必要があります。マシンがそのデータを処理するには、多くの処理能力が必要です。

「多くのデータにアクセスできます。それは本当に問題ではありません。」ラッシラは言います。「問題は、モデルとモデルのトレーニングにかかる時間です。これらのモデルを保存するには、多くのメモリが必要です。」

機械学習のもう1つの落とし穴は、一部のタスクで現在利用可能なモデルアーキテクチャです。現在、文を埋め込むための優れたモデルアーキテクチャはありません。

「本当に良いモデルを見つけることはまだ進行中の研究です」とLassilaは言います。

7.どのように機械を教えますか？

まず、大量のデータが必要であり、モデルのトレーニングに使用するデータには人間のラベルが必要です。

「機械学習を使用する大企業には、データにラベルを付けるだけの人々の軍隊があります」とLassila氏は説明します。

ボットが時間の経過とともにデータのラベル付けを開始できる場合でも、モデルが提供する回答をトレーニングデータとして使用することは望ましくありません。モデルは人間よりもエラーを起こします。マシンのラベル付けをトレーニングデータとして使用する場合は、それらのエラーをモデルに再度教えます。

「それにより、エラーはますます大きくなります。「「

モデルがラベル付けに役立つデータポイントの種類を判断できるアクティブラーニングを使用することもできます。これにより、学習がより効率的になります。「機械はラベリングプロセスをガイドできます。それでも、エラーが伝播しないように、人間はラベル付けを行う必要があります。「「

人間がデータを使用してモデルをトレーニングすると、マシンは目に見えない入力に対してそのラベルを再現できるようになります。ただし、新しい回答が必要な場合は、人間がデータに再度ラベルを付ける必要があります。

8.機械学習の未来は何ですか？

現在、機械学習は非常に急速に発展しています。数年前、別の深層学習モデルであるトランスフォーマーモデルが導入されました。トランスモデルの発見は、機械学習に大きな影響を与えました。

「私たちはその発見を中心に研究分野全体を再構築してきました。それは本当にうまくいきました」とLassilaは説明します。

トランスフォーマーモデルは、自然言語処理を備えたAIチャットボットでも使用されます。「しかし、ある時点で、そのアーキテクチャをどれだけうまく使用できるかについて、道の終わりに到達するでしょう」とLassila氏は言います。「うまくいけば、さらに良い結果をもたらす新しいものが見つかるでしょう。」

9.機械は世界を引き継ぐのでしょうか？

人々は、AIと機械学習に期待しすぎたり、不十分だったりします。

「AIの機能についての理解が不足しています」とLassila氏は言います。

ですから、機械はまだ世界を引き継ぐことはないようです。ボットには、それが発生する前に克服しなければならないいくつかのハードルがあります。

「モデルとアーキテクチャはまだありません。優れたAIを作成するためのデータと計算リソースはありますが、ロボットが引き継ぐための優れたアーキテクチャが必要です。」

AIはまだ世界を引き継ぐ準備ができていませんが、いくつかの仕事を引き継ぐでしょう。

「一部のジョブは、ある時点でAIに置き換えられる可能性があります。これらは多くの思考を必要としない反復的な仕事になるでしょう」とLassilaは言います。

AIが雇用市場をどのように変えるかについて考える方法は2つあります。 1つは、AIが仕事に取って代わるということですが、それは仕事を強化する可能性もあります。それは人間と一緒に働くことができます。この良い例はチャットボットです。チャットボットは、Webサイトの訪問者を支援できないときにライブエージェントに接続できます。

「AIは多くの仕事の効率を向上させることができます。」

ただし、不正確さを解消するには、依然として人材が必要です。 AIは人間のようには考えていません。さまざまな方法を使用します。そして、なぜそれが何かを示すのか私たちには意味がない場合があります。

「AIの最大の問題の1つは、マシンが特定の出力を作成した理由を説明していないことです。モデルには意味があるかもしれませんが、人間には意味がありません。」

機械学習とAIについて詳しく知りたい場合は、 AIチャットボットガイドをご覧ください。