Alles, was Sie über maschinelles Lernen wissen müssen [Data Scientist Interview]

Veröffentlicht: 2022-05-25

Sci-Fi hat viele Horrorbilder der Zukunft von Maschinen gemalt, die die Welt erobern. Diese düsteren Visionen von allmächtigen Maschinen sind nur einige der vielen Missverständnisse, die Menschen über KI und maschinelles Lernen haben.

In diesem Artikel beantwortet unser Experte für maschinelles Lernen, Juuso Lassila , die am häufigsten gestellten Fragen zum maschinellen Lernen und erklärt uns, warum Maschinen noch nicht bereit sind, die Welt zu erobern.

Maschinelles Lernen

1. Was ist maschinelles Lernen?

Maschinelles Lernen bedeutet, dass eine Maschine lernen kann, ohne programmiert zu werden. Maschinelles Lernen und KI werden oft fälschlicherweise als Synonyme verwendet, sind aber nicht dasselbe. Maschinelles Lernen ist eigentlich eine Teilmenge von KI.

„KI ist ein ziemlich schlecht definierter Begriff. Es kann alles Mögliche bedeuten“, erklärt Lassila.

Der große Unterschied zwischen maschinellem Lernen und KI besteht darin, dass KI nicht immer Daten benötigt. Einige sagen zum Beispiel, dass das Finden einer optimalen Route auf einer Karte KI ist. Dieser Prozess ist nicht datenbasiert, sondern ein Algorithmus .

Maschinelles Lernen hingegen ist KI, die Daten zum Lernen verwendet. Der Vorteil des maschinellen Lernens besteht darin, dass der Programmierer nicht wissen muss, wie das Modell das Problem löst. Das bedeutet, dass die Maschine Techniken anwenden kann, die dem Programmierer nicht bewusst waren. Maschinelles Lernen spielt heute in vielen Branchen eine wichtige Rolle.

2. Wie wird Machine Learning eingesetzt?

Maschinelles Lernen versucht, Daten und die darin enthaltenen Strukturen zu verstehen. Nehmen wir einfach etwas, das das Internet liebt: Bilder von Katzen und Hunden! Wenn Sie also Hunderte von Bildern Ihrer pelzigen Lieblingsfreunde in zufälliger Reihenfolge haben, können Sie maschinelles Lernen verwenden, um zwischen diesen Bildern zu unterscheiden. Die Maschine kann die Daten so organisieren, dass Sie beispielsweise nur Bilder von Katzen erhalten.

„Maschinelles Lernen wird Werte aus Daten vorhersagen, die Sie ihm zuführen, und diese Daten sinnvoll interpretieren“, sagt Lassila.

Eine gängige Art, maschinelles Lernen zu verwenden, ist die Klassifizierung von Daten, wie in unserem Beispiel mit den Bildern von Katzen und Hunden oben. Maschinelles Lernen wird jedoch auch in KI-Chatbots verwendet und um verschiedene Arten von Vorhersagen zu treffen. Beispielsweise kann maschinelles Lernen verwendet werden, um den Wert eines Hauses basierend auf der Größe, dem Standort, dem Baujahr und anderen Informationen zu schätzen.

3. Wie lernen Maschinen?

Maschinelles Lernen versucht normalerweise, Fehler eines Modells zu minimieren. Zunächst beginnt es mit zufälligen Antworten. Dann geben die Menschen ihm die richtigen Antworten, erklärt Lassila.

Es gibt eine Möglichkeit zu messen, wie falsch die Maschine mit den Antworten lag, die sie gab. In einigen Modellen für maschinelles Lernen wird Differenzieren verwendet, um die Fehler zu minimieren.

Durch Differenzieren können Sie berechnen, in welche Richtung die Parameter geändert werden sollten, um den Wert der Fehlerfunktion zu verringern.

„Dann wissen Sie, wie Sie Ihre Parameter ändern können, damit der Wert der Funktion abnimmt. Sie machen dann einen kleinen Schritt in Richtung eines kleineren Fehlers, indem Sie die Parameter ändern. Auf diese Weise minimieren Sie die Fehler“, sagt Lassila.

4. Kann eine Maschine fehlerfrei sein?

Theoretisch ist es möglich, dass es keine Fehler gibt, aber in der realen Welt passiert es nicht wirklich. Selbst im besten Fall kann die Maschine nur vielleicht 99,9 % der Daten richtig machen.

„Für die Klassifizierung können wir die Genauigkeit messen“, sagt Lassila. Normalerweise wird eine Genauigkeit von 90-95 % als recht gut angesehen. Wenn die Fehlermargen niedrig genug sind, ist die Maschine bereit, in die Produktion zu gehen. Wie gering die Fehlermarge sein muss, bevor das Produkt live gehen kann, hängt von der Aufgabe ab, die die Maschine erfüllen soll.

Wenn man über KI-Chatbots spricht, ist es schwierig zu sagen, wann der Bot hilfreicher als lästig sein wird, da KI-Chatbots so viele Beispielfragen wie möglich haben können. Die Maschine muss immer die beste der verfügbaren Antworten auswählen. Wie korrekt die Maschine ist, hängt davon ab, wie viele Beispielfragen es gibt.

„Wenn Sie eine Frage haben, ist die Maschine immer richtig. Wenn Sie zwei haben, ist es hoffentlich ziemlich oft richtig, aber wenn Sie 100 Fragen haben, wird die Maschine sehr wahrscheinlich die falsche Antwort auswählen“, erklärt Lassila.

5. Was ist Deep Learning?

Deep Learning ist eine Methode des maschinellen Lernens, die Schichten in den Modellen verwendet. Eine Schicht erzeugt eine Ausgabe und diese Ausgabe wird an die zweite Schicht übertragen und so weiter. Deep Learning wird normalerweise in neuronalen Netzen durchgeführt .

„Neuronale Netze sind ziemlich praktisch, weil sie sich gut an verschiedene Eingabe- und Ausgabeformate anpassen“, sagt Lassila.

Neuronale Netze sind sehr vielseitig und haben daher viele Anwendungsfälle. KI-Chatbots verwenden normalerweise auch neuronale Netze.

„Wir erstellen diese Satzeinbettungen aus Nachrichten, die nur Vektorpunkte im Raum sind. Dann messen wir ihre Ähnlichkeiten. Es verwendet ein neuronales Netzwerk. Es hat viele Ebenen und gibt am Ende eine Ausgabe“, erklärt Lassila.

Es gibt auch viele Methoden des maschinellen Lernens, die nicht tief sind. Wie Support Vector Machines oder Entscheidungsbäume .

6. Was sind die Engpässe des maschinellen Lernens?

Daten sind eines der Dinge, die maschinelles Lernen einschränken. Wenn Sie keine Daten haben, funktioniert maschinelles Lernen nicht. Sie benötigen auch Rechenressourcen. Oft führen die Modelle auch zu Einschränkungen.

„Für grundlegende Aufgaben wie die Klassifizierung sind die Modelle gut. Und in diesen Fällen sind Sie nur durch Daten- und Rechenressourcen begrenzt. Aber in manchen Bereichen sind die Modelle noch nicht so gut“, sagt Lassila.

Je mehr Daten, desto besser, solange Sie über die Ressourcen verfügen, um diese Daten zu berechnen. Allerdings müssen die Daten von guter Qualität sein. Außerdem müssen die Modelle groß sein, damit das Modell in der Lage ist, alle komplexen Eingaben zu verarbeiten, die es möglicherweise erhält. Sie benötigen viel Rechenleistung, damit die Maschine diese Daten verarbeiten kann.

„Man kann auf viele Daten zugreifen. Das ist eigentlich nicht das Problem.“ Sagt Lassila. „Das Problem sind die Modelle und die Zeit, die es braucht, um sie zu trainieren. Es wird viel Speicherplatz benötigt, um diese Modelle zu speichern.“

Ein weiterer Fallstrick des maschinellen Lernens ist die derzeit verfügbare Modellarchitektur für einige Aufgaben. Derzeit gibt es keine gute Modellarchitektur für Satzeinbettungen.

„Es wird immer noch geforscht, um ein wirklich gutes Modell zu finden“, sagt Lassila.

7. Wie bringt man einer Maschine etwas bei?

Zunächst einmal benötigen Sie viele Daten, und die Daten, die Sie zum Trainieren der Modelle verwenden, benötigen menschliche Labels.

„Große Unternehmen, die maschinelles Lernen einsetzen, haben Armeen von Leuten, die die Daten nur kennzeichnen“, erklärt Lassila.

Auch wenn der Bot damit beginnen kann, die Daten mit der Zeit zu kennzeichnen, möchten Sie die Antworten, die das Modell Ihnen gibt, nicht als Trainingsdaten verwenden. Die Modelle machen mehr Fehler als Menschen. Wenn Sie die Maschinenbeschriftung als Trainingsdaten verwenden, bringen Sie diese Fehler den Modellen erneut bei.

„Dadurch werden die Fehler immer größer. „

Es ist auch möglich, aktives Lernen zu verwenden, bei dem die Modelle erkennen können, welche Art von Datenpunkten nützlich wäre, um sie zu kennzeichnen. Dadurch kann das Lernen effizienter werden. „Die Maschine kann den Etikettierprozess steuern. Dennoch sollten Menschen die Kennzeichnung vornehmen, damit sich die Fehler nicht ausbreiten. „

Sobald Menschen ein Modell mit den Daten trainiert haben, sollte die Maschine in der Lage sein, diese Kennzeichnung für die unsichtbaren Eingaben zu reproduzieren. Aber wenn Sie neue Antworten brauchen, müssen die Daten von Menschen neu gekennzeichnet werden.

Die Zukunft der KI

8. Was ist die Zukunft des maschinellen Lernens?

Maschinelles Lernen entwickelt sich derzeit sehr schnell. Vor einigen Jahren wurde ein weiteres Deep-Learning-Modell, das Transformer-Modell, eingeführt. Die Entdeckung des Transformatormodells hatte einen enormen Einfluss auf das maschinelle Lernen.

„Wir haben das gesamte Forschungsfeld um diese Entdeckung herum neu aufgebaut. Es hat wirklich gut funktioniert“, erklärt Lassila.

Das Transformer-Modell wird auch in KI-Chatbots mit Natural Language Processing verwendet. „Aber irgendwann werden wir das Ende der Straße erreichen, wenn es darum geht, wie gut wir diese Architektur nutzen können“, sagt Lassila. „Hoffentlich finden wir etwas Neues, das noch bessere Ergebnisse liefert.“

9. Werden Maschinen die Welt erobern?

Die Menschen erwarten zu viel oder zu wenig von KI und maschinellem Lernen.

„Es mangelt an Verständnis für die Fähigkeiten von KI“, sagt Lassila.

Es scheint also, dass Maschinen die Welt noch nicht ganz erobern werden. Bots müssen einige Hürden überwinden, bevor das passiert.

„Die Modelle und die Architektur sind noch nicht da. Wir haben die Daten und die Rechenressourcen, um eine gute KI zu entwickeln, aber wir brauchen immer noch diese guten Architekturen, damit Roboter übernehmen können.“

Auch wenn die KI noch nicht bereit ist, die Welt zu erobern, wird sie einige Jobs übernehmen.

„Einige Jobs könnten an einigen Stellen durch KI ersetzt werden. Das wären sich wiederholende Aufgaben, die nicht viel Nachdenken erfordern“, sagt Lassila.

Es gibt zwei Möglichkeiten, darüber nachzudenken, wie KI den Arbeitsmarkt verändern wird. Einer davon ist, dass KI Arbeitsplätze ersetzt, aber sie könnte auch Arbeitsplätze verbessern. Es kann neben Menschen arbeiten. Ein gutes Beispiel hierfür sind Chatbots , die sich mit einem Live-Agenten verbinden können, wenn sie dem Website-Besucher nicht helfen können.

„KI kann die Effizienz vieler Jobs verbessern.“

Sie benötigen jedoch immer noch personelle Ressourcen, um die Ungenauigkeiten zu bekämpfen. KI denkt nicht wie ein Mensch. Es verwendet verschiedene Methoden. Und manchmal ergibt es für uns keinen Sinn, warum es etwas anzeigt.

„Eines der größten Probleme mit KI ist, dass die Maschine nicht erklärt, warum sie eine bestimmte Ausgabe erzeugt hat. Für das Modell mag es Sinn machen, aber nicht für den Menschen.“

Wenn Sie mehr über maschinelles Lernen und KI erfahren möchten, lesen Sie unseren KI-Chatbot-Leitfaden .