Unüberwachtes Lernen: Wie Maschinen selbstständig lernen

Veröffentlicht: 2021-03-19

Unüberwachtes Lernen lässt Maschinen selbstständig lernen.

Diese Art des maschinellen Lernens (ML) verleiht KI-Anwendungen die Fähigkeit, ohne menschliche Aufsicht zu lernen und versteckte Muster in großen Datensätzen zu finden. Unüberwachtes Lernen ist ebenfalls entscheidend für den Erfolg Künstliche allgemeine Intelligenz.

Das Etikettieren von Daten ist arbeitsintensiv und zeitaufwändig und in vielen Fällen unpraktisch. Hier bringt unüberwachtes Lernen einen großen Unterschied, indem es KI-Anwendungen die Möglichkeit gibt, ohne Labels und Überwachung zu lernen.

Was ist unüberwachtes Lernen?

Unüberwachtes Lernen (UL) ist eine maschinelle Lerntechnik, die verwendet wird, um Muster in Datensätzen zu identifizieren, die nicht klassifizierte und nicht gekennzeichnete Datenpunkte enthalten. Bei diesem Lernverfahren werden einem KI-System nur die Eingabedaten und keine entsprechenden Ausgabedaten gegeben.

Im Gegensatz zum überwachten Lernen erfordert das nicht überwachte maschinelle Lernen keinen Menschen, der das Modell überwacht. Der Data Scientist lässt die Maschine lernen, indem er Daten beobachtet und selbstständig Muster findet. Mit anderen Worten, diese Unterkategorie des maschinellen Lernens ermöglicht es einem System, ohne externe Anleitung auf die gegebenen Informationen zu reagieren.

Unüberwachte Lerntechniken sind entscheidend für die Erstellung von Systemen mit künstlicher Intelligenz mit menschlicher Intelligenz. Denn intelligente Maschinen müssen in der Lage sein, (selbstständige) Entscheidungen zu treffen, indem sie große Mengen ungetaggter Daten analysieren.

Im Vergleich zu überwachten Lernalgorithmen sind UL-Algorithmen besser in der Lage, komplexe Aufgaben auszuführen. Überwachte Lernmodelle liefern jedoch genauere Ergebnisse, da ein Tutor dem System explizit mitteilt, wonach es in den gegebenen Daten suchen soll. Aber im Fall von unüberwachtem Lernen können die Dinge ziemlich unvorhersehbar sein.

Künstliche neuronale Netze, die machen tiefes Lernen eine Realität, mag den Anschein haben, als würde sie durch unbeaufsichtigtes Lernen unterstützt. Zwar können die Lernalgorithmen neuronaler Netze auch überwacht werden, wenn die gewünschte Ausgabe bereits bekannt ist.

Unüberwachtes Lernen kann ein Ziel an sich sein. Beispielsweise können UL-Modelle verwendet werden, um versteckte Muster in riesigen Datenmengen zu finden und sogar Datenpunkte zu klassifizieren und zu kennzeichnen. Die Gruppierung unsortierter Datenpunkte erfolgt durch Identifizierung ihrer Ähnlichkeiten und Unterschiede.

Einige Gründe, warum unbeaufsichtigtes Lernen unerlässlich ist.

Unbeschriftete Daten sind in Hülle und Fülle vorhanden.
Das Kennzeichnen von Daten ist eine mühsame Aufgabe, die menschliche Arbeit erfordert. Der eigentliche Prozess kann jedoch ML-unterstützt sein, was die Kennzeichnung für die beteiligten Menschen erleichtert.
Es ist nützlich, um unbekannte und Rohdaten zu untersuchen.
Es ist nützlich, um die Mustererkennung in großen Datensätzen durchzuführen.

Unüberwachtes Lernen kann weiter in zwei Kategorien unterteilt werden: parametrisches unüberwachtes Lernen und nicht-parametrisches unüberwachtes Lernen .

Wie unüberwachtes Lernen funktioniert

Einfach ausgedrückt funktioniert unüberwachtes Lernen, indem nicht kategorisierte, nicht gekennzeichnete Daten analysiert und darin versteckte Strukturen gefunden werden.

Beim überwachten Lernen füttert ein Datenwissenschaftler das System mit gekennzeichneten Daten, beispielsweise den Bildern von Katzen, die als Katzen gekennzeichnet sind, sodass es anhand von Beispielen lernen kann. Beim unbeaufsichtigten Lernen stellt ein Datenwissenschaftler nur die Fotos bereit, und es liegt in der Verantwortung des Systems, die Daten zu analysieren und festzustellen, ob es sich um Bilder von Katzen handelt.

Unüberwachtes maschinelles Lernen erfordert riesige Datenmengen. In den meisten Fällen gilt das Gleiche für überwachtes Lernen, da das Modell mit mehr Beispielen genauer wird.

Der Prozess des unüberwachten Lernens beginnt damit, dass die Data Scientists die Algorithmen anhand der Trainingsdatensätze trainieren. Die Datenpunkte in diesen Datensätzen sind unbeschriftet und nicht kategorisiert.

Das Lernziel des Algorithmus besteht darin, Muster innerhalb des Datensatzes zu identifizieren und die Datenpunkte basierend auf denselben identifizierten Mustern zu kategorisieren. Im Beispiel von Katzenbildern kann der unüberwachte Lernalgorithmus lernen, die besonderen Merkmale von Katzen zu identifizieren, wie etwa ihre Schnurrhaare, langen Schwänze und einziehbaren Krallen.

Wenn Sie darüber nachdenken, lernen wir durch unüberwachtes Lernen, Dinge zu identifizieren und zu kategorisieren. Angenommen, Sie haben noch nie Ketchup oder Chilisauce probiert. Wenn Sie jeweils zwei „unbeschriftete“ Flaschen Ketchup und Chilisauce bekommen und gebeten werden, sie zu probieren, können Sie zwischen ihren Aromen unterscheiden.

Sie werden auch in der Lage sein, die Besonderheiten beider Saucen (eine ist sauer und die andere scharf) zu identifizieren, auch wenn Sie die Namen von beiden nicht kennen. Probiere sie noch ein paar Mal, um dich mit dem Geschmack vertrauter zu machen. Bald können Sie Gerichte basierend auf der hinzugefügten Soße gruppieren, indem Sie sie einfach probieren.

Durch die Analyse des Geschmacks können Sie spezifische Merkmale finden, die die beiden Saucen und Gruppengerichte unterscheiden. Sie müssen die Namen der Saucen oder der Gerichte nicht kennen, um sie zu kategorisieren. Am Ende könntest du sogar die eine die süße Soße und die andere die scharfe Soße nennen.

Dies ähnelt der Art und Weise, wie Maschinen mithilfe von unüberwachtem Lernen Muster erkennen und Datenpunkte klassifizieren. Im selben Beispiel wäre überwachtes Lernen, dass Ihnen jemand die Namen der beiden Saucen und ihren Geschmack vorher sagt.

Arten des unüberwachten Lernens

Unüberwachte Lernprobleme können in Clustering- und Assoziationsprobleme eingeteilt werden.

Clustering

Clustering oder Clusteranalyse ist der Prozess der Gruppierung von Objekten in Cluster. Die Elemente mit den meisten Ähnlichkeiten werden zusammen gruppiert, während der Rest in andere Cluster fällt. Ein Beispiel für Clustering wäre das Gruppieren von YouTube-Nutzern basierend auf ihrem Wiedergabeverlauf.

Abhängig von ihrer Funktionsweise kann Clustering wie folgt in vier Gruppen eingeteilt werden:

Exklusives Clustering: Wie der Name schon sagt, gibt exklusives Clustering an, dass ein Datenpunkt oder Objekt nur in einem Cluster existieren kann.
Hierarchisches Clustering: Hierarchisch versucht, eine Hierarchie von Clustern zu erstellen. Es gibt zwei Arten von hierarchischem Clustering: agglomerative und divisive . Agglomerativ folgt dem Bottom-up-Ansatz, behandelt zunächst jeden Datenpunkt als einzelnes Cluster, und die Clusterpaare werden zusammengeführt, wenn sie in der Hierarchie nach oben wandern. Divisive ist das genaue Gegenteil von Agglomeration. Jeder Datenpunkt beginnt in einem einzelnen Cluster und wird aufgeteilt, wenn er sich in der Hierarchie nach unten bewegt.
Überlappendes Clustering: Durch Überlappung kann ein Datenpunkt in zwei oder mehr Clustern gruppiert werden.
Probabilistisches Clustering: Probabilistic verwendet Wahrscheinlichkeitsverteilungen, um Cluster zu erstellen. Beispielsweise können „grüne Socken“, „blaue Socken“, „grünes T-Shirt“ und „blaues T-Shirt“ entweder in zwei Kategorien „grün“ und „blau“ oder „Socken“ und „T-Shirt“ gruppiert werden ".

Verband

Assoziationsregellernen (ARL) ist eine unüberwachte Lernmethode, die verwendet wird, um Beziehungen zwischen Variablen in großen Datenbanken zu finden. Im Gegensatz zu einigen maschinellen Lernalgorithmen ist ARL in der Lage, nicht numerische Datenpunkte zu verarbeiten.

Einfacher gesagt geht es bei ARL darum herauszufinden, wie bestimmte Variablen miteinander verknüpft sind. Wer beispielsweise ein Motorrad kauft, kauft am ehesten einen Helm.

Solche Beziehungen zu finden, kann lukrativ sein. Wenn beispielsweise Kunden, die Produkt X kaufen, eher Produkt Y kaufen, kann ein Online-Händler Produkt Y jedem empfehlen, der Produkt X kauft.

Das Lernen von Assoziationsregeln verwendet im Kern if/then-Anweisungen. Diese Aussagen können Assoziationen zwischen unabhängigen Daten aufdecken. Zusätzlich werden die Wenn/Dann-Muster oder -Beziehungen anhand von Unterstützung und Vertrauen beobachtet .

Der Support gibt an, wie oft die Wenn/Dann-Beziehung in der Datenbank vorkommt. Konfidenz definiert, wie oft die Wenn/Dann-Beziehung als gültig befunden wurde.

Warenkorbanalyse und Web-Nutzungs-Mining werden mit der Assoziationsregel ermöglicht.

Unüberwachte Lernalgorithmen

Sowohl das Clustering als auch das Lernen von Assoziationsregeln werden mit Hilfe von Algorithmen implementiert.

Der Apriori-Algorithmus, der ECLAT-Algorithmus und der Wachstumsalgorithmus für häufige Muster (FP) sind einige der bemerkenswerten Algorithmen, die zum Implementieren der Assoziationsregel verwendet werden. Clustering wird durch Algorithmen wie k-Means-Clustering und Hauptkomponentenanalyse (PCA) ermöglicht.

Apriori-Algorithmus

Der Apriori-Algorithmus wurde für Data Mining entwickelt. Es ist nützlich, um Datenbanken zu durchsuchen, die eine große Anzahl von Transaktionen enthalten, z. B. eine Datenbank, die die Liste der Artikel enthält, die von Käufern in einem Supermarkt gekauft wurden. Es wird verwendet, um die schädlichen Wirkungen von Drogen zu identifizieren und in der Warenkorbanalyse, um die Artikel zu finden, die Kunden mit größerer Wahrscheinlichkeit zusammen kaufen.

ECLAT-Algorithmus

Equivalence Class Clustering and Bottom-up Lattice Traversal , kurz ECLAT , ist ein Data-Mining-Algorithmus, der verwendet wird, um Itemset-Mining zu erreichen und häufige Elemente zu finden.

Der Apriori-Algorithmus verwendet ein horizontales Datenformat und muss daher die Datenbank mehrmals scannen, um häufige Elemente zu identifizieren. Andererseits verfolgt ECLAT einen vertikalen Ansatz und ist im Allgemeinen schneller, da es die Datenbank nur einmal scannen muss.

Frequent Pattern (FP)-Wachstumsalgorithmus

Der Wachstumsalgorithmus für häufige Muster (FP) ist eine verbesserte Version des Apriori-Algorithmus. Dieser Algorithmus stellt die Datenbank in Form einer Baumstruktur dar, die als häufiger Baum oder Muster bekannt ist.

Ein solcher häufiger Baum wird zum Mining der häufigsten Muster verwendet. Während der Apriori-Algorithmus die Datenbank n+1 Mal scannen muss (wobei n die Länge des längsten Modells ist), benötigt der FP-Wachstumsalgorithmus nur zwei Scans.

K-bedeutet Clusterbildung

Viele Iterationen des k-Means-Algorithmus sind im Bereich der Datenwissenschaft weit verbreitet. Einfach ausgedrückt gruppiert der k-Means-Clustering-Algorithmus ähnliche Elemente in Clustern. Die Anzahl der Cluster wird durch k dargestellt. Wenn also der Wert von k 3 ist, gibt es insgesamt drei Cluster.

Diese Clustering-Methode unterteilt den unbeschrifteten Datensatz so, dass jeder Datenpunkt nur zu einer einzigen Gruppe mit ähnlichen Eigenschaften gehört. Der Schlüssel liegt darin, K-Zentren zu finden, die Cluster-Zentroide genannt werden.

Jeder Cluster hat einen Cluster-Schwerpunkt, und beim Erkennen eines neuen Datenpunkts bestimmt der Algorithmus den nächsten Cluster, zu dem der Datenpunkt gehört, basierend auf Metriken wie der euklidischen Entfernung.

Hauptkomponentenanalyse (PCA)

Die Hauptkomponentenanalyse (PCA) ist eine Dimensionsreduktionsmethode, die im Allgemeinen verwendet wird, um die Dimensionalität großer Datensätze zu reduzieren. Dazu wird eine große Anzahl von Variablen in eine kleinere konvertiert, die fast alle Informationen des großen Datensatzes enthält.

Eine Verringerung der Anzahl der Variablen könnte die Genauigkeit geringfügig beeinträchtigen, könnte jedoch ein akzeptabler Kompromiss für die Einfachheit sein. Das liegt daran, dass kleinere Datensätze einfacher zu analysieren sind und Algorithmen für maschinelles Lernen nicht viel schwitzen müssen, um wertvolle Erkenntnisse zu gewinnen.

Überwachtes vs. unüberwachtes Lernen

Beaufsichtigtes Lernen ist vergleichbar damit, dass ein Lehrer den gesamten Lernprozess überwacht. Es gibt auch einen beschrifteten Trainingsdatensatz, ähnlich wie die richtigen Antworten auf jedes Problem, das Sie zu lösen versuchen.

Es ist einfacher zu verstehen, ob Ihre Antwort richtig ist oder nicht, und der Lehrer wird Sie auch korrigieren, wenn Sie einen Fehler machen. Beim unüberwachten Lernen gibt es weder Lehrer noch richtige Antworten.

Aus rechnerischer Sicht ist unüberwachtes Lernen komplizierter und zeitaufwändiger als überwachtes Lernen. Es ist jedoch nützlich für das Data Mining und um Einblicke in die Struktur der Daten zu erhalten, bevor ein Klassifikator (ein Algorithmus für maschinelles Lernen, der Daten automatisch klassifiziert) zugewiesen wird.

Obwohl es nützlich ist, wenn unbeschriftete Daten enorm sind, kann unbeaufsichtigtes Lernen Data Scientists wenig Unannehmlichkeiten bereiten. Da der beim überwachten Lernen verwendete Validierungsdatensatz ebenfalls gekennzeichnet ist, ist es für Datenwissenschaftler einfacher, die Genauigkeit der Modelle zu messen. Dies gilt jedoch nicht für unüberwachte Lernmodelle.

In vielen Fällen wird unüberwachtes Lernen vor überwachtem Lernen angewendet. Dies hilft, Features zu identifizieren und Klassen zu erstellen.

Der unüberwachte Lernprozess findet online statt, während das überwachte Lernen offline stattfindet. Dadurch können UL-Algorithmen Daten in Echtzeit verarbeiten.

Während unüberwachte Lernprobleme in Assoziations- und Clusterprobleme unterteilt werden, kann überwachtes Lernen weiter in Regression und Klassifikation kategorisiert werden.

Neben überwachtem und unüberwachtem Lernen gibt es halbüberwachtes Lernen und bestärkendes Lernen .

Semi-überwachtes Lernen ist eine Mischung aus überwachtem und unüberwachtem Lernen. Bei dieser maschinellen Lerntechnik wird das System nur ein wenig trainiert, damit es einen Überblick auf hoher Ebene erhält. Ein Teil der Trainingsdaten wird beschriftet, der Rest bleibt unbeschriftet.

Beim Reinforcement Learning (RL) trifft das System der künstlichen Intelligenz auf eine spielähnliche Umgebung, in der es die Belohnung maximieren muss. Das System muss lernen, indem es der Trial-and-Error-Methode folgt, und seine Chance, die Belohnung zu erhalten, mit jedem Schritt verbessern.

Hier ist ein kurzer Blick auf die wichtigsten Unterschiede zwischen überwachtem und nicht überwachtem Lernen.

Unbeaufsichtigtes Lernen	Überwachtes Lernen
Es ist ein komplexer Prozess, erfordert mehr Rechenressourcen und ist zeitaufwändig.	Es ist relativ einfach und erfordert weniger Rechenressourcen.
Das Trainings-Dataset ist unbeschriftet.	Das Trainings-Dataset ist beschriftet.
Weniger genau, aber nicht unbedingt	Sehr genau
Unterteilt in Assoziation und Clustering	Unterteilt in Regression und Klassifikation
Es ist umständlich, die Genauigkeit des Modells zusammen mit der Unsicherheit zu messen.	Es ist einfacher, die Genauigkeit des Modells zu messen.
Die Anzahl der Klassen ist unbekannt.	Die Anzahl der Klassen ist bekannt.
Das Lernen findet in Echtzeit statt.	Lernen findet offline statt.
Apriori, ECLAT, k-Means Clustering und Frequent Pattern (FP)-Wachstumsalgorithmus sind einige der verwendeten Algorithmen.	Lineare Regression, logistische Regression, Naive Bayes und Support Vector Machine (SVM) sind einige der verwendeten Algorithmen.

Beispiele für unüberwachtes maschinelles Lernen

Wie bereits erwähnt, kann unüberwachtes Lernen ein Ziel an sich sein und verwendet werden, um versteckte Muster in riesigen Datenmengen zu finden – eine unrealistische Aufgabe für Menschen.

Einige reale Anwendungen des unbeaufsichtigten maschinellen Lernens.

Anomalieerkennung: Es ist ein Prozess zum Auffinden atypischer Datenpunkte in Datensätzen und daher nützlich, um betrügerische Aktivitäten zu erkennen.
Computer Vision: Auch bekannt als Bilderkennung, dieses Kunststück, Objekte in Bildern zu identifizieren, ist für selbstfahrende Autos unerlässlich und sogar wertvoll für die Gesundheitsbranche für die Bildsegmentierung.
Empfehlungssysteme: Durch die Analyse historischer Daten empfehlen unüberwachte Lernalgorithmen die Produkte, die ein Kunde am ehesten kaufen wird.
Kundenpersönlichkeit : Unsupervised Learning kann Unternehmen dabei helfen, genaue Kundenpersönlichkeiten zu erstellen, indem Daten zu Kaufgewohnheiten analysiert werden.

Algorithmen sich selbst überlassen

Die Fähigkeit, selbstständig zu lernen, macht unüberwachtes Lernen zum schnellsten Weg, um riesige Datenmengen zu analysieren. Natürlich hängt die Wahl zwischen überwachtem oder unüberwachtem (oder sogar halbüberwachtem) Lernen von dem Problem ab, das Sie zu lösen versuchen, sowie von der Zeit und dem Umfang der verfügbaren Daten. Nichtsdestotrotz kann unüberwachtes Lernen Ihren gesamten Aufwand skalierbarer machen.

Die KI, die wir heute haben, ist nicht in der Lage, die Welt zu beherrschen, geschweige denn, die Befehle ihrer Schöpfer zu missachten. Aber es macht unglaubliche Leistungen wie selbstfahrende Autos und Chatbots möglich. Es heißt Narrow AI , ist aber nicht so schwach, wie es sich anhört.