Wszystko, co musisz wiedzieć o uczeniu maszynowym [wywiad z naukowcem zajmującym się danymi]

Opublikowany: 2022-05-25

Sci-fi namalowało wiele horrorów dotyczących przyszłości maszyn przejmujących świat. Te ponure wizje wszechmocnych maszyn to tylko niektóre z wielu nieporozumień na temat sztucznej inteligencji i uczenia maszynowego.

W tym artykule nasz specjalista ds. uczenia maszynowego, Juuso Lassila , odpowiada na najczęściej zadawane pytania dotyczące uczenia maszynowego i wyjaśnia, dlaczego maszyny nie są jeszcze gotowe do przejęcia władzy nad światem.

Nauczanie maszynowe

1. Co to jest uczenie maszynowe?

Uczenie maszynowe oznacza, że ​​maszyna może się uczyć bez programowania. Uczenie maszynowe i sztuczna inteligencja są często błędnie używane jako synonimy, ale to nie to samo. Uczenie maszynowe jest w rzeczywistości podzbiorem sztucznej inteligencji.

„AI to dość słabo zdefiniowany termin. To może znaczyć wszystko” – wyjaśnia Lassila.

Duża różnica między uczeniem maszynowym a sztuczną inteligencją polega na tym, że sztuczna inteligencja nie zawsze potrzebuje danych. Na przykład niektórzy twierdzą, że znalezienie optymalnej trasy na mapie to sztuczna inteligencja. Ten proces nie jest oparty na danych, ale na algorytmie .

Z drugiej strony uczenie maszynowe to sztuczna inteligencja, która wykorzystuje dane do uczenia się. Zaletą uczenia maszynowego jest to, że programista nie musi wiedzieć, jak model rozwiązuje problem. Oznacza to, że maszyna może używać technik, których programista nie był świadomy. Dziś uczenie maszynowe odgrywa ważną rolę w wielu branżach.

2. W jaki sposób wykorzystywane jest uczenie maszynowe?

Uczenie maszynowe próbuje zrozumieć dane i zawarte w nich struktury. Mówiąc prościej, weźmy coś, co uwielbia internet: zdjęcia kotów i psów! Tak więc, jeśli masz setki zdjęć swoich ulubionych futrzastych przyjaciół w losowej kolejności, możesz użyć uczenia maszynowego, aby rozróżnić te obrazy. Maszyna może organizować dane tak, że na przykład otrzymujesz tylko zdjęcia kotów.

„Uczenie maszynowe będzie przewidywać wartości z danych, które do niego wprowadzasz, i nadawać im sens” — mówi Lassila.

Popularnym sposobem wykorzystania uczenia maszynowego jest klasyfikacja danych, tak jak w naszym przykładzie z powyższymi zdjęciami kotów i psów. Jednak uczenie maszynowe jest również wykorzystywane w chatbotach AI i do tworzenia różnego rodzaju prognoz. Na przykład uczenie maszynowe może być wykorzystane do oszacowania wartości domu na podstawie wielkości, lokalizacji, roku, w którym został wybudowany i innych informacji.

3. Jak uczą się maszyny?

Uczenie maszynowe zwykle próbuje zminimalizować błędy modelu. Po pierwsze, zaczyna się od losowych odpowiedzi. Wtedy ludzie udzielają właściwych odpowiedzi, wyjaśnia Lassila.

Istnieje sposób na zmierzenie, jak źle maszyna się myliła z odpowiedziami, które udzieliła. W niektórych modelach uczenia maszynowego różnicowanie służy do minimalizacji błędów.

Dzięki różniczkowaniu można obliczyć, w jakim kierunku należy zmienić parametry, aby zmniejszyć wartość funkcji błędu.

„W takim razie wiesz, jak zmienić parametry, aby wartość funkcji się zmniejszała. Następnie robisz mały krok w kierunku mniejszego błędu, zmieniając parametry. W ten sposób zminimalizujesz błędy”, mówi Lassila.

4. Czy maszyna może być bezbłędna?

Teoretycznie jest możliwe, że nie ma błędów, ale w prawdziwym świecie tak naprawdę się nie dzieje. Nawet w najlepszych przypadkach maszyna może uzyskać poprawność tylko 99,9% danych.

„W celu klasyfikacji możemy zmierzyć dokładność” — mówi Lassila. Zwykle dokładność 90-95% jest uważana za całkiem dobrą. Gdy marginesy błędów są wystarczająco niskie, maszyna jest gotowa do rozpoczęcia produkcji. To, jak niski musi być margines błędu, zanim produkt będzie mógł zostać uruchomiony, zależy od zadania, które maszyna ma wykonać.

Mówiąc o chatbotach AI, trudno powiedzieć, kiedy bot będzie bardziej pomocny niż denerwujący, ponieważ chatboty AI mogą mieć jak najwięcej przykładowych pytań. Maszyna zawsze musi wybrać najlepszą z dostępnych odpowiedzi. To, jak poprawna jest maszyna, zależy od liczby przykładowych pytań.

„Jeśli masz jedno pytanie, maszyna jest zawsze poprawna. Jeśli masz dwa, miejmy nadzieję, że często jest to poprawne, ale jeśli masz 100 pytań, maszyna prawdopodobnie wybierze złą odpowiedź” — wyjaśnia Lassila.

5. Co to jest uczenie głębokie?

Głębokie uczenie to metoda uczenia maszynowego, która wykorzystuje warstwy w modelach. Jedna warstwa generuje dane wyjściowe, które są przenoszone do drugiej warstwy i tak dalej. Głębokie uczenie odbywa się zwykle w sieciach neuronowych .

„Sieci neuronowe są bardzo przydatne, ponieważ dobrze dostosowują się do różnych formatów wejściowych i wyjściowych” — mówi Lassila.

Sieci neuronowe są bardzo wszechstronne i dlatego mają wiele zastosowań. Chatboty AI zwykle również korzystają z sieci neuronowych.

„Tworzymy osadzania zdań z wiadomości, które są tylko wektorami punktów w przestrzeni. Następnie mierzymy ich podobieństwa. Wykorzystuje sieć neuronową. Ma wiele warstw i daje efekt końcowy” — wyjaśnia Lassila.

Istnieje również wiele metod uczenia maszynowego, które nie są głębokie. Takie jak maszyny wektorów nośnych lub drzewa decyzyjne .

6. Jakie są wąskie gardła uczenia maszynowego?

Dane to jedna z tych rzeczy, które ograniczają uczenie maszynowe. Jeśli nie masz danych, uczenie maszynowe nie będzie działać. Potrzebujesz także zasobów obliczeniowych. Często modele również powodują ograniczenia.

„Do podstawowych zadań, takich jak klasyfikacja, modele są dobre. W takich przypadkach ograniczają Cię tylko dane i zasoby obliczeniowe. Ale w niektórych dziedzinach modele nie są jeszcze tak dobre”, mówi Lassila.

Im więcej danych, tym lepiej, o ile masz zasoby do obliczenia tych danych. Ale dane muszą być dobrej jakości. Ponadto modele muszą być duże, aby model był w stanie obsłużyć wszystkie złożone dane wejściowe, jakie może uzyskać. Potrzebujesz dużej mocy obliczeniowej, aby maszyna mogła obsłużyć te dane.

„Możesz mieć dostęp do wielu danych. To nie jest problem”. – mówi Lassila. „Problemem są modele i czas potrzebny na ich przeszkolenie. Do przechowywania tych modeli potrzeba dużo pamięci”.

Kolejną pułapką uczenia maszynowego jest obecnie dostępna architektura modelu dla niektórych zadań. Obecnie nie ma dobrej architektury modelu do osadzania zdań.

„Wciąż trwają badania mające na celu znalezienie naprawdę dobrego modelu” — mówi Lassila.

7. Jak uczysz maszynę?

Po pierwsze, potrzebujesz dużo danych, a dane, których używasz do trenowania modeli, potrzebują ludzkich etykiet.

„Wielkie firmy korzystające z uczenia maszynowego mają armie ludzi, którzy po prostu etykietują dane” — wyjaśnia Lassila.

Nawet jeśli bot może zacząć oznaczać dane etykietami z upływem czasu, nie chcesz używać odpowiedzi, które daje model, jako danych treningowych. Modele popełniają błędy bardziej niż ludzie. Jeśli używasz etykietowania maszyn jako danych uczących, ponownie uczysz te błędy modeli.

„To sprawi, że błędy będą coraz większe. “

Możliwe jest również użycie aktywnego uczenia się , w którym modele mogą określić, jakiego rodzaju punkty danych byłyby przydatne do etykietowania. Może to sprawić, że nauka będzie bardziej wydajna. „Maszyna może kierować procesem etykietowania. Mimo to ludzie powinni robić etykiety, aby błędy się nie rozprzestrzeniały. “

Gdy ludzie wytrenują model z danymi, maszyna powinna być w stanie odtworzyć to oznakowanie dla niewidocznych danych wejściowych. Ale jeśli potrzebujesz nowych odpowiedzi, dane muszą zostać ponownie oznaczone przez ludzi.

Przyszłość AI

8. Jaka jest przyszłość uczenia maszynowego?

Uczenie maszynowe rozwija się obecnie bardzo szybko. Kilka lat temu wprowadzono kolejny model głębokiego uczenia, model transformatora. Odkrycie modelu transformatora miało ogromny wpływ na uczenie maszynowe.

„Wokół tego odkrycia odbudowujemy całe pole badawcze. To naprawdę dobrze się sprawdziło” — wyjaśnia Lassila.

Model transformatora jest również używany w chatbotach AI z przetwarzaniem języka naturalnego. „Ale w pewnym momencie dotrzemy do końca drogi, jeśli chodzi o to, jak dobrze możemy wykorzystać tę architekturę” – mówi Lassila. „Mam nadzieję, że znajdziemy coś nowego, co da jeszcze lepsze wyniki”.

9. Czy maszyny zawładną światem?

Ludzie oczekują zbyt wiele lub za mało od sztucznej inteligencji i uczenia maszynowego.

„Brakuje zrozumienia możliwości sztucznej inteligencji” — mówi Lassila.

Wygląda więc na to, że maszyny jeszcze nie zawładną światem. Boty muszą pokonać kilka przeszkód, zanim to się stanie.

„Modele i architektura jeszcze nie istnieją. Mamy dane i zasoby obliczeniowe, aby stworzyć dobrą sztuczną inteligencję, ale nadal potrzebujemy dobrych architektur, aby roboty mogły przejąć kontrolę”.

Chociaż sztuczna inteligencja nie jest jeszcze gotowa do przejęcia świata, przejmie niektóre stanowiska.

„W niektórych momentach niektóre stanowiska pracy mogą zostać zastąpione przez sztuczną inteligencję. To byłyby powtarzalne prace, które nie wymagają zbytniego myślenia” – mówi Lassila.

Istnieją dwa sposoby myślenia o tym, jak sztuczna inteligencja zmieni rynek pracy. Jednym z nich jest to, że sztuczna inteligencja zastępuje miejsca pracy, ale może również usprawnić miejsca pracy. Może współpracować z ludźmi. Dobrym tego przykładem są chatboty , które mogą połączyć się z aktywnym agentem, gdy nie są w stanie pomóc odwiedzającemu witrynę.

„Sztuczna inteligencja może poprawić wydajność wielu zawodów”.

Jednak nadal potrzebujesz zasobów ludzkich, aby zwalczyć nieścisłości. AI nie myśli jak człowiek. Wykorzystuje różne metody. A czasami nie ma dla nas sensu, dlaczego coś pokazuje.

„Jednym z największych problemów związanych ze sztuczną inteligencją jest to, że maszyna nie wyjaśnia, dlaczego stworzyła określoną wydajność. Może to mieć sens dla modelu, ale nie dla ludzi.”

Jeśli chcesz dowiedzieć się więcej o uczeniu maszynowym i sztucznej inteligencji, zapoznaj się z naszym przewodnikiem dotyczącym chatbota AI .