Tot ce trebuie să știți despre învățarea automată [Interviu cu cercetătorul de date]

Publicat: 2022-05-25

Sci-fi-ul a pictat multe imagini de groază ale viitorului mașinilor care au preluat lumea. Aceste viziuni sumbre ale mașinilor atotputernice sunt câteva dintre multele concepții greșite pe care oamenii le au despre AI și învățarea automată.

În acest articol, specialistul nostru în învățarea automată Juuso Lassila răspunde la cele mai frecvente întrebări despre învățarea automată și ne spune de ce mașinile nu sunt tocmai pregătite să cucerească lumea.

Învățare automată

1. Ce este învățarea automată?

Învățarea automată înseamnă că o mașină poate învăța fără a fi programată. Învățarea automată și inteligența artificială sunt adesea folosite în mod eronat ca sinonime, dar nu sunt la fel. Învățarea automată este de fapt un subset al AI.

„AI este un termen destul de prost definit. Poate însemna orice”, explică Lassila.

Marea diferență dintre învățarea automată și AI este că AI nu are întotdeauna nevoie de date. De exemplu, unii spun că găsirea unei rute optime pe o hartă este AI. Acest proces nu se bazează pe date, ci este un algoritm .

Învățarea automată, pe de altă parte, este IA care utilizează date pentru a învăța. Avantajul învățării automate este că programatorul nu trebuie să știe cum rezolvă modelul problema. Aceasta înseamnă că mașina poate folosi tehnici de care programatorul nu le cunoștea. Astăzi, învățarea automată joacă un rol important în multe industrii.

2. Cum se utilizează Machine Learning?

Învățarea automată încearcă să înțeleagă datele și structurile din acestea. Pentru a spune acest lucru simplu, haideți să luăm ceva ce iubește internetul: poze cu pisici și câini! Așadar, dacă aveți sute de imagini cu prietenii tăi preferați, într-o ordine aleatorie, poți folosi Machine Learning pentru a diferenția aceste imagini. Aparatul poate organiza datele astfel încât să ajungeți doar cu poze cu pisici, de exemplu.

„Învățarea automată va prezice valori din datele pe care le furnizați și va da sens acestor date”, spune Lassila.

O modalitate obișnuită de a folosi învățarea automată este pentru clasificarea datelor, ca în exemplul nostru cu imaginile de mai sus cu pisici și câini. Cu toate acestea, învățarea automată este folosită și în chatbot-urile AI și pentru a face diferite tipuri de predicții. De exemplu, învățarea automată poate fi folosită pentru a estima valoarea unei case pe baza dimensiunii, locației, anul în care a fost construită, printre alte informații.

3. Cum învață mașinile?

Învățarea automată încearcă de obicei să minimizeze erorile unui model. În primul rând, începe cu răspunsuri aleatorii. Apoi oamenii îi dau răspunsurile corecte, explică Lassila.

Există o modalitate de a măsura cât de greșit a fost aparatul cu răspunsurile pe care le-a dat. În unele modele de învățare automată, diferențierea este utilizată pentru a minimiza erorile.

Prin diferențiere, puteți calcula în ce direcție trebuie modificați parametrii pentru a reduce valoarea funcției de eroare.

„Atunci știi cum să-ți schimbi parametrii astfel încât valoarea funcției să scadă. Apoi faceți un pas mic către o eroare mai mică prin modificarea parametrilor. Astfel minimizi erorile”, spune Lassila.

4. Poate o mașină să nu aibă erori?

În teorie, este posibil să nu existe erori, dar în lumea reală nu se întâmplă cu adevărat. Chiar și în cele mai bune cazuri, aparatul poate obține corect doar 99,9% din date.

„Pentru clasificare, putem măsura acuratețea”, spune Lassila. De obicei, precizia de 90-95% este considerată destul de bună. Când marjele de eroare sunt suficient de mici, mașina este gata să intre în producție. Cât de mică trebuie să fie marja de eroare înainte ca produsul să poată intra în funcțiune depinde de sarcina pe care trebuie să o îndeplinească mașina.

Când vorbim despre chatboții AI, este dificil de spus când bot-ul va fi mai util decât enervant, deoarece chatboții AI pot avea cât mai multe exemple de întrebări posibil. Aparatul trebuie să aleagă întotdeauna cel mai bun dintre răspunsurile disponibile. Cât de corectă este mașina depinde de câte întrebări exemple există.

„Dacă aveți o întrebare, aparatul este întotdeauna corect. Dacă aveți două, sperăm că este destul de des corect, dar dacă aveți 100 de întrebări, atunci este foarte probabil ca mașina să aleagă răspunsul greșit”, explică Lassila.

5. Ce este învățarea profundă?

Învățarea profundă este o metodă de învățare automată care utilizează straturi în modele. Un strat produce o ieșire și acea ieșire este transferată la al doilea strat și așa mai departe. Învățarea profundă se face de obicei în rețele neuronale .

„Rețelele neuronale sunt destul de utile, deoarece se adaptează bine la diferite formate de intrare și ieșire”, spune Lassila.

Rețelele neuronale sunt foarte versatile și de aceea au multe cazuri de utilizare. Chatboții AI folosesc de obicei și rețele neuronale.

„Noi creăm acele înglobări de propoziții din mesaje care sunt doar puncte vectoriale în spațiu. Apoi măsurăm asemănările lor. Folosește o rețea neuronală. Are o mulțime de straturi și dă rezultate la sfârșit”, explică Lassila.

Există, de asemenea, multe metode de învățare automată care nu sunt profunde. Cum ar fi mașini vectori de suport sau arbori de decizie .

6. Care sunt blocajele învățării automate?

Datele sunt unul dintre acele lucruri care cauzează limitări ale învățării automate. Dacă nu aveți date, învățarea automată nu va funcționa. De asemenea, aveți nevoie de resurse de calcul. Adesea, modelele provoacă și limitări.

„Pentru sarcini de bază, cum ar fi clasificarea, modelele sunt bune. Și în acele cazuri, ești doar limitat de date și resurse de calcul. Dar în unele domenii, modelele nu sunt încă atât de bune”, spune Lassila.

Cu cât sunt mai multe date, cu atât mai bine, atâta timp cât aveți resursele pentru a calcula acele date. Dar, datele trebuie să fie de bună calitate. De asemenea, modelele trebuie să fie mari, astfel încât modelul să poată face față tuturor intrărilor complexe pe care le-ar putea primi. Aveți nevoie de multă putere de procesare pentru ca mașina să gestioneze acele date.

„Puteți avea acces la o mulțime de date. Nu asta este problema cu adevărat.” spune Lassila. „Problema sunt modelele și timpul necesar pentru a le antrena. Este nevoie de multă memorie pentru a stoca aceste modele.”

O altă capcană a învățării automate este arhitectura model disponibilă în prezent pentru unele sarcini. Momentan, nu există o arhitectură model bună pentru încorporarea propozițiilor.

„Este încă în curs de desfășurare cercetări pentru a găsi un model cu adevărat bun”, spune Lassila.

7. Cum înveți o mașină?

În primul rând, aveți nevoie de multe date, iar datele pe care le utilizați pentru a antrena modelele au nevoie de etichete umane.

„Companiile mari care folosesc Machine Learning au armate de oameni care doar etichetează datele”, explică Lassila.

Chiar dacă botul poate începe să eticheteze datele cu timpul, nu doriți să utilizați răspunsurile pe care vi le oferă modelul ca date de antrenament. Modelele greșesc mai mult decât oamenii. Dacă utilizați etichetarea mașinii ca date de antrenament, învățați din nou acele erori modelelor.

„Asta va face ca erorile să devină din ce în ce mai mari. „

De asemenea, este posibil să se utilizeze învățarea activă, în cazul în care modelele pot spune ce fel de puncte de date ar fi utile pentru etichetare. Acest lucru poate face învățarea mai eficientă. „Mașina poate ghida procesul de etichetare. Totuși, oamenii ar trebui să facă etichetarea, astfel încât erorile să nu se propage. „

Odată ce oamenii au antrenat un model cu datele, atunci mașina ar trebui să poată reproduce acea etichetare pentru intrările nevăzute. Dar dacă aveți nevoie de răspunsuri noi, atunci datele trebuie să fie etichetate din nou de oameni.

Viitorul AI

8. Care este viitorul învățării automate?

Învățarea automată se dezvoltă foarte rapid în acest moment. În urmă cu câțiva ani, a fost introdus un alt model de deep learning, modelul transformatorului. Descoperirea modelului de transformator a avut un impact uriaș asupra învățării automate.

„Am reconstruit întregul domeniu de cercetare în jurul acestei descoperiri. A funcționat foarte bine”, explică Lassila.

Modelul transformator este folosit și în chatbot-urile AI cu procesare a limbajului natural. „Dar la un moment dat, vom ajunge la capătul drumului pentru cât de bine putem folosi acea arhitectură”, spune Lassila. „Sperăm că vom găsi ceva nou care dă rezultate și mai bune.”

9. Vor prelua mașinile lumea?

Oamenii se așteaptă prea mult sau nu suficient de la AI și Machine Learning.

„Există o lipsă de înțelegere a capacităților AI”, spune Lassila.

Așadar, se pare că mașinile nu vor cuceri încă lumea. Boții au câteva obstacole de depășit înainte să se întâmple asta.

„Modelele și arhitectura nu sunt încă acolo. Avem datele și resursele de calcul pentru a face o IA bună, dar încă avem nevoie de acele arhitecturi bune pentru ca roboții să preia controlul.”

Chiar dacă AI nu este încă pregătită să preia lumea, va prelua unele locuri de muncă.

„Unele locuri de muncă ar putea fi înlocuite de AI la un moment dat. Acestea ar fi locuri de muncă repetitive care nu necesită multă gândire”, spune Lassila.

Există două moduri de a te gândi la modul în care AI va schimba piața muncii. Una este că AI înlocuiește locurile de muncă, dar ar putea, de asemenea, îmbunătăți locurile de muncă. Poate funcționa alături de oameni. Un bun exemplu în acest sens sunt chatboții , care se pot conecta la un agent live atunci când nu pot să asiste vizitatorul site-ului.

„AI poate îmbunătăți eficiența pentru multe locuri de muncă.”

Cu toate acestea, mai aveți nevoie de resurse umane pentru a combate inexactitățile. AI nu gândește ca un om. Folosește diferite metode. Și uneori nu are sens pentru noi de ce arată ceva.

„Una dintre cele mai mari probleme cu AI este că mașina nu explică de ce a creat o anumită ieșire. Ar putea avea sens pentru model, dar nu pentru oameni.”

Dacă doriți să aflați mai multe despre învățarea automată și AI, consultați ghidul nostru pentru chatbot AI .