Tutto quello che devi sapere sull'apprendimento automatico [Intervista a Data Scientist]

Pubblicato: 2022-05-25

La fantascienza ha dipinto molte immagini dell'orrore del futuro delle macchine che conquistano il mondo. Queste cupe visioni di macchine onnipotenti sono alcune delle tante idee sbagliate che le persone hanno sull'IA e sull'apprendimento automatico.

In questo articolo, il nostro specialista di machine learning Juuso Lassila risponde alle domande più frequenti sull'apprendimento automatico e ci spiega perché le macchine non sono ancora pronte a conquistare il mondo.

Apprendimento automatico

1. Che cos'è l'apprendimento automatico?

Machine learning significa che una macchina può apprendere senza essere programmata. Apprendimento automatico e intelligenza artificiale sono spesso usati erroneamente come sinonimi, ma non sono la stessa cosa. L'apprendimento automatico è in realtà un sottoinsieme dell'IA.

“AI è un termine piuttosto mal definito. Può significare qualsiasi cosa", spiega Lassila.

La grande differenza tra Machine learning e AI è che l'IA non ha sempre bisogno di dati. Ad esempio, alcuni dicono che trovare un percorso ottimale su una mappa sia l'intelligenza artificiale. Questo processo non è basato sui dati ma su un algoritmo .

L'apprendimento automatico, d'altra parte, è l'intelligenza artificiale che utilizza i dati per apprendere. Il vantaggio dell'apprendimento automatico è che il programmatore non ha bisogno di sapere come il modello risolve il problema. Ciò significa che la macchina può utilizzare tecniche di cui il programmatore non era a conoscenza. Oggi, l'apprendimento automatico svolge un ruolo importante in molti settori.

2. Come viene utilizzato l'apprendimento automatico?

L'apprendimento automatico cerca di comprendere i dati e le strutture in essi contenuti. Per dirla semplicemente, prendiamo qualcosa che Internet ama: le foto di cani e gatti! Quindi, se hai centinaia di immagini dei tuoi amici pelosi preferiti in ordine casuale, puoi utilizzare l'apprendimento automatico per distinguere tra queste immagini. La macchina può organizzare i dati in modo da ottenere solo immagini di gatti, ad esempio.

"L'apprendimento automatico prevederà i valori dai dati che gli fornisci e darà un senso a quei dati", afferma Lassila.

Un modo comune di utilizzare l'apprendimento automatico è per la classificazione dei dati, come nel nostro esempio con le immagini di cani e gatti sopra. Tuttavia, l'apprendimento automatico viene utilizzato anche nei chatbot di intelligenza artificiale e per fare diversi tipi di previsioni. Ad esempio, l'apprendimento automatico può essere utilizzato per stimare il valore di una casa in base alle dimensioni, all'ubicazione, all'anno in cui è stata costruita, tra le altre informazioni.

3. Come apprendono le macchine?

L'apprendimento automatico di solito cerca di ridurre al minimo gli errori di un modello. Innanzitutto, inizia con risposte casuali. Poi gli umani danno le risposte corrette, spiega Lassila.

C'è un modo per misurare quanto fosse sbagliata la macchina con le risposte che ha dato. In alcuni modelli di Machine learning, la differenziazione viene utilizzata per ridurre al minimo gli errori.

Con la differenziazione è possibile calcolare in quale direzione devono essere modificati i parametri per diminuire il valore della funzione di errore.

“Allora sai come modificare i tuoi parametri in modo che il valore della funzione diminuisca. Quindi fai un piccolo passo verso un errore più piccolo modificando i parametri. In questo modo riduci al minimo gli errori", afferma Lassila.

4. Una macchina può essere priva di errori?

In teoria, è possibile che non ci siano errori ma nel mondo reale non sta realmente accadendo. Anche nei casi migliori, la macchina può ottenere solo forse il 99,9% dei dati corretti.

"Per la classificazione, possiamo misurare l'accuratezza", afferma Lassila. Di solito, una precisione del 90-95% è considerata abbastanza buona. Quando i margini di errore sono sufficientemente bassi, la macchina è pronta per entrare in produzione. Quanto basso deve essere il margine di errore prima che il prodotto possa essere pubblicato dipende dall'attività che la macchina dovrebbe svolgere.

Quando si parla di chatbot AI, è difficile dire quando il bot sarà più utile che fastidioso poiché i chatbot AI possono avere quante più domande di esempio possibili. La macchina deve sempre scegliere la migliore delle risposte disponibili. La correttezza della macchina dipende da quante domande di esempio ci sono.

“Se hai una domanda, la macchina è sempre corretta. Se ne hai due, si spera che abbastanza spesso sia corretto, ma se hai 100 domande è molto probabile che la macchina scelga la risposta sbagliata", spiega Lassila.

5. Che cos'è l'apprendimento profondo?

Il deep learning è un metodo di machine learning che utilizza livelli nei modelli. Un livello produce un output e quell'output viene trasferito al secondo livello e così via. Il deep learning viene solitamente eseguito nelle reti neurali .

"Le reti neurali sono molto utili perché si adattano bene a diversi formati di input e output", afferma Lassila.

Le reti neurali sono molto versatili ed è per questo che hanno molti casi d'uso. I chatbot AI di solito utilizzano anche le reti neurali.

“Creiamo quegli incorporamenti di frasi da messaggi che sono solo punti vettoriali nello spazio. Quindi misuriamo le loro somiglianze. Utilizza una rete neurale. Ha molti livelli e alla fine fornisce un output", spiega Lassila.

Esistono anche molti metodi di apprendimento automatico che non sono profondi. Come macchine vettoriali di supporto o alberi decisionali .

6. Quali sono i colli di bottiglia dell'apprendimento automatico?

I dati sono una di quelle cose che causano limitazioni all'apprendimento automatico. Se non disponi di dati, l'apprendimento automatico non funzionerà. Hai anche bisogno di risorse di calcolo. Spesso anche i modelli causano limitazioni.

“Per le attività di base, come la classificazione, i modelli sono buoni. E in questi casi, sei solo limitato dai dati e dalle risorse di calcolo. Ma in alcuni domini i modelli non sono ancora così buoni”, afferma Lassila.

Più dati sono, meglio è, purché tu abbia le risorse per calcolare quei dati. Ma i dati devono essere di buona qualità. Inoltre, i modelli devono essere grandi in modo che il modello sia in grado di gestire tutti gli input complessi che potrebbe ottenere. È necessaria molta potenza di elaborazione affinché la macchina gestisca quei dati.

“Puoi avere accesso a molti dati. Non è proprio questo il problema". dice Lassila. “Il problema sono i modelli e il tempo necessario per addestrarli. È necessaria molta memoria per archiviare questi modelli".

Un'altra trappola dell'apprendimento automatico è l'architettura del modello attualmente disponibile per alcune attività. Al momento non esiste una buona architettura modello per l'incorporamento delle frasi.

"È ancora in corso la ricerca per trovare un modello davvero buono", afferma Lassila.

7. Come si insegna una macchina?

Prima di tutto, hai bisogno di molti dati e i dati che usi per addestrare i modelli richiedono etichette umane.

"Le grandi aziende che utilizzano l'apprendimento automatico hanno eserciti di persone che si limitano a etichettare i dati", spiega Lassila.

Anche se il bot può iniziare a etichettare i dati con il tempo, non vuoi usare le risposte fornite dal modello come dati di addestramento. I modelli commettono errori più degli umani. Se utilizzi l'etichettatura della macchina come dati di addestramento, insegni nuovamente quegli errori ai modelli.

“Ciò farà crescere gli errori sempre più grandi. “

È anche possibile utilizzare l'apprendimento attivo in cui i modelli possono dire che tipo di punti dati sarebbe utile etichettare. Questo può rendere l'apprendimento più efficiente. “La macchina può guidare il processo di etichettatura. Tuttavia, gli esseri umani dovrebbero eseguire l'etichettatura in modo che gli errori non si propaghino. “

Una volta che gli esseri umani hanno addestrato un modello con i dati, la macchina dovrebbe essere in grado di riprodurre quell'etichettatura per gli input invisibili. Ma se hai bisogno di nuove risposte, i dati devono essere nuovamente etichettati dagli esseri umani.

Il futuro dell'IA

8. Qual è il futuro dell'apprendimento automatico?

L'apprendimento automatico si sta sviluppando molto velocemente al momento. Alcuni anni fa è stato introdotto un altro modello di deep learning, il modello Transformer. La scoperta del modello del trasformatore ha avuto un enorme impatto sull'apprendimento automatico.

“Abbiamo ricostruito l'intero campo di ricerca attorno a quella scoperta. Ha funzionato davvero bene”, spiega Lassila.

Il modello del trasformatore viene utilizzato anche nei chatbot di intelligenza artificiale con elaborazione del linguaggio naturale. "Ma a un certo punto, raggiungeremo la fine della strada su quanto bene possiamo usare quell'architettura", dice Lassila. "Speriamo di trovare qualcosa di nuovo che dia risultati ancora migliori".

9. Le macchine conquisteranno il mondo?

Le persone si aspettano troppo o non abbastanza dall'intelligenza artificiale e dall'apprendimento automatico.

"C'è una mancanza di comprensione delle capacità dell'IA", afferma Lassila.

Quindi sembra che le macchine non conquisteranno ancora il mondo. I robot devono superare alcuni ostacoli prima che ciò accada.

“I modelli e l'architettura non ci sono ancora. Abbiamo i dati e le risorse di calcolo per creare una buona intelligenza artificiale, ma abbiamo ancora bisogno di quelle buone architetture affinché i robot prendano il sopravvento".

Anche se l'IA non è ancora pronta a conquistare il mondo, assumerà alcuni lavori.

“Alcuni lavori potrebbero essere sostituiti dall'IA in alcuni punti. Questi sarebbero lavori ripetitivi che non richiedono molta riflessione”, dice Lassila.

Ci sono due modi per pensare a come l'IA cambierà il mercato del lavoro. Uno è che l'IA sostituisce i posti di lavoro, ma potrebbe anche migliorare i posti di lavoro. Può lavorare insieme agli esseri umani. Un buon esempio di ciò sono i chatbot , che possono connettersi a un agente live quando non sono in grado di assistere il visitatore del sito web.

"L'intelligenza artificiale può migliorare l'efficienza per molti lavori".

Tuttavia, sono ancora necessarie risorse umane per combattere le imprecisioni. L'IA non pensa come un essere umano. Utilizza metodi diversi. E a volte non ha senso per noi perché mostra qualcosa.

"Uno dei maggiori problemi con l'IA è che la macchina non spiega perché ha creato un determinato output. Potrebbe avere senso per il modello, ma non per gli esseri umani.“

Se vuoi saperne di più su Machine learning e AI, consulta la nostra guida ai chatbot AI .