Semua yang perlu Anda ketahui tentang Pembelajaran mesin [Wawancara Ilmuwan Data]

Diterbitkan: 2022-05-25

Sci-fi telah melukis banyak gambar horor masa depan mesin yang mengambil alih dunia. Visi suram dari mesin yang sangat kuat ini adalah beberapa dari banyak kesalahpahaman yang dimiliki orang tentang AI dan pembelajaran Mesin.

Dalam artikel ini, Spesialis Pembelajaran Mesin kami Juuso Lassila menjawab pertanyaan yang paling sering diajukan tentang Pembelajaran mesin dan memberi tahu kami mengapa mesin belum cukup siap untuk mengambil alih dunia.

Pembelajaran mesin

1. Apa itu Pembelajaran mesin?

Pembelajaran mesin berarti bahwa mesin dapat belajar tanpa diprogram. Pembelajaran mesin dan AI sering keliru digunakan sebagai sinonim, padahal keduanya tidak sama. Pembelajaran mesin sebenarnya adalah bagian dari AI.

“AI adalah istilah yang didefinisikan dengan buruk. Itu bisa berarti apa saja,” Lassila menjelaskan.

Perbedaan besar antara Machine learning dan AI adalah AI tidak selalu membutuhkan data. Misalnya, ada yang mengatakan bahwa menemukan rute optimal di peta adalah AI. Proses ini tidak berbasis data tetapi algoritma .

Pembelajaran mesin, di sisi lain, adalah AI yang menggunakan data untuk belajar. Manfaat Machine learning adalah programmer tidak perlu tahu bagaimana model menyelesaikan masalah. Ini berarti mesin dapat menggunakan teknik yang tidak disadari oleh programmer. Saat ini, pembelajaran mesin memainkan peran penting di banyak industri.

2. Bagaimana Pembelajaran Mesin digunakan?

Pembelajaran mesin mencoba memahami data dan struktur di dalamnya. Sederhananya, mari kita ambil sesuatu yang disukai internet: gambar kucing dan anjing! Jadi, jika Anda memiliki ratusan gambar teman berbulu favorit Anda dalam urutan acak, Anda dapat menggunakan Pembelajaran mesin untuk membedakan antara gambar-gambar ini. Mesin dapat mengatur data sehingga Anda hanya mendapatkan gambar kucing, misalnya.

“Pembelajaran mesin akan memprediksi nilai dari data yang Anda masukkan ke dalamnya dan memahami data tersebut,” kata Lassila.

Cara umum menggunakan Machine learning adalah untuk klasifikasi data, seperti pada contoh kami dengan gambar kucing dan anjing di atas. Namun, Pembelajaran mesin juga digunakan di chatbot AI dan untuk membuat berbagai jenis prediksi. Misalnya, Pembelajaran mesin dapat digunakan untuk memperkirakan nilai rumah berdasarkan ukuran, lokasi, tahun dibangun, dan informasi lainnya.

3. Bagaimana mesin belajar?

Pembelajaran mesin biasanya berusaha meminimalkan kesalahan model. Pertama, dimulai dengan jawaban acak. Kemudian manusia memberikan jawaban yang benar, Lassila menjelaskan.

Ada cara untuk mengukur seberapa salah mesin itu dengan jawaban yang diberikannya. Dalam beberapa model pembelajaran mesin, pembedaan digunakan untuk meminimalkan kesalahan.

Dengan membedakan, Anda dapat menghitung ke arah mana parameter harus diubah untuk mengurangi nilai fungsi kesalahan.

“Kemudian Anda tahu bagaimana mengubah parameter Anda sehingga nilai fungsi berkurang. Anda kemudian mengambil langkah kecil menuju kesalahan yang lebih kecil dengan mengubah parameter. Dengan begitu kesalahan bisa diminimalisir,” kata Lassila.

4. Bisakah mesin bebas dari kesalahan?

Secara teori, mungkin saja tidak ada kesalahan tetapi di dunia nyata, itu tidak benar-benar terjadi. Bahkan dalam kasus terbaik, mesin hanya bisa mendapatkan 99,9% dari data yang benar.

“Untuk klasifikasi, kita bisa mengukur akurasinya,” kata Lassila. Biasanya, akurasi 90-95% dianggap cukup baik. Ketika margin kesalahan cukup rendah, mesin siap untuk berproduksi. Seberapa rendah margin kesalahan harus sebelum produk dapat ditayangkan tergantung pada tugas yang harus dilakukan mesin.

Ketika berbicara tentang chatbot AI, sulit untuk mengatakan kapan bot akan lebih membantu daripada mengganggu karena chatbot AI dapat memiliki sebanyak mungkin contoh pertanyaan. Mesin selalu harus memilih yang terbaik dari jawaban yang tersedia. Seberapa benar mesin itu tergantung pada berapa banyak contoh pertanyaan yang ada.

“Jika Anda memiliki satu pertanyaan, mesinnya selalu benar. Kalau ada dua, mudah-mudahan sering benar, tapi kalau ada 100 soal kemungkinan besar mesin akan memilih jawaban yang salah,” jelas Lassila.

5. Apa itu pembelajaran mendalam?

Pembelajaran mendalam adalah metode pembelajaran mesin yang menggunakan lapisan dalam model. Satu lapisan menghasilkan output dan output tersebut ditransfer ke lapisan kedua dan seterusnya. Pembelajaran mendalam biasanya dilakukan dalam jaringan saraf .

“Jaringan saraf sangat berguna karena mereka beradaptasi dengan baik pada format input dan output yang berbeda,” kata Lassila.

Jaringan saraf sangat serbaguna, dan itulah sebabnya mereka memiliki banyak kasus penggunaan. Chatbot AI biasanya menggunakan jaringan saraf juga.

“Kami membuat penyematan kalimat itu dari pesan yang hanya berupa titik vektor di ruang angkasa. Kemudian kami mengukur kesamaan mereka. Ini menggunakan jaringan saraf. Ini memiliki banyak lapisan dan memberikan output di akhir, ”jelas Lassila.

Ada juga banyak metode pembelajaran mesin yang tidak mendalam. Seperti mendukung mesin vektor atau pohon keputusan .

6. Apa hambatan dari Machine learning?

Data adalah salah satu hal yang menyebabkan keterbatasan pembelajaran Mesin. Jika Anda tidak memiliki data, Machine learning tidak akan berfungsi. Anda juga membutuhkan sumber daya komputasi. Seringkali model menyebabkan keterbatasan juga.

“Untuk tugas dasar, seperti klasifikasi, modelnya bagus. Dan dalam kasus tersebut, Anda hanya dibatasi oleh data dan sumber daya komputasi. Tapi di beberapa domain modelnya belum begitu bagus,” kata Lassila.

Semakin banyak data semakin baik, selama Anda memiliki sumber daya untuk menghitung data tersebut. Tapi, datanya harus berkualitas baik. Selain itu, modelnya harus besar sehingga model tersebut mampu menangani semua input kompleks yang mungkin didapatnya. Anda membutuhkan banyak daya pemrosesan agar mesin dapat menangani data tersebut.

“Anda dapat memiliki akses ke banyak data. Bukan itu masalahnya sebenarnya.” Lassila mengatakan. “Masalahnya adalah model dan waktu yang dibutuhkan untuk melatih mereka. Banyak memori yang dibutuhkan untuk menyimpan model-model ini.”

Kelemahan lain dari Machine learning adalah arsitektur model yang tersedia saat ini untuk beberapa tugas. Tidak ada arsitektur model yang baik untuk penyematan kalimat saat ini.

“Masih dilakukan penelitian untuk menemukan model yang benar-benar bagus,” kata Lassila.

7. Bagaimana Anda mengajar mesin?

Pertama, Anda memerlukan banyak data, dan data yang Anda gunakan untuk melatih model memerlukan label manusia.

“Perusahaan besar yang menggunakan Machine learning memiliki pasukan yang hanya memberi label pada data,” Lassila menjelaskan.

Meskipun bot dapat mulai melabeli data seiring waktu, Anda tidak ingin menggunakan jawaban yang diberikan model kepada Anda sebagai data pelatihan. Model membuat kesalahan lebih dari manusia. Jika Anda menggunakan pelabelan mesin sebagai data pelatihan, Anda mengajarkan kesalahan tersebut lagi ke model.

“Itu akan membuat kesalahan tumbuh lebih besar dan lebih besar. “

Dimungkinkan juga untuk menggunakan pembelajaran aktif di mana model dapat memberi tahu jenis titik data apa yang berguna untuk diberi label. Hal ini dapat membuat belajar lebih efisien. “Mesin dapat memandu proses pelabelan. Tetap saja, manusia harus melakukan pelabelan agar kesalahan tidak menyebar. “

Setelah manusia melatih model dengan data, maka mesin harus dapat mereproduksi pelabelan itu untuk input yang tidak terlihat. Namun jika membutuhkan jawaban baru maka data tersebut perlu diberi label lagi oleh manusia.

Masa depan AI

8. Bagaimana masa depan pembelajaran mesin?

Pembelajaran mesin berkembang sangat cepat saat ini. Beberapa tahun yang lalu model pembelajaran mendalam lainnya, model transformator, diperkenalkan. Penemuan model transformator memiliki dampak besar pada pembelajaran Mesin.

“Kami telah membangun kembali seluruh bidang penelitian seputar penemuan itu. Ini benar-benar bekerja dengan baik,” Lassila menjelaskan.

Model transformator juga digunakan dalam chatbot AI dengan Natural Language Processing. “Tetapi pada titik tertentu, kita akan mencapai ujung jalan tentang seberapa baik kita dapat menggunakan arsitektur itu,” kata Lassila. “Semoga kami akan menemukan sesuatu yang baru yang memberikan hasil yang lebih baik lagi.”

9. Akankah mesin mengambil alih dunia?

Orang berharap terlalu banyak atau tidak cukup dari AI dan pembelajaran Mesin.

“Ada kurangnya pemahaman tentang kemampuan AI,” kata Lassila.

Jadi sepertinya mesin belum akan menguasai dunia. Bot memiliki beberapa rintangan yang harus diatasi sebelum itu terjadi.

“Model dan arsitekturnya belum ada. Kami memang memiliki data dan sumber daya komputasi untuk membuat AI yang bagus, tetapi kami masih membutuhkan arsitektur bagus itu untuk diambil alih oleh robot.”

Meskipun AI belum siap untuk mengambil alih dunia, ia akan mengambil alih beberapa pekerjaan.

“Beberapa pekerjaan mungkin akan digantikan oleh AI di beberapa titik. Ini akan menjadi pekerjaan berulang yang tidak membutuhkan banyak pemikiran,” kata Lassila.

Ada dua cara untuk memikirkan bagaimana AI akan mengubah pasar kerja. Salah satunya adalah bahwa AI menggantikan pekerjaan, tetapi juga dapat meningkatkan pekerjaan. Itu bisa bekerja bersama manusia. Contoh bagusnya adalah chatbots , yang dapat terhubung ke agen langsung saat mereka tidak dapat membantu pengunjung situs web.

“AI dapat meningkatkan efisiensi untuk banyak pekerjaan.”

Namun, Anda masih membutuhkan sumber daya manusia untuk memerangi ketidakakuratan. AI tidak berpikir seperti manusia. Ini menggunakan metode yang berbeda. Dan terkadang tidak masuk akal bagi kami mengapa itu menunjukkan sesuatu.

“Salah satu masalah terbesar dengan AI adalah mesin tidak menjelaskan mengapa ia menghasilkan output tertentu. Mungkin masuk akal untuk modelnya, tapi tidak untuk manusia.”

Jika Anda ingin mengetahui lebih lanjut tentang Pembelajaran mesin dan AI, lihat panduan chatbot AI kami .