Tinjauan Lengkap Jaringan Syaraf Tiruan (JST)

Diterbitkan: 2020-07-17

Bahkan jika Anda tidak bekerja di bidang ilmu data atau rekayasa perangkat lunak, sulit untuk menghindari istilah jaringan saraf tiruan.

Jaringan saraf tiruan (JST) ada di mana-mana. Mereka digunakan di chatbot, pencitraan medis, perencanaan media, dan banyak area lainnya. Tetapi pernahkah kita bertanya dengan rasa ingin tahu yang mendalam: apa itu jaringan saraf tiruan, dan apa yang benar-benar dapat dicapainya?

Kita semua telah menemukan definisi umum bahwa jaringan saraf tiruan meniru fungsi sistem saraf manusia. Itu menjelaskan prinsip kerja, tetapi kebanyakan dari kita masih tidak tahu apa yang membuat JST begitu istimewa atau masalah apa yang ideal untuk itu. Untuk menjernihkan suasana, inilah panduan paling komprehensif dan mudah diakses yang akan Anda temukan di jaringan saraf tiruan.

Apa itu jaringan saraf tiruan?

Ketika selusin istilah seperti kecerdasan buatan, pembelajaran mesin, pembelajaran mendalam, dan jaringan saraf, mudah untuk menjadi bingung. Bifurkasi sebenarnya antara vertikal ini tidak terlalu rumit.

AI adalah perangkat universal yang merupakan materi pelajaran. Ini adalah studi sistematis tentang bagaimana program cerdas beroperasi dan dibuat. Pembelajaran mesin adalah bagian dari AI yang berfokus pada bagaimana mesin dapat belajar sendiri. Pembelajaran mendalam adalah subset lebih lanjut dari ML yang berfokus pada bagaimana lapisan jaringan saraf dapat digunakan untuk menghasilkan output. Anda dapat menggunakan visualisasi ini untuk menavigasi hierarki:

Jadi apa itu jaringan saraf tiruan? Jawabannya persis bagaimana media populer menggembar-gemborkannya. Ini adalah sistem pemrosesan data dan pembuatan output yang mereplikasi sistem saraf untuk mengungkap hubungan non-linear dalam kumpulan data besar. Data mungkin berasal dari rute sensorik dan mungkin dalam bentuk teks, gambar, atau audio.

Cara terbaik untuk memahami bagaimana jaringan saraf tiruan bekerja adalah dengan memahami bagaimana jaringan saraf alami di dalam otak bekerja dan menggambar paralel di antara mereka. Neuron adalah komponen mendasar dari otak manusia dan bertanggung jawab untuk belajar dan menyimpan pengetahuan dan informasi seperti yang kita ketahui. Anda dapat menganggap mereka sebagai unit pemrosesan di otak. Mereka mengambil data sensorik sebagai input, memprosesnya, dan memberikan data output yang digunakan oleh neuron lain. Informasi diproses dan diteruskan sampai hasil yang menentukan tercapai.

Jaringan saraf dasar di otak dihubungkan oleh sinapsis. Anda dapat memvisualisasikannya sebagai simpul akhir dari jembatan yang menghubungkan dua neuron. Jadi, sinapsis adalah titik pertemuan dua neuron. Sinapsis merupakan bagian penting dari sistem ini karena kekuatan sinapsis akan menentukan kedalaman pemahaman dan retensi informasi.

Saat Anda mempraktikkan suatu aktivitas, Anda memperkuat hubungan sinaptik ini. Ini adalah bagaimana Anda dapat memvisualisasikan jaringan saraf di otak Anda:

jaringan syaraf

Semua data sensorik yang dikumpulkan otak Anda secara real-time diproses melalui jaringan saraf ini. Mereka memiliki titik asal dalam sistem. Dan saat diproses oleh neuron awal, bentuk pemrosesan sinyal listrik yang keluar dari satu neuron menjadi input untuk neuron lain. Pemrosesan informasi mikro pada setiap lapisan neuron inilah yang membuat jaringan ini efektif dan efisien. Dengan mereplikasi tema pemrosesan data yang berulang ini di seluruh jaringan saraf, JST mampu menghasilkan keluaran yang unggul.

Dalam JST, semuanya dirancang untuk meniru proses ini. Jangan khawatir tentang persamaan matematika. Itu bukan ide kunci untuk dipahami sekarang. Semua data yang masuk dengan label 'X' dalam sistem memiliki bobot 'W' untuk menghasilkan sinyal berbobot. Ini mereplikasi peran kekuatan sinyal sinaptik di otak. Variabel bias dilampirkan untuk mengontrol hasil keluaran dari fungsi tersebut.

Jadi, semua data ini diproses dalam fungsi dan Anda berakhir dengan sebuah output. Seperti itulah jaringan saraf satu lapis atau perceptron akan terlihat. Ide jaringan saraf tiruan berkisar menghubungkan beberapa kombinasi neuron buatan tersebut untuk mendapatkan output yang lebih kuat. Itulah mengapa kerangka kerja konseptual jaringan saraf tiruan tipikal terlihat seperti ini:

Bagan visualisasi JST

Kami akan segera mendefinisikan lapisan tersembunyi, saat kami menyelam jauh ke dalam bagaimana fungsi jaringan saraf tiruan. Tapi sejauh pemahaman dasar tentang jaringan saraf tiruan yang bersangkutan, Anda tahu prinsip pertama sekarang.

Mekanisme ini digunakan untuk menguraikan kumpulan data besar. Output pada umumnya cenderung merupakan penetapan kausalitas antara variabel yang dimasukkan sebagai input yang dapat digunakan untuk peramalan. Sekarang setelah Anda mengetahui prosesnya, Anda dapat sepenuhnya memahami definisi teknis di sini:

“Sebuah jaringan yang meniru otak manusia dengan menciptakan sistem saraf tiruan melalui algoritma komputer yang mengenali pola yang belajar dari, menafsirkan, dan mengklasifikasikan data sensorik.”

Bagaimana jaringan saraf tiruan bekerja dan belajar?

Bersiaplah, hal-hal akan menjadi menarik di sini. Dan jangan khawatir – Anda tidak perlu melakukan banyak matematika sekarang.

Keajaiban terjadi pertama kali pada fungsi aktivasi. Fungsi aktivasi melakukan pemrosesan awal untuk menentukan apakah neuron akan diaktifkan atau tidak. Jika neuron tidak diaktifkan, outputnya akan sama dengan inputnya. Tidak ada yang terjadi kemudian. Ini sangat penting untuk dimiliki dalam jaringan saraf, jika tidak, sistem akan dipaksa untuk memproses banyak informasi yang tidak berdampak pada output. Soalnya, otak memiliki kapasitas yang terbatas tetapi telah dioptimalkan untuk menggunakannya dengan sebaik-baiknya.

Salah satu properti sentral yang umum di semua jaringan saraf tiruan adalah konsep non-linearitas. Sebagian besar variabel yang diteliti memiliki hubungan non-linier dalam kehidupan nyata.

Ambil contoh harga cokelat dan jumlah cokelat. Asumsikan bahwa satu cokelat berharga $1. Berapa harga 100 coklat? Mungkin $100. Berapa harga 10.000 cokelat? Bukan $10.000; karena penjual akan menambah biaya penggunaan kemasan ekstra untuk menyatukan semua cokelat atau dia akan mengurangi biaya karena Anda memindahkan begitu banyak inventarisnya sekaligus. Itulah konsep non-linearitas.

Fungsi aktivasi akan menggunakan prinsip matematika dasar untuk menentukan apakah informasi tersebut akan diproses atau tidak. Bentuk paling umum dari fungsi aktivasi adalah Fungsi Langkah Biner, Fungsi Logistik, Fungsi Tangen Hiperbolik, dan Satuan Linier Terperbaiki. Berikut adalah definisi dasar dari masing-masing:

Fungsi langkah biner: Fungsi ini mengaktifkan neuron berdasarkan ambang batas. Jika fungsi memiliki hasil akhir yang berada di atas atau di bawah nilai benchmark, neuron diaktifkan.
Fungsi logistik: Fungsi ini memiliki hasil akhir matematis dalam bentuk kurva 'S' dan digunakan ketika probabilitas merupakan kriteria kunci untuk menentukan apakah neuron harus diaktifkan. Jadi, pada titik mana pun, Anda dapat menghitung kemiringan kurva ini. Nilai fungsi ini terletak antara 0 dan 1.

Kemiringan dihitung menggunakan fungsi diferensial. Konsep ini digunakan ketika dua variabel tidak memiliki hubungan linier. Kemiringan adalah nilai garis singgung yang menyentuh kurva pada titik yang tepat di mana ketidaklinieran muncul. Masalah dengan fungsi logistik adalah tidak baik untuk memproses informasi dengan nilai negatif.
Fungsi tangen hiperbolik: Ini sangat mirip dengan fungsi logistik, kecuali nilainya jatuh antara -1 dan +1. Jadi, masalah nilai negatif yang tidak diproses di jaringan hilang.
Unit linier yang diperbaiki (ReLu): Nilai fungsi ini terletak antara 0 dan tak terhingga positif. ReLu menyederhanakan beberapa hal – jika inputnya positif, maka akan memberikan nilai 'x'. Untuk semua input lainnya, nilainya akan menjadi '0'. Anda dapat menggunakan ReLu Leaky yang memiliki nilai antara tak terhingga negatif dan tak terhingga positif. Ini digunakan ketika hubungan antara variabel yang sedang diproses benar-benar lemah dan mungkin dihilangkan oleh fungsi aktivasi sama sekali.

Sekarang Anda dapat merujuk ke dua diagram yang sama dari perceptron dan jaringan saraf. Apa bedanya selain jumlah neuron? Perbedaan utama adalah lapisan tersembunyi. Lapisan tersembunyi berada tepat di antara lapisan input dan lapisan output dalam jaringan saraf. Tugas lapisan tersembunyi adalah memperbaiki pemrosesan dan menghilangkan variabel yang tidak akan berdampak kuat pada output.

Jika jumlah instance dalam kumpulan data di mana dampak perubahan nilai variabel input terlihat pada variabel output, lapisan tersembunyi akan menunjukkan hubungan itu. Lapisan tersembunyi memudahkan ANN untuk memberikan sinyal yang lebih kuat ke lapisan pemrosesan berikutnya.

Bahkan setelah melakukan semua matematika ini dan memahami bagaimana lapisan tersembunyi beroperasi, Anda mungkin bertanya-tanya bagaimana jaringan saraf tiruan benar-benar belajar? Mari kita mulai dengan pertanyaan dasar tentang apa itu belajar. Belajar, dalam istilah yang paling sederhana, adalah membangun kausalitas antara dua hal (kegiatan, proses, variabel, dll). Ketika Anda 'mempelajari' cara melempar bola melengkung, Anda membangun hubungan sebab akibat antara tindakan fisik melempar bola dengan cara tertentu dan membuat lintasan bola melengkung dengan cara tertentu.

Sekarang, kausalitas ini sangat sulit untuk dibangun. Ingat pepatah mengatakan korelasi tidak sama dengan sebab akibat? Cukup mudah untuk menentukan kapan dua variabel bergerak ke arah yang sama. Sangat sulit untuk mengatakan dengan pasti variabel mana yang menyebabkan pergerakan variabel mana. Jelas, kita sering dapat menetapkan ini secara intuitif; tetapi bagaimana Anda membuat algoritma memahami intuisi?

Anda menggunakan fungsi biaya. Secara matematis, ini adalah selisih kuadrat antara nilai sebenarnya dari dataset dan nilai output dari dataset. Anda juga dapat mempertimbangkan tingkat kesalahan. Kami kuadratkan karena terkadang perbedaannya bisa negatif.

Anda dapat menandai setiap siklus input hingga pemrosesan output dengan fungsi biaya. Tugas Anda dan ANN adalah meminimalkan fungsi biaya ke nilai serendah mungkin. Anda mencapainya dengan menyesuaikan bobot di ANN. (Ingat hubungan sinaptik, alias bobot? Itulah yang sedang kita bicarakan). Ada beberapa cara untuk melakukan ini, tetapi sejauh Anda memahami prinsipnya, Anda hanya akan menggunakan alat yang berbeda untuk menjalankannya.

Dengan setiap siklus, kami bertujuan untuk meminimalkan fungsi biaya. Proses perpindahan dari input ke output disebut propagasi maju. Dan proses menggunakan data keluaran untuk meminimalkan fungsi biaya dengan menyesuaikan bobot dalam urutan terbalik dari lapisan tersembunyi terakhir ke lapisan input disebut propagasi mundur.

Anda dapat terus menyesuaikan bobot ini menggunakan metode Brute Force, yang menjadi tidak efisien saat kumpulan data terlalu besar, atau Batch-Gradient Descent, yang merupakan algoritme pengoptimalan. Sekarang Anda memiliki pemahaman intuitif tentang bagaimana jaringan saraf tiruan belajar.

Jaringan saraf berulang (RNN) vs. jaringan saraf convolutional (CNN)

Memahami dua bentuk jaringan saraf ini juga dapat menjadi pengantar Anda untuk dua aspek aplikasi AI yang berbeda – visi komputer dan pemrosesan bahasa alami. Dalam bentuk paling sederhana, kedua cabang AI ini membantu mesin mengidentifikasi objek secara visual dan memahami konteks data linguistik. Seperti yang dapat Anda bayangkan, sudah ada aplikasi yang digunakan dari cabang-cabang ini di mobil self-driving dan asisten virtual seperti Siri.

Sekarang, masing-masing cabang ini memiliki jaringan saraf sendiri yang mapan. NLP sangat tergantung pada jaringan saraf berulang. Perbedaan antara RNN dan JST adalah bahwa dalam JST, setiap sinyal input dianggap independen dari sinyal input berikutnya. Jadi, data input yang ada di antara dua node, dengan sendirinya tidak memiliki hubungan apa pun.

Pada kenyataannya, tidak demikian. Ketika kita berkomunikasi, setiap kata membersihkan cara kontekstual untuk kata berikutnya. Oleh karena itu, sifat dasar bahasa adalah menciptakan saling ketergantungan antara informasi yang dimasukkan sebelumnya dan informasi yang dimasukkan kemudian. RNN peka terhadap hal ini dengan menjalankan memori paralel yang menetapkan hubungan antara input ini untuk menghapus konteks.

Jaringan saraf convolutional idealnya digunakan untuk visi komputer. Terlepas dari fungsi aktivasi yang umum digunakan, mereka menambahkan fungsi pooling dan fungsi konvolusi. Fungsi konvolusi, dalam istilah yang lebih sederhana, akan menunjukkan bagaimana input dari satu gambar dan input dari gambar kedua (filter) akan menghasilkan gambar ketiga (hasil). Anda dapat membayangkan ini dengan memvisualisasikannya sebagai gambar yang difilter (kumpulan nilai piksel baru) yang berada di atas gambar masukan Anda (kumpulan nilai piksel asli) untuk mendapatkan gambar yang dihasilkan (nilai piksel yang diubah).

Fungsi pooling akan mengambil nilai maksimum atau minimum, tergantung pada fungsi yang ditambahkan, untuk mempermudah pemrosesan kumpulan informasi ini. Berikut adalah bagaimana Anda dapat memvisualisasikannya:

Fungsi konvolusi

Fungsi pooling

5 aplikasi jaringan saraf tiruan

Apa yang telah kita bicarakan sejauh ini semuanya terjadi di bawah tenda. Sekarang kita dapat memperkecil dan melihat ANN ini beraksi untuk sepenuhnya menghargai ikatan mereka dengan dunia kita yang terus berkembang:

1. Personalisasi rekomendasi pada platform e-commerce

Salah satu aplikasi ANN yang paling awal adalah mempersonalisasi pengalaman platform eCommerce untuk setiap pengguna. Apakah Anda ingat rekomendasi yang sangat efektif di Netflix? Atau saran produk yang tepat Amazon? Mereka adalah hasil dari ANN.

Ada banyak sekali data yang digunakan di sini: pembelian Anda sebelumnya, data demografis, data geografis, dan data yang menunjukkan apa yang selanjutnya dibeli oleh orang-orang yang membeli produk yang sama. Semua ini berfungsi sebagai masukan untuk menentukan apa yang mungkin cocok untuk Anda. Pada saat yang sama, apa yang benar-benar Anda beli membantu algoritme dioptimalkan. Dengan setiap pembelian, Anda memperkaya perusahaan dan algoritme yang memberdayakan ANN. Pada saat yang sama, setiap pembelian baru yang dilakukan di platform juga akan meningkatkan kemampuan algoritme dalam merekomendasikan produk yang tepat untuk Anda.

2. Memanfaatkan pemrosesan bahasa alami untuk chatbot percakapan

Belum lama ini, kotak obrolan mulai ramai di situs web. Seorang agen akan duduk di satu sisi dan membantu Anda dengan pertanyaan Anda yang diketik di dalam kotak. Kemudian, sebuah fenomena yang disebut pemrosesan bahasa alami (NLP) diperkenalkan ke chatbots dan semuanya berubah.

NLP umumnya menggunakan aturan statistik untuk mereplikasi kapasitas bahasa manusia, dan seperti aplikasi JST lainnya, semakin baik seiring waktu. Tanda baca, intonasi dan pengucapan Anda, pilihan tata bahasa, pilihan sintaksis, urutan kata dan kalimat, dan bahkan bahasa pilihan Anda dapat berfungsi sebagai input untuk melatih algoritma NLP.

Chatbot menjadi percakapan dengan menggunakan input ini untuk memahami konteks pertanyaan Anda dan merumuskan jawaban dengan cara yang paling sesuai dengan gaya Anda. NLP yang sama juga digunakan untuk pengeditan audio dalam musik dan tujuan verifikasi keamanan.

3. Memprediksi hasil dari acara terkenal

Sebagian besar dari kita mengikuti prediksi hasil yang dibuat oleh algoritma bertenaga AI selama pemilihan presiden serta Piala Dunia FIFA. Karena kedua acara tersebut bertahap, ini membantu algoritme dengan cepat memahami kemanjurannya dan meminimalkan fungsi biaya saat tim dan kandidat tereliminasi. Tantangan nyata dalam situasi seperti itu adalah tingkat variabel input. Dari kandidat hingga statistik pemain hingga demografi hingga kemampuan anatomi – semuanya harus dimasukkan.

Di pasar saham, algoritme prediktif yang menggunakan ANN telah ada sejak lama. Pembaruan berita dan metrik keuangan adalah variabel input utama yang digunakan. Berkat ini, sebagian besar bursa dan bank dapat dengan mudah memperdagangkan aset di bawah inisiatif perdagangan frekuensi tinggi dengan kecepatan yang jauh melebihi kemampuan manusia.

Masalah dengan pasar saham adalah bahwa data selalu berisik. Keacakan sangat tinggi karena tingkat penilaian subjektif yang dapat berdampak pada harga sekuritas yang sangat tinggi. Namun demikian, ANNs digunakan dalam kegiatan pembuatan pasar oleh setiap bank terkemuka hari ini.

4. Sanksi kredit

Tabel aktuaria sudah digunakan untuk menentukan faktor risiko yang terkait dengan setiap pemohon asuransi. ANN telah mengambil semua data itu lebih tinggi.

Semua pemberi pinjaman dapat menjalankan data selama puluhan tahun yang mereka miliki dengan bobot yang sudah mapan dalam sistem dan menggunakan informasi Anda sebagai masukan untuk menentukan profil risiko yang sesuai terkait dengan aplikasi pinjaman Anda. Usia Anda, jenis kelamin, kota tempat tinggal, sekolah kelulusan, industri pertunangan, gaji, dan rasio tabungan, semuanya digunakan sebagai masukan untuk menentukan skor risiko kredit Anda.

Apa yang sebelumnya sangat bergantung pada skor kredit individu Anda kini telah menjadi mekanisme yang jauh lebih komprehensif. Itulah alasan mengapa beberapa pemain fintech swasta terjun ke ruang pinjaman pribadi untuk menjalankan ANN yang sama dan meminjamkan kepada orang-orang yang profilnya dianggap terlalu berisiko oleh bank.

5. Mobil self-driving

Tesla, Waymo, dan Uber telah menggunakan ANN serupa. Input dan rekayasa produk mungkin berbeda, tetapi mereka menerapkan komputasi visual yang canggih untuk membuat mobil self-driving menjadi kenyataan.

Sebagian besar mengemudi sendiri berkaitan dengan pemrosesan informasi yang datang dari dunia nyata dalam bentuk kendaraan terdekat, rambu-rambu jalan, lampu alami dan buatan, pejalan kaki, bangunan, dan sebagainya. Jelas, jaringan saraf yang menggerakkan mobil self-driving ini lebih rumit daripada yang kita bahas di sini, tetapi mereka beroperasi dengan prinsip yang sama seperti yang kami uraikan.

Kesimpulan

ANN semakin hari semakin canggih. NLP sekarang membantu dalam diagnosis masalah kesehatan mental dini, visi komputer digunakan dalam pencitraan medis, dan ANN mendukung pengiriman drone. Ketika ANN menjadi lebih kompleks dan berlapis, kebutuhan kecerdasan manusia dalam sistem ini akan menjadi lebih sedikit. Bahkan area seperti desain sudah mulai menerapkan solusi AI dengan desain generatif.

Evolusi terakhir dari semua ANN yang disatukan adalah Kecerdasan Umum – suatu bentuk kecerdasan yang begitu canggih sehingga dapat mempelajari dan memahami semua informasi yang diketahui dan tidak diketahui umat manusia. Meskipun ini adalah kenyataan yang sangat jauh, bahkan jika mungkin, itu telah menjadi konsep yang dapat dibayangkan berkat adopsi ANN yang luas.