Memahami Ilmu Data, Analisis Data, dan Data Besar
Diterbitkan: 2022-09-11Ilmu Data, Analisis Data, dan Data Besar
HANYA HARI LAIN
Alarm Anda berbunyi pada pukul 05.30 pada hari Selasa pagi. Anda menyikat gigi dan menyalakan geyser Anda. Kemudian, sambil menunggu setrika memanas, Anda memeriksa email, tetapi listrik padam. Anda puas dengan kemeja yang dikerutkan. Karena kopi dan roti panggang sulit dibuat tanpa tenaga untuk pasangan Anda, perubahan di menit-menit terakhir pada menu pagi: corn flakes dan susu dingin. Anda memutuskan untuk melewatkan gym dan langsung mandi.
Anda masuk ke mobil Anda dan memulai perjalanan untuk bekerja tepat pada pukul 08:15, setelah sarapan singkat dan percakapan yang tergesa-gesa. Dalam perjalanan, Anda mengalami kemacetan lalu lintas yang tidak ada habisnya tanpa jalan keluar. Percakapan dengan sesama komuter mengungkapkan bahwa ada prosesi berlangsung, dan salah satu jalur telah dihentikan.
Ketika iklan lain untuk rumah mewah baru mengudara di radio, menjanjikan 15 menit berkendara ke kantor, Anda bertanya-tanya apa yang terjadi pada hari-hari ketika jalan ini sepi. Kemudian Anda mendengar lagu Bollywood baru yang panas dan mulai bersenandung.
Akhirnya, setelah satu setengah jam lalu lintas yang menyiksa, Anda tiba di tempat kerja tepat pada waktunya untuk rapat harian, tetapi Anda frustrasi dan lelah karena perjalanan panjang.
BACA JUGA: 13 Strategi SEO Efektif Untuk Diimplementasikan Pada Tahun 2021
CARANYA
Ini adalah hari biasa di India bagi banyak pekerja kantoran. Mereka bangun, berpakaian sendiri, dan berangkat kerja. Mereka membuat beberapa keputusan di sepanjang jalan, tetapi kebanyakan mereka mengikuti arus. Mereka biasanya reaktif dan, sayangnya, hanya peduli untuk menjalani hari.
Padahal tidak harus seperti itu.
BAYANGKAN INI
Ini Selasa pagi, dan bukannya pukul 5:30, alarm berbunyi pada pukul 5:10 Anda mengetahui tentang pemadaman listrik yang direncanakan dan menyesuaikan jadwal Anda. Anda menyalakan setrika dan kemudian geyser segera setelah Anda bangun. Saat Anda menyikat gigi, pasangan Anda sudah mulai membuat French Toast di pemanggang roti. Anda dapat mencium aroma secangkir kopi panas yang menunggu Anda saat Anda selesai menyetrika baju Anda.
Arus tiba-tiba mati tanpa pemberitahuan. Anda tersenyum saat berjalan keluar pintu untuk lari pagi.
BACA JUGA|: Bagaimana Melakukan Analisis Kompetitor SEO?
Anda menikmati sarapan dan kopi panas yang luar biasa dengan diskusi yang menghibur setelah berolahraga dan mandi. Anda kemudian bersiap-siap dan pergi sekitar jam 8:30 pagi
Anda mengambil rute yang sedikit lebih lama tetapi tiba di tempat kerja dalam waktu kurang dari 40 menit, memberi Anda banyak waktu sebelum rapat harian Anda.
APA YANG BERBEDA?
Anda mengikuti arus dalam skenario pertama. Anda melakukan sesuatu karena itu adalah sifat kedua bagi Anda. Anda puas dengan status quo. Sebelum merencanakan hari Anda, Anda gagal memperhitungkan banyak variabel seperti pemadaman listrik dan kemacetan lalu lintas yang menyebabkan Anda terlambat. Anda menggunakan teknik standar untuk skenario unik dan hasil standar yang diharapkan.
Dalam skenario kedua, Anda menganalisis berbagai faktor yang mungkin berdampak pada rutinitas Anda dan menyesuaikan jadwal Anda. Karena Anda mengetahui pemadaman listrik, Anda bangun beberapa menit lebih awal dari biasanya untuk menyalakan geyser dan setrika.
BACA JUGA: Kecerdasan Buatan: Pendekatan Modern.
Pasangan Anda juga menyalakan pemanggang roti dan mesin kopi beberapa menit sebelumnya. Kemudian, setelah mempertimbangkan kondisi lalu lintas hari itu, Anda memilih untuk mengambil rute yang berbeda.
Anda memiliki fakta dari mana Anda menarik kesimpulan. Anda menyesuaikan tindakan Anda sebagai hasilnya, dan hasilnya jauh lebih baik. Anda memanfaatkan kekuatan analitik, namun secara tidak sengaja.
Halo, dan selamat datang di ranah ilmu data.
APA ITU ILMU DATA?
Ilmu data mengacu pada penerapan alat dan teknik dari matematika, statistik, komputer, dan keahlian domain hingga pengumpulan, pemrosesan, manipulasi, dan interpretasi data.

Dengan kata lain, ilmu data adalah proses menggunakan data untuk memecahkan masalah. Ini mencakup semuanya, mulai dari pengumpulan data hingga mendapatkan wawasan dari informasi yang Anda kumpulkan.
MENERAPKAN ILMU DATA
Mari kita lihat narasi yang baru saja Anda baca.
Secara hipotetis, Anda menghindari pengulangan skenario 1 dengan memanfaatkan wawasan yang dikumpulkan dari penyelidikan mengapa pagi Anda begitu terburu-buru, untuk merampingkan hari-hari Anda dan menjadikannya lebih baik dan lebih cerah.
Untuk memulai, Anda harus bertanya pada diri sendiri, "Apa yang saya butuhkan untuk memiliki hari yang fantastis?"
Variabel berikut kemungkinan akan muncul dalam daftar:
- Listrik
- Tidur
- Air panas
- Pakaian
- Sarapan
- Angkutan
- Lalu lintas
Pertemuan variabel ini menentukan jenis data yang Anda perlukan untuk dikumpulkan, diproses, dipangkas, dan dievaluasi untuk mendapatkan wawasan tentang cara meningkatkan rutinitas harian Anda. Ilmu data akan membantu Anda dalam menentukan pengaruh gabungan dari setiap variabel (titik data).


DATA ATAU 'DATA BESAR'?
Kami menganalisis tujuh kriteria dalam contoh rutinitas pagi sederhana kami. Pengetahuan yang diperoleh sebagai hasilnya bisa membuat hari Anda jauh lebih baik.

Tetapi bagaimana jika Anda mencari sesuatu yang lebih? Bagaimana jika Anda memiliki model yang cukup rumit untuk memperhitungkan setiap parameter signifikan (bukan hanya tujuh)?

Anda tidak lagi hanya berurusan dengan data; Anda akan berurusan dengan data besar.
Menurut Wikipedia , data besar didefinisikan sebagai berikut:
“Big data” mengacu pada kumpulan data yang begitu masif atau rumit sehingga program pemrosesan data biasa tidak cukup untuk menanganinya. Menganalisis, menangkap, kurasi data, pencarian, berbagi, penyimpanan, transportasi, visualisasi, query, dan privasi informasi adalah semua tantangan. Kata tersebut biasanya mengacu pada penggunaan analitik prediktif atau pendekatan lanjutan lainnya untuk mengekstrak nilai dari data, daripada ukuran kumpulan data tertentu.”
Dengan kata lain, data besar adalah tentang bekerja dengan kumpulan data besar dan mengekstraksi wawasan darinya. Pendekatan tradisional tidak bekerja dengan dataset ini karena mereka sangat besar. Anda harus mengumpulkan, menganalisis, menyimpan, dan memproses data menggunakan prosedur yang dirancang dengan benar.
Secara umum, semakin besar kumpulan data, semakin baik hasilnya — selama kumpulan data memiliki kualitas yang dapat diterima.
Dalam bisnis e-niaga, misalnya, situs web mengumpulkan banyak data, termasuk situs perujuk, waktu yang dihabiskan di situs, rasio pentalan, laman landas, dan arus pengunjung. Mereka melacak informasi ini berdasarkan orang per orang, yang berarti bahwa selama beberapa tahun, mereka akan dapat mengkompilasi kumpulan data besar yang tidak dapat ditangani oleh pendekatan standar. Saat itulah mereka menyadari bahwa mereka bekerja dengan 'Big Data.'
Akibatnya, dalam contoh rutinitas pagi kami, Anda dapat memiliki kumpulan data yang sangat besar dengan lebih banyak parameter untuk diproses dan dievaluasi. Anda mungkin telah mengumpulkan informasi dari puluhan ribu atau mungkin jutaan orang di kota Anda. Anda mungkin telah mengumpulkan informasi ini selama periode waktu tertentu dan mendokumentasikan sejumlah aspek tambahan, seperti cuaca, waktu, pembaruan lalu lintas, tweet, pendapatan rumah tangga, dan sebagainya, yang dapat Anda manfaatkan dalam studi Anda.
Pendekatan lain untuk menempatkan ukuran kumpulan data ke dalam perspektif adalah dengan mempertimbangkan bahwa kumpulan data berukuran standar bisa setebal koran harian.
Anda membutuhkan 50 gudang penuh direktori telepon untuk mencetak kumpulan data 'big data'.
Alat dan prosedur tradisional tidak akan cukup ketika menangani data dalam jumlah besar seperti itu: diperlukan perangkat lunak khusus yang dibuat khusus untuk tujuan ini.
ANALISA INI
Setelah Anda mengumpulkan semua informasi tentang pagi Anda ini, Anda perlu menyelidiki dan menelitinya untuk membuat kesimpulan; ini dikenal sebagai analisis data. Anda dapat memperkirakan dari contoh kami bahwa menonton 'Saas bhi kabhi bahun thi' pada Senin malam menyebabkan Anda bangun lebih lambat pada Selasa pagi. Atau, mencuci pakaian Anda pada hari Sabtu daripada hari Minggu akan memungkinkan Anda untuk memiliki kemeja tambahan yang disetrika pada hari Selasa.
Tetapi bagaimana jika Anda ingin mencari banyak kumpulan data untuk pola yang lebih komprehensif dan rumit? Kemudian Anda akan terlibat dalam analisis data.

Penerapan serangkaian prosedur (algoritma) atau transformasi untuk memperoleh wawasan dari kumpulan data yang diproses dikenal sebagai analitik data.
Anda akan memeriksa interaksi rumit dari detail spesifik dalam contoh rutinitas pagi kita. Misalnya, jika Anda membandingkan suhu harian dengan penggunaan mobil, Anda mungkin menemukan bahwa suhu memiliki dampak yang cukup besar pada penggunaan mobil. Dengan sedikit penyelidikan lebih lanjut, Anda akan mengetahui bahwa model sederhana ini hanya berlaku selama bulan-bulan musim panas. Selama musim hujan, orang menggunakan mobil mereka paling banyak. Dengan informasi ini, Anda dapat melihat bahwa curah hujan hari berikutnya diperkirakan lebih dari rata-rata, yang menyiratkan bahwa lalu lintas akan lebih padat.
Itu adalah analitik data yang sedang beraksi. Di tempat kerja, analitik data digunakan untuk memutuskan untuk pergi lebih cepat dari biasanya karena lalu lintas akan lebih tinggi.
KESIMPULAN
Kata kunci industri seperti analitik, data besar, dan ilmu data sering dan salah digunakan secara bergantian. Analisis data adalah salah satu operasi dasar yang menambah nilai pada data yang Anda kumpulkan, sedangkan ilmu data adalah domain di mana Anda akan beroperasi. Dan Anda berurusan dengan data besar ketika Anda berurusan dengan sejumlah besar data yang tidak dapat diproses menggunakan alat dan metode biasa.
Bagaimana perasaan Anda tentang definisi kami? Apakah sama dengan milikmu? Apakah contoh "rutinitas sehari-hari" berhasil? Apakah Anda memiliki contoh pribadi yang ingin Anda bagikan? Silakan bagikan pemikiran Anda di area komentar.