Veri Bilimini, Veri Analitiğini ve Büyük Veriyi Anlama

Yayınlanan: 2022-09-11

Veri Bilimi, Veri Analitiği ve Büyük Veri

SADECE BAŞKA BİR GÜN

Alarmınız Salı sabahı 05:30'da çalar. Dişlerini fırçala ve gayzerini aç. Ardından ütünün ısınmasını beklerken e-postalarınızı kontrol ediyorsunuz ama elektrikler kesiliyor. Yırtık bir gömlekle idare edersin. Eşiniz için güç olmadan kahve ve tost yapmak zor olduğundan, sabah menüsünde son dakika değişikliği: mısır gevreği ve soğuk süt. Spor salonunu atlamaya ve doğrudan duşa girmeye karar veriyorsunuz.

Kısa bir kahvaltı ve alelacele bir sohbetin ardından saat tam 08:15'te aracınıza binerek işe başlıyorsunuz. Yolda sonu gelmeyen, sonu gelmeyen bir trafik sıkışıklığıyla karşılaşıyorsunuz. Bir yolcuyla yapılan konuşma, bir geçit töreni yapıldığını ve şeritlerden birinin durdurulduğunu ortaya koyuyor.

Yeni bir lüks ev için başka bir reklam radyoda yayınlandığında, işe 15 dakikalık bir araba yolculuğu vaat ediyor, bu yolun ıssız olduğu günlerde ne olduğunu merak ediyorsunuz. Sonra sıcak yeni bir Bollywood şarkısı duyuyorsunuz ve mırıldanmaya başlıyorsunuz.

Sonunda, bir buçuk saatlik ıstıraplı trafikten sonra, günlük toplantı için tam zamanında işe varıyorsunuz, ancak uzun yolculuktan dolayı sinirli ve yorgunsunuz.

AYRICA OKUYUN: 2021'de Uygulanacak 13 Etkili SEO Stratejisi

ŞEYLER OLDUĞU ŞEKİLDE

Bu, birçok ofis çalışanı için Hindistan'da normal bir gün. Kalkarlar, giyinirler ve işe giderler. Yol boyunca birkaç karar verirler, ancak çoğunlukla akışa uyarlar. Genellikle reaktiftirler ve ne yazık ki sadece günü geçirmekle ilgilenirler.

Yine de böyle olmak zorunda değil.

BUNU HAYAL

Salı sabahı ve saat 05:30 yerine alarm 05:10'da çalıyor Planlanan elektrik kesintilerini öğrendiniz ve programınızı buna göre ayarladınız. Uyanır uyanmaz ütüyü ve ardından gayzeri açıyorsunuz. Siz dişlerinizi fırçalarken eşiniz tost makinesinde Fransız Tostu yapmaya başladı bile. Gömleğinizi ütülemeyi bitirirken sizi bekleyen sıcak kahvenin kokusunu alabilirsiniz.

Akım, haber vermeden aniden kapanır. Sabah koşun için kapıdan çıkarken gülümsüyorsun.

AYRICA OKUYUN|: SEO Rakip Analizi Nasıl Yapılır?

Egzersiz ve duştan sonra harika, sıcak bir kahvaltı ve bazı eğlenceli tartışmalarla kahveniz var. Daha sonra hazırlanın ve sabah 8:30 civarında yola çıkın.

Biraz daha uzun bir yol izliyorsunuz ama 40 dakikadan daha kısa bir sürede işe varıyorsunuz, bu da size günlük toplantınızdan önce bolca zaman tanıyor.

FARKLI NEDİR?

İlk senaryoda akışla gittiniz. Bir şeyler yaptın çünkü bu senin için doğal bir şeydi. Statükodan memnundun. Gününüzü planlamadan önce, elektrik kesintisi ve geç kalmanıza neden olan trafik sıkışıklığı gibi birçok değişkeni hesaba katmadınız. Eşi benzeri olmayan bir senaryo ve beklenen standart sonuçlar için standart bir teknik kullandınız.

İkinci senaryoda, rutininizi etkileyebilecek çeşitli faktörleri analiz ettiniz ve zaman çizelgenizi buna göre ayarladınız. Elektrik kesintisinin farkında olduğunuz için normalden birkaç dakika erken kalkıp şofben ve ütüyü açtınız.

AYRICA OKUYUN: Yapay zeka: Modern bir yaklaşım.

Eşiniz de tost makinesini ve kahve makinesini birkaç dakika önceden çalıştırdı. Ardından günün trafik koşullarını da göz önünde bulundurarak farklı bir rota seçtiniz.

Sonuç çıkardığın gerçekler var. Sonuç olarak eylemlerinizi ayarladınız ve sonuç çok daha iyi oldu. Analitiğin gücünden istemeden de olsa yararlandınız.

Merhaba, veri bilimi dünyasına hoş geldiniz.

VERİ BİLİMİ NEDİR?

Veri bilimi, matematik, istatistik, bilgisayar ve alan uzmanlığından verilerin toplanması, işlenmesi, manipülasyonu ve yorumlanmasına kadar araç ve tekniklerin uygulanmasını ifade eder.

data science
veri bilimi

Başka bir deyişle, veri bilimi, problemleri çözmek için verileri kullanma sürecidir. Veri toplamadan topladığınız bilgilerden içgörü elde etmeye kadar her şeyi kapsar.

VERİ BİLİMİ UYGULAMASI

Biraz önce okuduğunuz hikayeye bir göz atalım.

Varsayımsal olarak, günlerinizi düzene koymak ve onları daha iyi ve daha parlak hale getirmek için sabahlarınızın neden bu kadar aceleye geldiğine ilişkin bir araştırmadan elde edilen bilgileri kullanarak senaryo 1'in tekrarından kaçındınız.

Başlamak için kendinize şunu sormalısınız: "Harika bir gün geçirmek için neye ihtiyacım var?"

Aşağıdaki değişkenlerin listede görünmesi muhtemeldir:

  • Elektrik
  • Uyumak
  • Sıcak su
  • Çamaşırlar
  • Sabah kahvaltısı
  • Toplu taşıma
  • Trafik

Değişkenlerin bu birleşimi, günlük rutininizi nasıl iyileştireceğinize dair fikir edinmek için toplamanız, işlemeniz, budamanız ve değerlendirmeniz gereken veri türünü belirler. Veri bilimi, her bir değişkenin (veri noktası) birleşik etkisini belirlemede size yardımcı olacaktır.

seo-toolsOpens in a new tab.
seo araçları

VERİ VEYA 'BÜYÜK VERİ'?

Basit sabah rutini örneğimizde yedi kriteri analiz ettik. Sonuç olarak kazanılan bilgi gününüzü çok daha iyi hale getirebilir.

Ama ya daha fazlasını arıyorsanız? Ya her bir önemli parametreyi (sadece yedi yerine) hesaba katacak kadar karmaşık bir modeliniz olsaydı?

Big Data
Büyük veri

Artık sadece verilerle uğraşmazsınız; Büyük verilerle uğraşıyor olurdunuz.

Wikipedia'ya göre Opens in a new tab. , büyük veri şu şekilde tanımlanır:

“Büyük veri”, tipik veri işleme programlarının bunları işlemek için yetersiz kaldığı çok büyük veya karmaşık veri toplamaları anlamına gelir. Analiz etme, yakalama, veri iyileştirme, arama, paylaşma, depolama, taşıma, görselleştirme, sorgulama ve bilgi gizliliğinin tümü zorluklardır. Bu kelime genellikle belirli bir veri kümesi boyutundan ziyade verilerden değer çıkarmak için tahmine dayalı analitik veya diğer gelişmiş yaklaşımların kullanımına atıfta bulunur.”

Başka bir deyişle, büyük veri tamamen büyük veri kümeleriyle çalışmak ve onlardan içgörüler çıkarmakla ilgilidir. Geleneksel yaklaşımlar, çok büyük oldukları için bu veri kümeleriyle çalışmaz. Doğru tasarlanmış prosedürleri kullanarak verileri toplamanız, analiz etmeniz, saklamanız ve işlemeniz gerekecektir.

Genel olarak, veri kümesi ne kadar büyük olursa, sonuçlar o kadar iyi olur - veri kümesi kabul edilebilir kalitede olduğu sürece.

Örneğin, bir e-ticaret işinde web sitesi, yönlendiren siteler, sitede geçirilen süre, hemen çıkma oranı, açılış sayfası ve ziyaretçi akışı dahil olmak üzere bir dizi veri toplar. Bu bilgiyi kişi bazında takip ederler, bu da birkaç yıl içinde standart yaklaşımların kaldıramayacağı büyük bir veri seti derleyebilecekleri anlamına gelir. İşte o zaman 'Büyük Veri' ile çalıştıklarını anlarlar.

Sonuç olarak, sabah rutini örneğimizde, işlemek ve değerlendirmek için çok daha fazla parametre içeren çok büyük bir veri kümeniz olabilir. Şehrinizdeki on binlerce, belki de milyonlarca insandan bilgi toplamış olabilirsiniz. Bu bilgileri belirli bir süre boyunca toplamış ve çalışmanızda kullanabileceğiniz hava durumu, günün saati, trafik güncellemeleri, tweet'ler, hane geliri vb. gibi bir dizi ek yönü belgelemiş olabilirsiniz.

Veri kümelerinin boyutunu perspektife sokmak için başka bir yaklaşım, standart boyutlu bir veri kümesinin günlük bir gazete kadar kalın olabileceğini düşünmektir.

Bir 'büyük veri' veri setini yazdırmak için telefon rehberleriyle dolu 50 depoya ihtiyacınız olacaktır.

Bu kadar büyük miktarda veriyle uğraşırken geleneksel araçlar ve prosedürler yeterli olmayacaktır: özellikle bu amaç için oluşturulmuş özel yazılımlar gereklidir.

BUNU ANALİZ ET

Sabahınızla ilgili tüm bu bilgileri topladıktan sonra, sonuçlarınızı oluşturmak için araştırmanız ve araştırmanız gerekecek; buna veri analizi denir. Pazartesi gecesi 'Saas bhi kabhi bahun thi' izlemenin Salı sabahları daha geç uyanmanıza neden olduğunu örneğimizden tahmin edebilirsiniz. Alternatif olarak, çamaşırlarınızı Pazar yerine Cumartesi günü yıkamak, Salı günü fazladan ütülenmiş bir gömleğe sahip olmanızı sağlayacaktır.

Peki ya daha kapsamlı, karmaşık modeller için çok sayıda veri seti aramak isteseydiniz? O zaman veri analitiğiyle ilgilenirsiniz.

Data Analytics
Veri analizi
 İşlenmiş veri kümelerinden içgörüler elde etmek için bir dizi prosedürün (algoritma) veya dönüşümün uygulanması, veri analitiği olarak bilinir.

Sabah rutini örneğimizde belirli ayrıntıların karmaşık etkileşimini incelersiniz. Örneğin, günlük sıcaklığı araç kullanımıyla karşılaştırırsanız, sıcaklığın araç kullanımı üzerinde önemli bir etkisi olduğunu görebilirsiniz. Biraz daha araştırma ile bu basit modelin sadece yaz aylarında geçerli olduğunu öğreneceksiniz. Yağmur mevsiminde insanlar en çok arabalarını kullanırlar. Bu bilgilerle, ertesi gün yağışın ortalamanın üzerinde olması bekleniyor, bu da trafiğin daha yoğun olacağı anlamına geliyor.

Bu, eylemdeki veri analitiğidir. İş yerinde, trafik daha yüksek olacağından, normalden daha erken ayrılmaya karar vermek için veri analitiği kullanılır.

ÇÖZÜM

Analitik, büyük veri ve veri bilimi gibi endüstri terimleri sıklıkla ve yanlış bir şekilde birbirinin yerine kullanılmaktadır. Veri analizi, topladığınız verilere değer katan temel işlemlerden biriyken, veri bilimi, içinde çalışacağınız alandır. Tipik araçlar ve yöntemler kullanılarak işlenemeyen büyük miktarda veriyle uğraşırken büyük verilerle uğraşıyorsunuz demektir.

Tanımımız hakkında ne düşünüyorsunuz? Seninkiyle aynı mı? “Günlük rutin” örnekleri işe yarıyor mu? Paylaşmak istediğiniz kişisel bir örneğiniz var mı? Lütfen düşüncelerinizi yorum alanında paylaşın.