Comprendere Data Science, Data Analytics e Big Data

Pubblicato: 2022-09-11

Data Science, Data Analytics e Big Data

SOLO UN ALTRO GIORNO

La sveglia suona alle 5:30 di martedì mattina. Ti lavi i denti e accendi il geyser. Quindi, mentre aspetti che il ferro si scaldi, controlli le tue e-mail, ma la corrente si interrompe. Ti accontenti di una camicia accartocciata. Perché caffè e toast sono difficili da fare senza alimentazione per il coniuge, una modifica dell'ultimo minuto al menu del mattino: corn flakes e latte freddo. Decidi di saltare la palestra e di andare direttamente sotto la doccia.

Sali in macchina e cominci il viaggio di lavoro alle 8:15 precise, dopo una breve colazione e una conversazione frettolosa. Lungo la strada, ti imbatti in una congestione del traffico senza fine senza via d'uscita. Una conversazione con un collega pendolare rivela che c'è una processione in corso e una delle corsie è stata interrotta.

Quando un altro spot pubblicitario per una nuova casa di lusso va in onda alla radio, promettendo 15 minuti di auto per andare al lavoro, ti chiedi cosa sia successo ai giorni in cui questa strada era deserta. Poi senti una nuova canzone di Bollywood e inizi a canticchiare.

Alla fine, dopo un'ora e mezza di traffico agonizzante, arrivi al lavoro giusto in tempo per la riunione quotidiana, ma sei frustrato e affaticato dal lungo tragitto giornaliero.

LEGGI ANCHE: 13 strategie SEO efficaci da implementare nel 2021

COME SONO LE COSE

Questo è un giorno normale in India per molti impiegati. Si alzano, si vestono e vanno al lavoro. Prendono alcune decisioni lungo la strada, ma per lo più seguono il flusso. Di solito sono reattivi e, purtroppo, si preoccupano solo di affrontare la giornata.

Non deve essere così, però.

IMMAGINA QUESTO

È martedì mattina e invece delle 5:30, la sveglia suona alle 5:10. Hai appreso delle interruzioni di corrente pianificate e hai adattato la tua pianificazione di conseguenza. Accendi il ferro e poi il geyser non appena ti svegli. Mentre ti lavi i denti, il tuo coniuge ha già iniziato a fare il French Toast nel tostapane. Puoi sentire l'odore della tazza di caffè calda che ti aspetta mentre finisci di stirare la tua camicia.

La corrente si interrompe bruscamente senza preavviso. Sorridi mentre esci dalla porta per la tua corsa mattutina.

LEGGI ANCHE|: Come eseguire l'analisi della concorrenza SEO?

Hai una meravigliosa colazione calda e caffè con qualche discussione divertente dopo l'allenamento e la doccia. Quindi ti prepari e parti intorno alle 8:30

Prendi un percorso un po' più lungo ma arrivi al lavoro in meno di 40 minuti, dandoti tutto il tempo prima della tua riunione quotidiana.

COSA C'È DI DIVERSO?

Hai seguito il flusso nel primo scenario. Hai fatto delle cose perché per te era una seconda natura. Eri soddisfatto dello status quo. Prima di pianificare la tua giornata, non hai tenuto conto di numerose variabili come l'interruzione di corrente e l'ingorgo che ti ha causato il ritardo. Hai usato una tecnica standard per uno scenario unico e ti aspettavi risultati standard.

Nel secondo scenario, hai analizzato i vari fattori che potrebbero avere un impatto sulla tua routine e adattato di conseguenza il tuo orario. Poiché eri a conoscenza dell'interruzione di corrente, ti sei alzato qualche minuto prima del normale per accendere il geyser e il ferro da stiro.

LEGGI ANCHE: Intelligenza artificiale: un approccio moderno.

Anche il tuo coniuge ha acceso il tostapane e la macchina del caffè con qualche minuto di anticipo. Quindi, dopo aver tenuto conto delle condizioni del traffico della giornata, hai scelto di intraprendere un percorso diverso.

Hai fatti da cui hai tratto conclusioni. Di conseguenza hai modificato le tue azioni e il risultato è stato notevolmente migliore. Hai utilizzato il potere dell'analisi, anche se involontariamente.

Ciao e benvenuto nel regno della scienza dei dati.

COS'È LA SCIENZA DEI DATI?

La scienza dei dati si riferisce all'applicazione di strumenti e tecniche di matematica, statistica, computer e competenze di dominio alla raccolta, elaborazione, manipolazione e interpretazione dei dati.

data science
scienza dei dati

In altre parole, la scienza dei dati è il processo di utilizzo dei dati per risolvere i problemi. Copre tutto, dalla raccolta dei dati all'acquisizione di informazioni dettagliate dalle informazioni raccolte.

APPLICARE LA SCIENZA DEI DATI

Diamo un'occhiata alla narrativa che hai appena letto.

Ipoteticamente, hai evitato una ripetizione dello scenario 1 utilizzando le informazioni raccolte da un'indagine sul motivo per cui le tue mattine erano così affrettate, al fine di semplificare le tue giornate e renderle migliori e più luminose.

Per iniziare, devi chiederti: "Di cosa ho bisogno per trascorrere una giornata fantastica?"

È probabile che nell'elenco vengano visualizzate le seguenti variabili:

  • Elettricità
  • Sonno
  • Acqua calda
  • Vestiti
  • Colazione
  • Trasporto
  • Traffico

Questa confluenza di variabili determina il tipo di dati che dovrai raccogliere, elaborare, potare e valutare per ottenere informazioni su come migliorare la tua routine quotidiana. La scienza dei dati ti aiuterà a determinare l'influenza combinata di ciascuna variabile (punto dati).

seo-toolsOpens in a new tab.
seo-tools

DATI O 'BIG DATA'?

Abbiamo analizzato sette criteri nel nostro semplice esempio di routine mattutina. Le conoscenze acquisite di conseguenza potrebbero migliorare la tua giornata.

Ma se cercassi qualcosa di più? E se avessi un modello abbastanza complicato da tenere conto di ogni singolo parametro significativo (anziché solo sette)?

Big Data
Big Data

Non avresti più solo a che fare con i dati; avresti a che fare con Big Data.

Secondo Wikipedia Opens in a new tab. , i big data sono definiti come segue:

"Big data" si riferisce a raccolte di dati così massicce o complicate che i tipici programmi di elaborazione dati non sono sufficienti per gestirli. L'analisi, l'acquisizione, la cura dei dati, la ricerca, la condivisione, l'archiviazione, il trasporto, la visualizzazione, l'interrogazione e la privacy delle informazioni sono tutte sfide. La parola di solito allude all'uso di analisi predittive o altri approcci avanzati per estrarre valore dai dati, piuttosto che una dimensione specifica del set di dati".

Per dirla in altro modo, i big data si basano sul lavoro con set di dati di grandi dimensioni e sull'estrazione di informazioni dettagliate da essi. Gli approcci tradizionali non funzionano con questi set di dati poiché sono così grandi. Dovrai raccogliere, analizzare, archiviare ed elaborare i dati utilizzando procedure progettate correttamente.

In generale, maggiore è il set di dati, migliori saranno i risultati, purché il set di dati sia di qualità accettabile.

In un'attività di e-commerce, ad esempio, il sito Web raccoglie una serie di dati, inclusi siti di riferimento, tempo trascorso sul sito, frequenza di rimbalzo, pagina di destinazione e flusso di visitatori. Tengono traccia di queste informazioni persona per persona, il che significa che nel corso di alcuni anni saranno in grado di compilare un grande set di dati che gli approcci standard non saranno in grado di gestire. È allora che si rendono conto che stanno lavorando con i "Big Data".

Di conseguenza, nel nostro esempio di routine mattutina, potresti avere un set di dati molto grande con molti più parametri da elaborare e valutare. Potresti aver raccolto informazioni da decine di migliaia o forse milioni di persone nella tua città. Potresti aver raccolto queste informazioni per un periodo di tempo e documentato una serie di aspetti aggiuntivi, come meteo, ora del giorno, aggiornamenti sul traffico, tweet, reddito familiare e così via, che potresti utilizzare nel tuo studio.

Un altro approccio per mettere in prospettiva la dimensione dei set di dati è considerare che un set di dati di dimensioni standard potrebbe essere grande quanto un quotidiano.

Avresti bisogno di 50 magazzini pieni di elenchi telefonici per stampare un set di dati "big data".

Gli strumenti e le procedure tradizionali non saranno sufficienti quando si tratta di una quantità così grande di dati: è necessario un software specializzato creato appositamente per questo scopo.

ANALIZZA QUESTO

Dopo aver raccolto tutte queste informazioni sulla tua mattinata, dovrai investigarle e ricercarle per trarre le tue conclusioni; questo è noto come analisi dei dati. Puoi estrapolare dal nostro esempio che guardare "Saas bhi kabhi bahun thi" il lunedì sera ti fa svegliare più tardi il martedì mattina. In alternativa, fare il bucato il sabato anziché la domenica ti consentirà di avere una camicia stirata in più il martedì.

Ma cosa succede se si desidera cercare numerosi set di dati per modelli più completi e complicati? Quindi ti impegneresti nell'analisi dei dati.

Data Analytics
Analisi dei dati
 L'applicazione di una serie di procedure (algoritmi) o trasformazioni per ricavare informazioni dettagliate dai set di dati elaborati è nota come analisi dei dati.

Esamineresti la complicata interazione di dettagli specifici nel nostro esempio di routine mattutina. Ad esempio, se si confronta la temperatura giornaliera con l'utilizzo dell'auto, è possibile che la temperatura abbia un impatto considerevole sull'utilizzo dell'auto. Con una piccola ulteriore indagine, imparerai che questo semplice modello è valido solo durante i mesi estivi. Durante la stagione delle piogge, le persone usano di più la macchina. Con queste informazioni, puoi vedere che le precipitazioni del giorno successivo dovrebbero essere superiori alla media, il che implica che il traffico sarebbe più intenso.

Questa è l'analisi dei dati in azione. Al lavoro, l'analisi dei dati viene utilizzata per decidere di partire prima del solito poiché il traffico sarà maggiore.

CONCLUSIONE

Parole alla moda del settore come analisi, big data e scienza dei dati sono spesso e erroneamente utilizzate in modo intercambiabile. L'analisi dei dati è una delle operazioni di base che aggiunge valore ai dati che raccogli, mentre la scienza dei dati è il dominio in cui opereresti. E hai a che fare con big data quando hai a che fare con grandi quantità di dati che non possono essere elaborati utilizzando strumenti e metodi tipici.

Cosa ne pensi della nostra definizione? È uguale al tuo? Gli esempi di una “routine quotidiana” funzionano? Hai un esempio personale che vorresti condividere? Per favore condividi i tuoi pensieri nell'area commenti.