Data Science, Data Analytics und Big Data verstehen
Veröffentlicht: 2022-09-11Data Science, Data Analytics und Big Data
NUR EIN WEITERER TAG
Dein Wecker klingelt am Dienstagmorgen um 5:30 Uhr. Sie putzen Ihre Zähne und schalten Ihren Geysir ein. Während Sie darauf warten, dass sich das Bügeleisen aufheizt, checken Sie Ihre E-Mails, aber der Strom fällt aus. Du begnügst dich mit einem zerknitterten Hemd. Da Kaffee und Toast ohne Strom für Ihren Ehepartner schwer zuzubereiten sind, eine Last-Minute-Änderung des Morgenmenüs: Cornflakes und kalte Milch. Sie beschließen, das Fitnessstudio zu überspringen und direkt unter die Dusche zu gehen.
Sie steigen in Ihr Auto und treten nach einem kurzen Frühstück und einem hastigen Gespräch pünktlich um 8:15 Uhr die Fahrt zur Arbeit an. Unterwegs geraten Sie in einen endlosen Stau ohne Ausweg. Aus einem Gespräch mit einem Mitpendler ergibt sich, dass eine Prozession stattfindet und eine der Fahrspuren angehalten wurde.
Wenn im Radio ein weiterer Werbespot für ein neues Luxushaus läuft, der eine 15-minütige Fahrt zur Arbeit verspricht, fragt man sich, was aus den Tagen geworden ist, als diese Straße verlassen war. Dann hörst du einen heißen neuen Bollywood-Song und beginnst mitzusummen.
Schließlich, nach anderthalb Stunden quälenden Verkehrs, kommen Sie gerade noch rechtzeitig zur täglichen Besprechung bei der Arbeit an, aber Sie sind frustriert und müde von der langen Fahrt zur Arbeit.
LESEN SIE AUCH: 13 effektive SEO-Strategien zur Umsetzung im Jahr 2021
WIE DIE DINGE SIND
Für viele Büroangestellte ist dies ein ganz normaler Tag in Indien. Sie stehen auf, ziehen sich an und machen sich auf den Weg zur Arbeit. Sie treffen unterwegs ein paar Entscheidungen, aber meistens schwimmen sie mit dem Strom. Sie sind normalerweise reaktiv und kümmern sich leider nur darum, den Tag zu überstehen.
Es muss aber nicht so sein.
STELL DIR DAS VOR
Es ist Dienstagmorgen und statt 5:30 Uhr klingelt der Wecker um 5:10 Uhr. Sie haben von den geplanten Stromausfällen erfahren und Ihren Zeitplan entsprechend angepasst. Sie schalten das Bügeleisen und dann den Durchlauferhitzer ein, sobald Sie aufwachen. Während Sie Ihre Zähne putzen, hat Ihr Ehepartner bereits damit begonnen, French Toast im Toaster zuzubereiten. Sie können die heiße Tasse Kaffee riechen, die auf Sie wartet, während Sie Ihr Hemd fertig bügeln.
Der Strom wird ohne Vorankündigung abrupt unterbrochen. Du lächelst, wenn du für deinen morgendlichen Lauf aus der Tür gehst.
LESEN SIE AUCH|: Wie führt man eine SEO-Wettbewerbsanalyse durch?
Sie haben ein wunderbares, warmes Frühstück und Kaffee mit einer unterhaltsamen Diskussion nach dem Training und der Dusche. Sie machen sich dann fertig und fahren gegen 8:30 Uhr los
Sie nehmen einen etwas längeren Weg, kommen aber in weniger als 40 Minuten zur Arbeit, sodass Sie genügend Zeit vor Ihrem täglichen Meeting haben.
WAS IST UNTERSCHIEDLICH?
Im ersten Szenario sind Sie mit dem Strom geschwommen. Du hast Dinge getan, weil es für dich zur zweiten Natur geworden ist. Sie waren mit dem Status quo zufrieden. Bevor Sie Ihren Tag geplant haben, haben Sie zahlreiche Variablen wie den Stromausfall und den Stau, der zu Ihrer Verspätung geführt hat, nicht berücksichtigt. Sie haben eine Standardtechnik für ein einzigartiges Szenario verwendet und Standardergebnisse erwartet.
Im zweiten Szenario haben Sie die verschiedenen Faktoren analysiert, die sich auf Ihre Routine auswirken könnten, und Ihren Stundenplan entsprechend angepasst. Da Ihnen der Stromausfall bewusst war, sind Sie ein paar Minuten früher als sonst aufgestanden, um den Wasserkocher und das Bügeleisen einzuschalten.
LESEN SIE AUCH: Künstliche Intelligenz: Ein moderner Ansatz.
Ihr Ehepartner hat auch den Toaster und die Kaffeemaschine ein paar Minuten im Voraus gestartet. Dann haben Sie sich unter Berücksichtigung der Verkehrslage für den Tag für eine andere Route entschieden.
Sie haben Fakten, aus denen Sie Schlüsse gezogen haben. Daraufhin haben Sie Ihr Handeln angepasst, und das Ergebnis war deutlich besser. Sie haben die Möglichkeiten der Analytik genutzt, jedoch unbeabsichtigt.
Hallo und willkommen im Reich der Datenwissenschaft.
WAS IST DATENWISSENSCHAFT?
Data Science bezieht sich auf die Anwendung von Werkzeugen und Techniken aus Mathematik, Statistik, Computern und Domänenwissen zur Erfassung, Verarbeitung, Manipulation und Interpretation von Daten.

Anders ausgedrückt ist Data Science der Prozess der Nutzung von Daten zur Lösung von Problemen. Es deckt alles ab, von der Datenerfassung bis zum Gewinnen von Erkenntnissen aus den von Ihnen gesammelten Informationen.
DATENWISSENSCHAFT ANWENDEN
Werfen wir einen Blick auf die Erzählung, die Sie gerade gelesen haben.
Hypothetisch haben Sie eine Wiederholung von Szenario 1 vermieden, indem Sie Erkenntnisse genutzt haben, die Sie aus einer Untersuchung darüber gewonnen haben, warum Ihre Morgen so gehetzt waren, um Ihre Tage zu rationalisieren und sie besser und heller zu gestalten.
Zu Beginn müssen Sie sich fragen: „Was benötige ich, um einen fantastischen Tag zu haben?“
Die folgenden Variablen werden wahrscheinlich in der Liste erscheinen:
- Elektrizität
- Schlafen
- Heißes Wasser
- Kleidung
- Frühstück
- Transport
- Verkehr
Dieser Zusammenfluss von Variablen bestimmt die Art der Daten, die Sie sammeln, verarbeiten, beschneiden und auswerten müssen, um einen Einblick zu erhalten, wie Sie Ihre tägliche Routine verbessern können. Data Science unterstützt Sie bei der Bestimmung des kombinierten Einflusses jeder Variablen (Datenpunkt).


DATEN ODER „BIG DATA“?
In unserem einfachen Morgenroutine-Beispiel haben wir sieben Kriterien analysiert. Die daraus gewonnenen Erkenntnisse könnten Ihren Tag erheblich verbessern.

Aber was, wenn Sie nach etwas mehr suchen? Was wäre, wenn Sie ein Modell hätten, das kompliziert genug wäre, um jeden einzelnen signifikanten Parameter (statt nur sieben) zu berücksichtigen?

Sie würden sich nicht mehr nur mit Daten befassen; Sie würden es mit Big Data zu tun haben.
Laut Wikipedia wird Big Data wie folgt definiert:
„Big Data“ bezieht sich auf Datensammlungen, die so umfangreich oder kompliziert sind, dass herkömmliche Datenverarbeitungsprogramme nicht ausreichen, um sie zu verarbeiten. Analysieren, Erfassen, Kurieren von Daten, Suchen, Teilen, Speichern, Transportieren, Visualisieren, Abfragen und Datenschutz sind Herausforderungen. Das Wort spielt normalerweise auf die Verwendung von Predictive Analytics oder anderen fortschrittlichen Ansätzen an, um Wert aus Daten zu extrahieren, und nicht auf eine bestimmte Datensatzgröße.“
Anders ausgedrückt geht es bei Big Data darum, mit großen Datensätzen zu arbeiten und daraus Erkenntnisse zu gewinnen. Herkömmliche Ansätze funktionieren mit diesen Datensätzen nicht, da sie so groß sind. Sie müssen Daten mit richtig konzipierten Verfahren sammeln, analysieren, speichern und verarbeiten.
Im Allgemeinen gilt: Je größer der Datensatz, desto besser die Ergebnisse – solange der Datensatz von akzeptabler Qualität ist.
In einem E-Commerce-Geschäft sammelt die Website beispielsweise eine Reihe von Daten, darunter verweisende Websites, auf der Website verbrachte Zeit, Absprungrate, Zielseite und Besucherfluss. Sie verfolgen diese Informationen von Person zu Person, was bedeutet, dass sie im Laufe einiger Jahre einen großen Datensatz zusammenstellen können, den Standardansätze nicht verarbeiten können. Da merken sie, dass sie mit „Big Data“ arbeiten.
Infolgedessen könnten Sie in unserem morgendlichen Routinebeispiel einen sehr großen Datensatz mit viel mehr Parametern haben, die verarbeitet und ausgewertet werden müssen. Möglicherweise haben Sie Informationen von Zehntausenden oder vielleicht Millionen von Menschen in Ihrer Stadt gesammelt. Möglicherweise haben Sie diese Informationen über einen bestimmten Zeitraum gesammelt und eine Reihe zusätzlicher Aspekte wie Wetter, Tageszeit, Verkehrsmeldungen, Tweets, Haushaltseinkommen usw. dokumentiert, die Sie in Ihrer Studie verwenden könnten.
Ein weiterer Ansatz, um die Größe von Datensätzen zu relativieren, besteht darin, zu berücksichtigen, dass ein Datensatz in Standardgröße so dick wie eine Tageszeitung sein könnte.
Um einen „Big Data“-Datensatz auszudrucken, bräuchte man 50 Lagerhallen voller Telefonbücher.
Herkömmliche Tools und Verfahren reichen beim Umgang mit solch großen Datenmengen nicht aus: Speziell für diesen Zweck erstellte Spezialsoftware ist erforderlich.
ANALYSIERE DAS
Nachdem Sie all diese Informationen über Ihren Morgen gesammelt haben, müssen Sie sie untersuchen und recherchieren, um Ihre Schlussfolgerungen zu ziehen; Dies wird als Datenanalyse bezeichnet. Sie können aus unserem Beispiel extrapolieren, dass das Ansehen von „Saas bhi kabhi bahun thi“ am Montagabend dazu führt, dass Sie am Dienstagmorgen später aufwachen. Wenn Sie alternativ Ihre Wäsche am Samstag statt am Sonntag waschen, können Sie am Dienstag ein zusätzliches gebügeltes Hemd haben.
Aber was wäre, wenn Sie zahlreiche Datensätze nach umfassenderen, komplizierteren Mustern durchsuchen wollten? Dann würden Sie sich mit Datenanalysen beschäftigen.

Die Anwendung einer Reihe von Verfahren (Algorithmen) oder Transformationen zur Gewinnung von Erkenntnissen aus verarbeiteten Datensätzen wird als Datenanalyse bezeichnet.
Das komplizierte Zusammenspiel einzelner Details würden Sie in unserem Morgenroutine-Beispiel untersuchen. Wenn Sie beispielsweise die Tagestemperatur mit der Autonutzung vergleichen, stellen Sie möglicherweise fest, dass die Temperatur einen erheblichen Einfluss auf die Autonutzung hat. Mit ein wenig weiterer Untersuchung werden Sie feststellen, dass dieses einfache Modell nur während der Sommermonate gültig ist. Während der Regenzeit nutzen die Menschen ihr Auto am meisten. Anhand dieser Informationen können Sie sehen, dass der Niederschlag am nächsten Tag voraussichtlich überdurchschnittlich sein wird, was bedeutet, dass der Verkehr stärker sein würde.
Das ist Datenanalyse in Aktion. Bei der Arbeit wird die Datenanalyse verwendet, um zu entscheiden, früher als gewöhnlich zu gehen, da der Verkehr höher sein wird.
FAZIT
Branchenschlagworte wie Analytics, Big Data und Data Science werden häufig und fälschlicherweise synonym verwendet. Die Datenanalyse ist eine der grundlegenden Operationen, die den von Ihnen gesammelten Daten einen Mehrwert verleiht, während die Datenwissenschaft der Bereich ist, in dem Sie tätig sind. Und Sie haben es mit Big Data zu tun, wenn Sie es mit großen Datenmengen zu tun haben, die mit typischen Tools und Methoden nicht verarbeitet werden können.
Wie findet ihr unsere Definition? Ist es das gleiche wie bei dir? Funktionieren die Beispiele einer „Tagesroutine“? Haben Sie ein persönliches Beispiel, das Sie teilen möchten? Bitte teilen Sie Ihre Gedanken im Kommentarbereich mit.