فهم علوم البيانات وتحليلات البيانات والبيانات الضخمة
نشرت: 2022-09-11علم البيانات وتحليلات البيانات والبيانات الضخمة
مجرد يوم اخر
ينطلق المنبه في الساعة 5:30 صباحًا يوم الثلاثاء. أنت تغسل أسنانك وتشغل السخان الخاص بك. ثم ، أثناء انتظار تسخين المكواة ، تتحقق من رسائل البريد الإلكتروني الخاصة بك ، لكن الكهرباء تنقطع. أنت تكتفي بقميص مضغوط. نظرًا لأنه من الصعب صنع القهوة والخبز المحمص بدون طاقة لشريكك ، تغيير آخر في قائمة الطعام الصباحية: رقائق الذرة والحليب البارد. قررت تخطي صالة الألعاب الرياضية والذهاب مباشرة إلى الحمام.
تدخل سيارتك وتبدأ رحلة العمل في تمام الساعة 8:15 صباحًا ، بعد وجبة فطور قصيرة ومحادثة متسرعة. في الطريق ، ستواجه ازدحامًا مروريًا لا ينتهي بلا مخرج. تكشف محادثة مع زميل ركاب أن هناك موكبًا يجري ، وأن أحد الممرات قد تم إيقافه.
عندما يبث إعلان تجاري آخر لمنزل فخم جديد على الراديو ، واعدًا بمدة 15 دقيقة بالسيارة إلى العمل ، تتساءل عما حدث في الأيام التي كان فيها هذا الطريق مهجورًا. ثم تسمع أغنية بوليوود جديدة ساخنة وتبدأ بالطنين.
أخيرًا ، بعد ساعة ونصف من حركة المرور المؤلمة ، تصل إلى العمل في الوقت المناسب تمامًا للاجتماع اليومي ، لكنك محبط ومرهق من التنقل الطويل.
اقرأ أيضًا: 13 إستراتيجية فعالة لتحسين محركات البحث سيتم تنفيذها في عام 2021
الطريق هي الأشياء
هذا يوم عادي في الهند للعديد من العاملين في المكاتب. يستيقظون ، يرتدون ملابسهم ويتوجهون إلى العمل. يتخذون بعض القرارات على طول الطريق ، لكنهم في الغالب يتماشون مع التدفق. هم عادة ما يكونون رد فعل ، وللأسف ، لا يهتمون إلا بالمرور طوال اليوم.
ومع ذلك ، لا يجب أن يكون الأمر كذلك.
تخيل هذا
إنه صباح الثلاثاء ، وبدلاً من الساعة 5:30 صباحًا ، ينطلق المنبه في الساعة 5:10 صباحًا. علمت بانقطاع التيار الكهربائي المخطط له وعدلت جدولك وفقًا لذلك. تقوم بتشغيل المكواة ثم السخان بمجرد استيقاظك. أثناء تنظيف أسنانك بالفرشاة ، بدأت زوجتك بالفعل في صنع الخبز المحمص الفرنسي في المحمصة. يمكنك شم رائحة فنجان القهوة الساخن في انتظارك عندما تنتهي من كي قميصك.
التيار يغلق فجأة دون سابق إنذار. تبتسم وأنت تخرج من الباب لجري الصباح.
اقرأ أيضًا |: كيف تقوم بتحليل منافس تحسين محركات البحث؟
لديك فطور رائع وساخن مع قهوة مع بعض المناقشات المسلية بعد التمرين والاستحمام. ثم تستعد وتغادر حوالي الساعة 8:30 صباحًا
تأخذ طريقًا أطول قليلاً ولكنك تصل إلى العمل في أقل من 40 دقيقة ، مما يمنحك متسعًا من الوقت قبل اجتماعك اليومي.
ما هو المختلف؟
ذهبت مع التدفق في السيناريو الأول. لقد فعلت أشياء لأنها كانت طبيعة ثانية بالنسبة لك. كنت راضيا عن الوضع الراهن. قبل التخطيط ليومك ، فشلت في حساب العديد من المتغيرات مثل انقطاع التيار الكهربائي وازدحام المرور الذي تسبب في تأخرك. لقد استخدمت أسلوبًا قياسيًا لسيناريو فريد من نوعه والنتائج القياسية المتوقعة.
في السيناريو الثاني ، قمت بتحليل العوامل المختلفة التي قد يكون لها تأثير على روتينك وقمت بتعديل جدولك الزمني وفقًا لذلك. نظرًا لأنك كنت على علم بانقطاع التيار الكهربائي ، فقد استيقظت قبل بضع دقائق من المعتاد لتشغيل السخان والحديد.
اقرأ أيضًا: الذكاء الاصطناعي: نهج حديث.
بدأ زوجك أيضًا في تشغيل محمصة وآلة القهوة قبل دقائق قليلة من الموعد. بعد ذلك ، بعد مراعاة ظروف حركة المرور لهذا اليوم ، اخترت أن تسلك طريقًا مختلفًا.
لديك حقائق استخلصت منها النتائج. لقد قمت بتعديل أفعالك كنتيجة لذلك ، وكانت النتيجة أفضل بكثير. لقد استخدمت قوة التحليلات ، ولكن عن غير قصد.
مرحبًا بكم ومرحبًا بكم في عالم علوم البيانات.
ما هو علم البيانات؟
يشير علم البيانات إلى تطبيق الأدوات والتقنيات من الرياضيات والإحصاء وأجهزة الكمبيوتر وخبرة المجال إلى جمع البيانات ومعالجتها ومعالجتها وتفسيرها.

بعبارة أخرى ، علم البيانات هو عملية استخدام البيانات لحل المشكلات. يغطي كل شيء من جمع البيانات إلى اكتساب رؤى من المعلومات التي جمعتها.
تطبيق علوم البيانات
دعنا نلقي نظرة على السرد الذي قرأته للتو.
افتراضيًا ، لقد تجنبت تكرار السيناريو 1 من خلال الاستفادة من الرؤى التي تم جمعها من تحقيق حول سبب استعجال الصباح ، من أجل تبسيط أيامك وجعلها أفضل وأكثر إشراقًا.
للبدء ، يجب أن تسأل نفسك ، "ما الذي أطلبه لأتمتع بيوم رائع؟"
من المحتمل أن تظهر المتغيرات التالية في القائمة:
- كهرباء
- ينام
- الماء الساخن
- ملابس
- إفطار
- وسائل النقل
- حركة المرور
هذا التقاء المتغيرات يحدد نوع البيانات التي ستحتاج إلى جمعها ومعالجتها وتقليمها وتقييمها من أجل الحصول على نظرة ثاقبة حول كيفية تحسين روتينك اليومي. سيساعدك علم البيانات في تحديد التأثير المشترك لكل متغير (نقطة بيانات).



بيانات أم "بيانات كبيرة"؟
قمنا بتحليل سبعة معايير في مثالنا الروتيني الصباحي البسيط. يمكن للمعرفة المكتسبة نتيجة لذلك أن تجعل يومك أفضل كثيرًا.
لكن ماذا لو كنت تبحث عن شيء أكثر؟ ماذا لو كان لديك نموذج معقد بما يكفي لحساب كل معلمة مهمة واحدة (بدلاً من سبعة فقط)؟

لن تتعامل مع البيانات فقط بعد الآن ؛ كنت تتعامل مع البيانات الضخمة.
بحسب ويكيبيديا ، يتم تعريف البيانات الضخمة على النحو التالي:
تشير "البيانات الضخمة" إلى مجموعات البيانات الضخمة أو المعقدة بحيث لا تكفي برامج معالجة البيانات النموذجية للتعامل معها. يعد التحليل والتقاط وتنظيم البيانات والبحث والمشاركة والتخزين والنقل والتصور والاستعلام وخصوصية المعلومات كلها تحديات. تشير الكلمة عادةً إلى استخدام التحليلات التنبؤية أو الأساليب المتقدمة الأخرى لاستخراج قيمة من البيانات ، بدلاً من حجم مجموعة بيانات محدد ".
بعبارة أخرى ، تتعلق البيانات الضخمة بالعمل مع مجموعات البيانات الكبيرة واستخراج الأفكار منها. لا تعمل الأساليب التقليدية مع مجموعات البيانات هذه لأنها كبيرة جدًا. ستحتاج إلى جمع البيانات وتحليلها وتخزينها ومعالجتها باستخدام إجراءات مصممة بشكل صحيح.
بشكل عام ، كلما كانت مجموعة البيانات أكبر ، كانت النتائج أفضل - طالما أن مجموعة البيانات ذات جودة مقبولة.
في مجال التجارة الإلكترونية ، على سبيل المثال ، يجمع موقع الويب عددًا كبيرًا من البيانات ، بما في ذلك مواقع الإحالة ، والوقت الذي يقضيه في الموقع ، ومعدل الارتداد ، والصفحة المقصودة ، وتدفق الزوار. إنهم يتتبعون هذه المعلومات على أساس كل شخص على حدة ، مما يعني أنه على مدار بضع سنوات ، سيكونون قادرين على تجميع مجموعة بيانات كبيرة لن تتمكن الأساليب القياسية من التعامل معها. هذا عندما أدركوا أنهم يعملون مع "البيانات الضخمة".
نتيجة لذلك ، في مثالنا الروتيني الصباحي ، يمكن أن يكون لديك مجموعة بيانات كبيرة جدًا تحتوي على الكثير من المعلمات للمعالجة والتقييم. ربما تكون قد جمعت معلومات من عشرات الآلاف أو ربما ملايين الأشخاص في مدينتك. ربما تكون قد جمعت هذه المعلومات على مدار فترة زمنية ووثقت عددًا من الجوانب الإضافية ، مثل الطقس والوقت من اليوم وتحديثات حركة المرور والتغريدات ودخل الأسرة وما إلى ذلك ، والتي يمكنك استخدامها في دراستك.
هناك طريقة أخرى لوضع حجم مجموعات البيانات في منظورها الصحيح وهي اعتبار أن مجموعة البيانات ذات الحجم القياسي يمكن أن تكون بحجم صحيفة يومية.
ستحتاج إلى 50 مستودعًا مليئًا بأدلة الهاتف لطباعة مجموعة بيانات "البيانات الضخمة".
لن تكفي الأدوات والإجراءات التقليدية عند التعامل مع مثل هذه الكميات الكبيرة من البيانات: فالبرمجيات المتخصصة التي تم إنشاؤها خصيصًا لهذا الغرض مطلوبة.
حلل هذا
بعد أن جمعت كل هذه المعلومات عن صباحك ، ستحتاج إلى التحقيق والبحث فيها من أجل تكوين استنتاجاتك ؛ يُعرف هذا باسم تحليل البيانات. يمكنك أن تستنبط من مثالنا أن مشاهدة "Saas bhi kabhi bahun thi" ليلة الاثنين تجعلك تستيقظ في وقت لاحق من صباح يوم الثلاثاء. بدلاً من ذلك ، سيسمح لك غسل الملابس يوم السبت بدلاً من الأحد بالحصول على قميص مكي إضافي يوم الثلاثاء.
ولكن ماذا لو أردت البحث في مجموعات بيانات عديدة عن أنماط أكثر شمولاً وتعقيدًا؟ ثم ستنخرط في تحليلات البيانات.

يُعرف تطبيق سلسلة من الإجراءات (الخوارزميات) أو التحويلات لاستخلاص رؤى من مجموعات البيانات المعالجة باسم تحليلات البيانات.
ستفحص التفاعل المعقد لتفاصيل محددة في مثالنا الصباحي الروتيني. على سبيل المثال ، إذا قارنت درجة الحرارة اليومية باستخدام السيارة ، فقد تجد أن درجة الحرارة لها تأثير كبير على استخدام السيارة. مع مزيد من الاستقصاء ، ستتعلم أن هذا النموذج البسيط صالح فقط خلال أشهر الصيف. خلال موسم الأمطار ، يستخدم الناس سياراتهم أكثر من غيرهم. باستخدام هذه المعلومات ، يمكنك أن ترى أنه من المتوقع أن يكون هطول الأمطار في اليوم التالي أكثر من المتوسط ، مما يعني أن حركة المرور ستكون أكثر كثافة.
هذه هي تحليلات البيانات في العمل. في العمل ، تُستخدم تحليلات البيانات لاتخاذ قرار بالمغادرة في وقت أقرب من المعتاد لأن حركة المرور ستكون أعلى.
استنتاج
غالبًا ما يتم استخدام الكلمات الرنانة في الصناعة مثل التحليلات والبيانات الضخمة وعلوم البيانات بشكل تبادلي. يعد تحليل البيانات إحدى العمليات الأساسية التي تضيف قيمة إلى البيانات التي تجمعها ، في حين أن علم البيانات هو المجال الذي ستعمل فيه. وأنت تتعامل مع البيانات الضخمة عندما تتعامل مع كميات كبيرة من البيانات التي لا يمكن معالجتها باستخدام أدوات وأساليب نموذجية.
ما هو شعورك حيال تعريفنا؟ هل هو نفس ملكك؟ هل تعمل أمثلة "الروتين اليومي"؟ هل لديك مثال شخصي تود مشاركته؟ يرجى مشاركة أفكارك في منطقة التعليقات.