ทำความเข้าใจ Data Science, Data Analytics และ Big Data

เผยแพร่แล้ว: 2022-09-11

วิทยาศาสตร์ข้อมูล การวิเคราะห์ข้อมูล และบิ๊กดาต้า

แค่อีกวัน

การปลุกของคุณจะดังขึ้นเวลา 05.30 น. ในเช้าวันอังคาร คุณแปรงฟันและเปิดน้ำพุร้อน จากนั้น ขณะรอให้เตารีดร้อน คุณตรวจสอบอีเมลแต่ไฟดับ คุณทำด้วยเสื้อรัดรูป เนื่องจากกาแฟและขนมปังปิ้งทำได้ยากหากไม่มีพลังงานสำหรับคู่สมรสของคุณ การปรับเปลี่ยนเมนูตอนเช้าในนาทีสุดท้าย: คอร์นเฟลกและนมเย็น คุณตัดสินใจข้ามโรงยิมและไปอาบน้ำทันที

คุณขึ้นรถและเริ่มเดินทางไปทำงานในเวลา 08:15 น. หลังจากรับประทานอาหารเช้าสั้นๆ และสนทนาอย่างเร่งรีบ ระหว่างทาง คุณเจอการจราจรที่คับคั่งไม่รู้จบโดยไม่มีทางออก การสนทนากับเพื่อนสัญจรเปิดเผยว่ามีขบวนเกิดขึ้น และเลนหนึ่งหยุดลงแล้ว

เมื่อโฆษณาของบ้านหรูหลังใหม่ออกอากาศทางวิทยุโดยสัญญาว่าจะขับรถไปทำงาน 15 นาที คุณสงสัยว่าเกิดอะไรขึ้นกับวันที่ถนนสายนี้ร้างเปล่า จากนั้นคุณจะได้ยินเพลงบอลลีวูดใหม่ที่กำลังมาแรงและเริ่มฮัมเพลงตามไปด้วย

ในที่สุด หลังจากผ่านไปหนึ่งชั่วโมงครึ่งของการจราจรที่คับคั่ง คุณมาถึงที่ทำงานทันเวลาสำหรับการประชุมประจำวัน แต่คุณรู้สึกหงุดหงิดและเหนื่อยล้าจากการเดินทางที่ยาวนาน

อ่านอีกครั้ง: 13 กลยุทธ์ SEO ที่มีประสิทธิภาพที่จะนำไปใช้ในปี 2564

สิ่งที่เป็นอยู่

นี่เป็นวันปกติสำหรับพนักงานออฟฟิศจำนวนมากในอินเดีย พวกเขาลุกขึ้นแต่งตัวและไปทำงาน พวกเขาตัดสินใจไม่กี่ครั้งระหว่างทาง แต่ส่วนใหญ่จะเป็นไปตามกระแส พวกเขามักจะมีปฏิกิริยาและน่าเศร้าที่เกี่ยวข้องกับการผ่านวันไปเท่านั้น

มันไม่จำเป็นต้องเป็นอย่างนั้น

ลองนึกภาพสิ่งนี้

วันนี้เป็นเช้าวันอังคาร และแทนที่จะเป็น 5:30 น. เสียงปลุกจะดังขึ้นตอน 5:10 น. คุณทราบเกี่ยวกับเหตุไฟฟ้าดับที่วางแผนไว้และปรับตารางเวลาของคุณตามนั้น คุณเปิดเตารีดแล้วเปิดน้ำพุร้อนทันทีที่ตื่นนอน ขณะที่คุณกำลังแปรงฟัน คู่สมรสของคุณได้เริ่มทำเฟรนช์โทสต์ในเครื่องปิ้งขนมปังแล้ว คุณจะได้กลิ่นกาแฟร้อน ๆ รอคุณอยู่เมื่อคุณรีดผ้าเสร็จแล้ว

กระแสไฟดับกะทันหันโดยไม่แจ้งให้ทราบ คุณยิ้มขณะเดินออกจากประตูเพื่อวิ่งตอนเช้า

อ่านอีกครั้ง|: วิเคราะห์คู่แข่ง SEO อย่างไร?

คุณมีอาหารเช้าและกาแฟร้อนๆ ที่ยอดเยี่ยมพร้อมการสนทนาที่สนุกสนานหลังจากออกกำลังกายและอาบน้ำ เตรียมตัวให้พร้อมและออกเดินทางประมาณ 08.30 น.

คุณใช้เส้นทางที่ยาวกว่าเล็กน้อยแต่มาถึงที่ทำงานภายใน 40 นาที ทำให้คุณมีเวลาเหลือเฟือก่อนการประชุมประจำวันของคุณ

มีอะไรที่แตกต่าง?

คุณไปกับกระแสในสถานการณ์แรก คุณทำสิ่งต่าง ๆ เพราะมันเป็นธรรมชาติที่สองสำหรับคุณ คุณพอใจกับสภาพที่เป็นอยู่ ก่อนวางแผนวันของคุณ คุณไม่ได้คำนึงถึงตัวแปรมากมาย เช่น ไฟฟ้าดับและการจราจรติดขัดที่ทำให้คุณมาสาย คุณใช้เทคนิคมาตรฐานกับสถานการณ์ที่ไม่ซ้ำแบบใครและผลลัพธ์มาตรฐานที่คาดหวัง

ในสถานการณ์ที่สอง คุณวิเคราะห์ปัจจัยต่างๆ ที่อาจส่งผลต่อกิจวัตรของคุณและปรับตารางเวลาของคุณให้เหมาะสม เนื่องจากคุณทราบเรื่องไฟฟ้าดับ คุณจึงตื่นเร็วกว่าปกติสองสามนาทีเพื่อเปิดน้ำพุร้อนและเตารีด

ยังอ่าน: ปัญญาประดิษฐ์: แนวทางสมัยใหม่

คู่สมรสของคุณเริ่มเครื่องปิ้งขนมปังและเครื่องชงกาแฟล่วงหน้าสองสามนาที จากนั้น หลังจากพิจารณาสภาพการจราจรในวันนั้นแล้ว คุณจึงเลือกใช้เส้นทางอื่น

คุณมีข้อเท็จจริงที่คุณได้ข้อสรุป คุณปรับการกระทำของคุณเป็นผล และผลลัพธ์ก็ดีขึ้นมาก คุณใช้พลังของการวิเคราะห์โดยไม่ได้ตั้งใจ

สวัสดีและยินดีต้อนรับสู่ขอบเขตของวิทยาศาสตร์ข้อมูล

วิทยาศาสตร์ข้อมูลคืออะไร?

วิทยาศาสตร์ข้อมูลหมายถึงการประยุกต์ใช้เครื่องมือและเทคนิคตั้งแต่คณิตศาสตร์ สถิติ คอมพิวเตอร์ และความเชี่ยวชาญด้านโดเมน ไปจนถึงการรวบรวม การประมวลผล การจัดการ และการตีความข้อมูล

data science
วิทยาศาสตร์ข้อมูล

กล่าวอีกนัยหนึ่ง Data Science คือกระบวนการของการใช้ข้อมูลเพื่อแก้ปัญหา ครอบคลุมทุกอย่างตั้งแต่การรวบรวมข้อมูลไปจนถึงการรับข้อมูลเชิงลึกจากข้อมูลที่คุณรวบรวม

การประยุกต์ใช้วิทยาศาสตร์ข้อมูล

มาดูเรื่องราวที่คุณเพิ่งอ่านกัน

ตามสมมุติฐาน คุณหลีกเลี่ยงการทำซ้ำของสถานการณ์ที่ 1 โดยใช้ข้อมูลเชิงลึกที่รวบรวมจากการสอบสวนว่าทำไมตอนเช้าของคุณจึงเร่งรีบ เพื่อที่จะปรับปรุงวันของคุณและทำให้วันเหล่านั้นดีขึ้นและสดใสขึ้น

ในการเริ่มต้น คุณต้องถามตัวเองว่า “ฉันต้องการอะไรเพื่อจะมีวันที่วิเศษ”

ตัวแปรต่อไปนี้มีแนวโน้มที่จะปรากฏในรายการ:

  • ไฟฟ้า
  • การนอนหลับ
  • น้ำร้อน
  • เสื้อผ้า
  • อาหารเช้า
  • การขนส่ง
  • การจราจร

การบรรจบกันของตัวแปรนี้จะกำหนดประเภทของข้อมูลที่คุณจะต้องรวบรวม ประมวลผล ตัด และประเมินเพื่อให้ได้ข้อมูลเชิงลึกเกี่ยวกับวิธีการปรับปรุงกิจวัตรประจำวันของคุณ วิทยาศาสตร์ข้อมูลจะช่วยคุณในการกำหนดอิทธิพลรวมของตัวแปรแต่ละตัว (จุดข้อมูล)

seo-toolsOpens in a new tab.
seo-tools

ข้อมูลหรือ 'ข้อมูลขนาดใหญ่'?

เราวิเคราะห์เกณฑ์เจ็ดข้อในตัวอย่างกิจวัตรตอนเช้าที่เรียบง่ายของเรา ความรู้ที่ได้รับจะทำให้วันของคุณดีขึ้นมาก

แต่ถ้าคุณกำลังมองหาอะไรมากกว่านี้ล่ะ? จะเป็นอย่างไรถ้าคุณมีโมเดลที่ซับซ้อนพอที่จะอธิบายพารามิเตอร์ที่สำคัญทุกตัว (แทนที่จะเป็นเพียง 7 รายการ)

Big Data
ข้อมูลใหญ่

คุณจะไม่เพียงแค่จัดการกับข้อมูลอีกต่อไป คุณจะจัดการกับข้อมูลขนาดใหญ่

ตามวิกิพีเดีย Opens in a new tab. , ข้อมูลขนาดใหญ่ถูกกำหนดดังนี้:

“ข้อมูลขนาดใหญ่” หมายถึงการรวบรวมข้อมูลที่มีขนาดใหญ่หรือซับซ้อนจนโปรแกรมประมวลผลข้อมูลทั่วไปไม่เพียงพอที่จะจัดการได้ วิเคราะห์ รวบรวม จัดการข้อมูล ค้นหา แชร์ จัดเก็บ ขนส่ง การแสดงภาพ การสืบค้น และความเป็นส่วนตัวของข้อมูลล้วนเป็นสิ่งที่ท้าทาย คำนี้มักหมายถึงการใช้การวิเคราะห์เชิงคาดการณ์หรือวิธีการขั้นสูงอื่นๆ เพื่อดึงค่าจากข้อมูล แทนที่จะเป็นขนาดชุดข้อมูลเฉพาะ”

กล่าวอีกนัยหนึ่ง ข้อมูลขนาดใหญ่คือทั้งหมดที่เกี่ยวกับการทำงานกับชุดข้อมูลขนาดใหญ่และดึงข้อมูลเชิงลึกจากชุดข้อมูลเหล่านั้น วิธีการแบบเดิมใช้ไม่ได้กับชุดข้อมูลเหล่านี้เนื่องจากมีขนาดใหญ่มาก คุณจะต้องรวบรวม วิเคราะห์ จัดเก็บ และประมวลผลข้อมูลโดยใช้ขั้นตอนที่ออกแบบมาอย่างเหมาะสม

โดยทั่วไป ยิ่งชุดข้อมูลมีขนาดใหญ่เท่าใด ผลลัพธ์ก็จะยิ่งดีขึ้นเท่านั้น ตราบใดที่ชุดข้อมูลมีคุณภาพที่ยอมรับได้

ตัวอย่างเช่น ในธุรกิจอีคอมเมิร์ซ เว็บไซต์รวบรวมข้อมูลจำนวนหนึ่ง ซึ่งรวมถึงไซต์อ้างอิง เวลาที่ใช้บนไซต์ อัตราตีกลับ หน้า Landing Page และกระแสผู้เข้าชม พวกเขาติดตามข้อมูลนี้เป็นรายบุคคล ซึ่งหมายความว่าในช่วงสองสามปี พวกเขาสามารถรวบรวมชุดข้อมูลขนาดใหญ่ที่วิธีการมาตรฐานจะไม่สามารถจัดการได้ นั่นคือเมื่อพวกเขาตระหนักว่าพวกเขากำลังทำงานกับ 'บิ๊กดาต้า'

ด้วยเหตุนี้ ในตัวอย่างกิจวัตรตอนเช้าของเรา คุณอาจมีชุดข้อมูลขนาดใหญ่มากพร้อมพารามิเตอร์อีกมากมายในการประมวลผลและประเมินผล คุณอาจรวบรวมข้อมูลจากผู้คนหลายหมื่นหรืออาจเป็นล้านคนในเมืองของคุณ คุณอาจรวบรวมข้อมูลนี้ในช่วงระยะเวลาหนึ่งและได้บันทึกแง่มุมเพิ่มเติมหลายประการ เช่น สภาพอากาศ ช่วงเวลาของวัน ข้อมูลอัปเดตการจราจร ทวีต รายได้ครัวเรือน และอื่นๆ ที่คุณสามารถใช้ในการศึกษาของคุณ

อีกวิธีหนึ่งในการวางขนาดของชุดข้อมูลในมุมมองคือการพิจารณาว่าชุดข้อมูลขนาดมาตรฐานอาจมีความหนาเท่ากับหนังสือพิมพ์รายวัน

คุณต้องมีคลังสินค้า 50 แห่งที่เต็มไปด้วยไดเรกทอรีโทรศัพท์เพื่อพิมพ์ชุดข้อมูล 'ข้อมูลขนาดใหญ่'

เครื่องมือและขั้นตอนแบบดั้งเดิมไม่เพียงพอเมื่อต้องจัดการกับข้อมูลจำนวนมาก: จำเป็นต้องใช้ซอฟต์แวร์เฉพาะทางที่สร้างขึ้นเพื่อจุดประสงค์นี้โดยเฉพาะ

วิเคราะห์สิ่งนี้

หลังจากที่คุณรวบรวมข้อมูลทั้งหมดเกี่ยวกับช่วงเช้าของคุณแล้ว คุณจะต้องตรวจสอบและค้นคว้าเพื่อสร้างข้อสรุปของคุณ นี้เรียกว่าการวิเคราะห์ข้อมูล คุณสามารถอนุมานได้จากตัวอย่างของเราว่าการดู 'Saas bhi kabhi bahun thi' ในคืนวันจันทร์ทำให้คุณตื่นสายในเช้าวันอังคาร อีกทางหนึ่ง การซักผ้าในวันเสาร์แทนที่จะเป็นวันอาทิตย์ จะทำให้คุณมีเสื้อรีดเพิ่มในวันอังคาร

แต่ถ้าคุณต้องการค้นหาชุดข้อมูลจำนวนมากสำหรับรูปแบบที่ซับซ้อนและครอบคลุมมากขึ้นล่ะ แล้วคุณจะมีส่วนร่วมในการวิเคราะห์ข้อมูล

Data Analytics
การวิเคราะห์ข้อมูล
 การประยุกต์ใช้ชุดของขั้นตอน (อัลกอริทึม) หรือการแปลงเพื่อให้ได้ข้อมูลเชิงลึกจากชุดข้อมูลที่ประมวลผลเรียกว่าการวิเคราะห์ข้อมูล

คุณจะตรวจสอบการทำงานร่วมกันที่ซับซ้อนของรายละเอียดเฉพาะในตัวอย่างกิจวัตรตอนเช้าของเรา ตัวอย่างเช่น หากคุณเปรียบเทียบอุณหภูมิรายวันกับการใช้รถยนต์ คุณอาจพบว่าอุณหภูมิมีผลกระทบอย่างมากต่อการใช้งานรถยนต์ ด้วยการตรวจสอบเพิ่มเติมเล็กน้อย คุณจะได้เรียนรู้ว่าแบบจำลองง่ายๆ นี้ใช้ได้เฉพาะในช่วงฤดูร้อนเท่านั้น ในช่วงฤดูฝน ผู้คนใช้รถกันมากที่สุด ด้วยข้อมูลนี้ คุณจะเห็นได้ว่าคาดว่าปริมาณน้ำฝนในวันถัดไปจะมากกว่าค่าเฉลี่ย ซึ่งหมายความว่าการจราจรจะหนาแน่นขึ้น

นั่นคือการวิเคราะห์ข้อมูลในการดำเนินการ ในที่ทำงาน การวิเคราะห์ข้อมูลถูกใช้เพื่อตัดสินใจออกเร็วกว่าปกติเนื่องจากปริมาณการใช้ข้อมูลจะสูงขึ้น

บทสรุป

คำศัพท์ของอุตสาหกรรม เช่น การวิเคราะห์ ข้อมูลขนาดใหญ่ และวิทยาศาสตร์ข้อมูล มักใช้แทนกันได้อย่างไม่ถูกต้อง การวิเคราะห์ข้อมูลเป็นหนึ่งในการดำเนินการพื้นฐานที่เพิ่มมูลค่าให้กับข้อมูลที่คุณรวบรวม ในขณะที่วิทยาศาสตร์ข้อมูลเป็นโดเมนที่คุณจะดำเนินการ และคุณกำลังจัดการกับข้อมูลขนาดใหญ่เมื่อคุณจัดการกับข้อมูลจำนวนมากที่ไม่สามารถประมวลผลโดยใช้เครื่องมือและวิธีการทั่วไป

คุณรู้สึกอย่างไรกับคำจำกัดความของเรา? มันเหมือนกับของคุณหรือเปล่า? ตัวอย่างของ “กิจวัตรประจำวัน” ได้ผลหรือไม่? คุณมีตัวอย่างส่วนตัวที่คุณต้องการแบ่งปันหรือไม่? กรุณาแบ่งปันความคิดของคุณในพื้นที่แสดงความคิดเห็น