มาสู่ข้อสรุปที่ถูกต้องด้วยการวิเคราะห์เชิงอนุมาน

เผยแพร่แล้ว: 2020-03-23

เราทุกคนต่างมีความผิดในการด่วนสรุปเป็นระยะๆ

ไม่ว่าจะเป็นการโน้มน้าวตัวเองว่าจะไม่มีใครซื้อตั๋วสำหรับการประชุมที่คุณทำงานหนักเพื่อวางแผน หรือมาถึงสนามบินล่วงหน้าสองชั่วโมงก็ไม่มีเวลาเพียงพอ เราทุกคนก็ทำเสร็จแล้ว

นอกชีวิตประจำวันของเรา เป็นเรื่องง่ายที่จะข้ามไปยังข้อสรุปที่ไม่ถูกต้องในที่ทำงาน ไม่ว่าจะเป็นอุตสาหกรรมใดก็ตาม เมื่อเราทำเช่นนี้ เรากำลังสรุปโดยทั่วไป แต่ถ้าคุณสามารถสร้างลักษณะทั่วไปเหล่านี้ได้แม่นยำยิ่งขึ้นล่ะ เป็นไปได้เมื่อคุณเรียกใช้การทดสอบการวิเคราะห์เชิงอนุมาน

เมื่อเจาะลึกลงไปในการวิเคราะห์ทางสถิติ บ่อยครั้งที่ขนาดของประชากรที่เราต้องการจะวิเคราะห์นั้นใหญ่เกินไป ทำให้ไม่สามารถศึกษาทุกคนได้ ในกรณีเหล่านี้ ข้อมูลจะถูกเก็บรวบรวมโดยใช้ตัวอย่างสุ่มของบุคคลภายในกลุ่มประชากรเฉพาะ จากนั้นจึงใช้การวิเคราะห์เชิงอนุมานกับข้อมูลเพื่อหาข้อสรุปเกี่ยวกับประชากรโดยรวม

เนื่องจากมักเป็นไปไม่ได้ที่จะวัดจำนวนประชากรทั้งหมด การวิเคราะห์เชิงอนุมานจึงอาศัยการรวบรวมข้อมูลจากกลุ่มตัวอย่างของบุคคลภายในประชากร โดยพื้นฐานแล้ว การวิเคราะห์เชิงอนุมานจะใช้เพื่อพยายาม อนุมาน จากตัวอย่างข้อมูลที่ประชากรอาจคิดหรือแสดง

มีสองวิธีหลักในการดำเนินการนี้:

  1. การประมาณค่าพารามิเตอร์: นำสถิติจากตัวอย่างข้อมูล (เช่น ค่าเฉลี่ยตัวอย่าง) มาใช้สรุปข้อมูลบางอย่างเกี่ยวกับประชากร (ค่าเฉลี่ยประชากร)
  2. การทดสอบสมมติฐาน: การใช้ตัวอย่างข้อมูลเพื่อตอบคำถามการวิจัยที่เฉพาะเจาะจง

ในการประมาณค่าพารามิเตอร์ กลุ่มตัวอย่างใช้เพื่อประมาณค่าที่อธิบายประชากรทั้งหมด นอกเหนือจากช่วงความเชื่อมั่น จากนั้น ค่าประมาณจะถูกสร้างขึ้น

ในการทดสอบสมมติฐาน ข้อมูลจะถูกใช้เพื่อระบุว่ามีความแข็งแกร่งเพียงพอที่จะสนับสนุนหรือปฏิเสธสมมติฐานหรือไม่

การวิเคราะห์เชิงพรรณนากับการวิเคราะห์เชิงอนุมาน

การวิเคราะห์ทางสถิติสองประเภทหลักที่ผู้คนใช้บ่อยที่สุดคือการวิเคราะห์เชิงพรรณนาและการวิเคราะห์เชิงอนุมาน ด้วยเหตุนี้ จึงไม่ใช่เรื่องแปลกที่ทั้งสองจะสับสนกัน แม้ว่าพวกเขาจะให้ข้อมูลเชิงลึกที่แตกต่างกันในข้อมูลที่รวบรวมมาแก่นักวิเคราะห์ข้อมูล

แม้ว่าจะไม่สามารถแสดงภาพรวมทั้งหมดได้ แต่เมื่อใช้งานร่วมกัน จะมอบเครื่องมือที่มีประสิทธิภาพในการแสดงข้อมูลเป็นภาพและการวิเคราะห์การคาดการณ์ เนื่องจากต้องใช้ชุดข้อมูลชุดเดียวกัน

การวิเคราะห์ทางสถิติเชิงพรรณนา ให้ข้อมูลที่อธิบายข้อมูลในทางใดทางหนึ่ง บางครั้งใช้แผนภูมิและกราฟที่สร้างด้วยซอฟต์แวร์การแสดงข้อมูลเพื่ออธิบายสิ่งที่ข้อมูลนำเสนอ วิธีการวิเคราะห์ทางสถิตินี้ไม่ได้ใช้เพื่อสรุปผล เพียงเพื่อสรุปข้อมูลเท่านั้น

การวิเคราะห์ทางสถิติเชิงอนุมาน เป็นวิธีการที่จะใช้ในการสรุปผล อนุญาตให้ผู้ใช้อนุมานหรือสรุปแนวโน้มเกี่ยวกับประชากรจำนวนมากขึ้นตามตัวอย่างที่วิเคราะห์ โดยพื้นฐานแล้วจะใช้ข้อมูลจากกลุ่มตัวอย่างแล้วทำการสรุปเกี่ยวกับประชากรหรือกลุ่มที่ใหญ่ขึ้น

การวิเคราะห์ทางสถิติประเภทนี้มักใช้เพื่อศึกษาความสัมพันธ์ระหว่างตัวแปรภายในกลุ่มตัวอย่าง เพื่อให้สามารถสรุปและสรุปข้อมูลที่แสดงถึงประชากรได้อย่างแม่นยำ และต่างจากการวิเคราะห์เชิงพรรณนา ธุรกิจสามารถทดสอบสมมติฐานและได้ข้อสรุปต่างๆ จากข้อมูลนี้

การวิเคราะห์เชิงพรรณนาเทียบกับการวิเคราะห์เชิงอนุมาน

ลองคิดแบบนี้ คุณอยู่ที่การแข่งขันเบสบอลและถามแฟน ๆ 100 ตัวอย่างว่าพวกเขาชอบฮอทดอกหรือไม่ คุณสามารถสร้างกราฟแท่งของคำตอบใช่หรือไม่ใช่ ซึ่งจะเป็นการวิเคราะห์เชิงพรรณนา หรือคุณอาจใช้งานวิจัยของคุณเพื่อสรุปว่า 93% ของประชากร (แฟนเบสบอลทุกคนในสนามเบสบอลทั้งหมด) ชอบฮอทดอก ซึ่งจะเป็นการวิเคราะห์เชิงอนุมาน

ประเภทของการทดสอบการวิเคราะห์เชิงอนุมาน

มีการทดสอบการวิเคราะห์เชิงอนุมานหลายประเภทที่อยู่ในฟิลด์สถิติ ข้อใดที่คุณเลือกใช้จะขึ้นอยู่กับขนาดกลุ่มตัวอย่าง สมมติฐานที่คุณกำลังพยายามแก้ และขนาดของประชากรที่กำลังทดสอบ

การวิเคราะห์การถดถอยเชิงเส้น

การวิเคราะห์การถดถอยเชิงเส้นใช้เพื่อทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรสองตัว (X และ Y) ในชุดข้อมูลเพื่อเป็นการประมาณค่าตัวแปรที่ไม่รู้จักเพื่อคาดการณ์เหตุการณ์และเป้าหมายในอนาคต

วัตถุประสงค์หลักของการวิเคราะห์การถดถอยคือการประมาณค่าของตัวแปรสุ่ม (Z) ตามค่าของตัวแปรที่ทราบ (หรือคงที่) (X และ Y) โดยทั่วไปจะแสดงด้วยแผนภาพแบบกระจาย ดังตัวอย่างด้านล่าง

การวิเคราะห์การถดถอยเชิงเส้น

ข้อได้เปรียบที่สำคัญอย่างหนึ่งของการใช้การถดถอยในการวิเคราะห์ของคุณคือ ให้ข้อมูลโดยละเอียดและรวมถึงสมการที่สามารถใช้สำหรับการวิเคราะห์เชิงคาดการณ์และเพิ่มประสิทธิภาพข้อมูลในอนาคต

สูตรสำหรับการวิเคราะห์การถดถอยคือ:

Y = a + b(x)

A → หมายถึงจุดตัด y ค่าของ y เมื่อ x = 0

B → หมายถึงความชันหรือขึ้นเหนือการวิ่ง

การวิเคราะห์สหสัมพันธ์

การทดสอบการวิเคราะห์เชิงอนุมานอีกแบบหนึ่งคือการวิเคราะห์สหสัมพันธ์ ซึ่งใช้เพื่อทำความเข้าใจขอบเขตที่ตัวแปรสองตัวพึ่งพากันและกัน การวิเคราะห์นี้จะทดสอบความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรสองตัว และความสัมพันธ์ของตัวแปรทั้งสองนั้นแข็งแกร่งหรืออ่อนแอ

ความสัมพันธ์ระหว่างสองตัวแปรอาจเป็นค่าลบหรือค่าบวกก็ได้ ขึ้นอยู่กับตัวแปร ตัวแปรจะถือว่า "ไม่สัมพันธ์กัน" เมื่อการเปลี่ยนแปลงในตัวแปรหนึ่งไม่ส่งผลต่ออีกตัวแปรหนึ่ง

ตัวอย่างนี้จะเป็นราคาและอุปสงค์ เนื่องจากความต้องการที่เพิ่มขึ้นทำให้ราคาเพิ่มขึ้นตามไปด้วย ราคาจะเพิ่มขึ้นเพราะผู้บริโภคต้องการบางสิ่งบางอย่างมากขึ้นและเต็มใจที่จะจ่ายมากขึ้น

โดยรวมแล้ว วัตถุประสงค์ของการวิเคราะห์สหสัมพันธ์คือการหาค่าตัวเลขที่แสดงความสัมพันธ์ระหว่างตัวแปรทั้งสองและวิธีที่พวกมันเคลื่อนที่ไปด้วยกัน เช่นเดียวกับการถดถอย โดยทั่วไปจะทำโดยใช้ซอฟต์แวร์การแสดงข้อมูลเพื่อสร้างกราฟ

การวิเคราะห์สหสัมพันธ์

ที่เกี่ยวข้อง: เรียนรู้เพิ่มเติมเกี่ยวกับความสัมพันธ์ที่ลึกซึ้งกับการถดถอย รวมถึงความแตกต่างและวิธีการที่ธุรกิจของคุณควรใช้

การวิเคราะห์ความแปรปรวน

วิธีทางสถิติการวิเคราะห์ความแปรปรวน (ANOVA) ใช้เพื่อทดสอบและวิเคราะห์ความแตกต่างระหว่างสอง วิธี หรือมากกว่าจากชุดข้อมูล ทำได้โดยการตรวจสอบปริมาณความแปรผันระหว่างตัวอย่าง

ในแง่ที่ง่ายที่สุด ANOVA ให้การทดสอบทางสถิติว่าค่าเฉลี่ยประชากรสองค่าเท่ากันหรือไม่ นอกเหนือจากการสรุปการทดสอบ t ระหว่างสองวิธี

เรียนรู้เพิ่มเติม: การทดสอบ t ใช้เพื่อแสดงว่าความแตกต่างระหว่างสองกลุ่มมีความสำคัญเพียงใด โดยพื้นฐานแล้ว จะช่วยให้เข้าใจว่าความแตกต่าง (วัดด้วยค่าเฉลี่ย/ค่าเฉลี่ย) อาจเกิดขึ้นโดยบังเอิญหรือไม่

วิธีนี้จะอนุญาตให้ทดสอบกลุ่มเพื่อดูว่ามีความแตกต่างระหว่างพวกเขาหรือไม่ ตัวอย่างเช่น คุณอาจทดสอบนักเรียนในโรงเรียนมัธยมศึกษาตอนปลายสองแห่งที่แตกต่างกันซึ่งทำข้อสอบเดียวกันเพื่อดูว่าโรงเรียนมัธยมแห่งหนึ่งมีคะแนนสูงกว่าที่อื่นหรือไม่

ANOVA สามารถแบ่งออกเป็นสองประเภท:

  • ทางเดียว: ตัวแปรอิสระเพียงตัวเดียวที่มีสองระดับ ตัวอย่างจะเป็นยี่ห้อของเนยถั่ว
  • สองทาง: ตัวแปรอิสระสองตัวที่สามารถมีหลายระดับได้ ตัวอย่างจะเป็นยี่ห้อของเนยถั่วและแคลอรี่

ระดับเป็นเพียงกลุ่มต่างๆ ภายในตัวแปร จากตัวอย่างเดียวกันกับข้างต้น ระดับของเนยถั่วอาจเป็นยี่ห้อ Jif, Skippy หรือ Peter Pan ระดับแคลอรี่อาจเป็นแบบเรียบ แบบครีม หรือแบบออร์แกนิก

การวิเคราะห์ความแปรปรวนร่วม

การวิเคราะห์ความแปรปรวนร่วม (ANCOVA) เป็นการผสมผสานระหว่างการวิเคราะห์ความแปรปรวน (ANOVA) และการถดถอยที่ไม่เหมือนใคร ANCOVA สามารถแสดงข้อมูลเพิ่มเติมว่ามีอะไรบ้างเมื่อพิจารณาตัวแปรหรือปัจจัยอิสระหนึ่งตัวในแต่ละครั้ง โดยไม่กระทบต่อผู้อื่น

มักใช้:

  • สำหรับการขยายการถดถอยพหุคูณเพื่อเปรียบเทียบเส้นถดถอยหลายเส้น
  • เพื่อควบคุม covariates (ตัวแปรอื่นๆ) ที่ไม่ใช่จุดสนใจหลักของการศึกษาของคุณ
  • สำหรับการขยายการวิเคราะห์ความแปรปรวน
  • เพื่อศึกษาชุดค่าผสมของตัวแปรอื่นๆ ที่น่าสนใจ
  • เพื่อควบคุมปัจจัยที่ไม่สามารถสุ่มได้ แต่วัดได้

ANCOVA ยังสามารถใช้เพื่อทดสอบก่อนหรือหลังการทดสอบ เมื่อการถดถอยไปยังค่าเฉลี่ยจะส่งผลต่อการวัดสถิติหลังการทดสอบของคุณ

ตัวอย่างเช่น สมมติว่าธุรกิจของคุณสร้างเภสัชภัณฑ์ใหม่ๆ ให้กับประชาชนซึ่งช่วยลดความดันโลหิตได้ คุณอาจทำการศึกษาที่เฝ้าติดตามกลุ่มการรักษาสี่กลุ่มและกลุ่มควบคุมหนึ่งกลุ่ม

หากคุณใช้ ANOVA คุณจะสามารถบอกได้ว่าการรักษานั้นช่วยลดความดันโลหิตได้จริงหรือไม่ เมื่อคุณรวม ANCOVA คุณสามารถควบคุมปัจจัยอื่นๆ ที่อาจส่งผลต่อผลลัพธ์ เช่น ชีวิตครอบครัว อาชีพ หรือการใช้ยาที่ต้องสั่งโดยแพทย์อื่นๆ

ช่วงความเชื่อมั่น

ช่วงความเชื่อมั่นเป็นเครื่องมือที่ใช้ในการวิเคราะห์เชิงอนุมานที่ประมาณค่าพารามิเตอร์ ซึ่งมักจะเป็นค่าเฉลี่ยของประชากรทั้งหมด โดยพื้นฐานแล้ว มันคือความไม่แน่นอนที่มีกับสถิติเฉพาะใดๆ และมักใช้กับส่วนต่างของข้อผิดพลาด

ช่วงความเชื่อมั่นจะแสดงด้วยตัวเลขที่สะท้อนว่าคุณมั่นใจแค่ไหนว่าผลลัพธ์ของการสำรวจหรือการสำรวจนั้นเป็นสิ่งที่คุณคาดหวังหากสามารถสำรวจประชากรทั้งหมดได้

ตัวอย่างเช่น หากผลลัพธ์ของโพลหรือแบบสำรวจมีช่วงความเชื่อมั่น 98% ค่านี้จะกำหนดช่วงของค่าที่คุณสามารถระบุได้ 98% ว่ามีค่าเฉลี่ยประชากร ในการสรุปนี้ จำเป็นต้องมีข้อมูลสามส่วน:

  1. ระดับความเชื่อมั่น : อธิบายความไม่แน่นอนที่เกี่ยวข้องกับวิธีการสุ่มตัวอย่าง
  2. สถิติ: ข้อมูลที่รวบรวมจากการสำรวจหรือโพล
  3. Margin of error : ผลลัพธ์ของคุณจะแตกต่างจากมูลค่าประชากรจริงกี่เปอร์เซ็นต์

การทดสอบไคสแควร์

การทดสอบไคสแควร์ หรือที่เรียกว่าการทดสอบ x2 ใช้เพื่อระบุความแตกต่างระหว่างกลุ่มเมื่อตัวแปรทั้งหมดเป็นค่าที่ระบุ (เรียกอีกอย่างว่าตัวแปรที่มีค่าที่ไม่มีค่าตัวเลข) เช่น เพศ ช่องว่างเงินเดือน ความเกี่ยวพันทางการเมือง และอื่นๆ

การทดสอบเหล่านี้มักใช้กับตารางฉุกเฉินเฉพาะที่จัดกลุ่มการสังเกตตามลักษณะทั่วไป

คำถามที่การทดสอบไคสแควร์สามารถตอบได้อาจเป็น:

  • ระดับการศึกษาและสถานภาพการสมรสเกี่ยวข้องกับทุกคนในสหรัฐอเมริกาหรือไม่?
  • มีความสัมพันธ์ระหว่างเจตนาของผู้มีสิทธิเลือกตั้งกับการเป็นสมาชิกพรรคการเมืองหรือไม่?
  • เพศมีผลต่อวันหยุดที่ผู้คนชื่นชอบหรือไม่?

โดยปกติ การทดสอบเหล่านี้จะทำโดยใช้วิธีการวิเคราะห์ทางสถิติที่เรียกว่าการสุ่มตัวอย่างอย่างง่าย เพื่อรวบรวมข้อมูลจากกลุ่มตัวอย่างเฉพาะเพื่อให้ได้ข้อสรุปที่ถูกต้อง หากเราใช้คำถามแรกในรายการข้างต้น ข้อมูลอาจมีลักษณะดังนี้:

ชื่อ สถานะ การศึกษา
1 เมลิสสา หย่าร้าง ปริญญาเอกหรือสูงกว่า
2 เคซี่ย์ แต่งงานแล้ว ปริญญาตรี
3 แองเจล่า แต่งงานแล้ว GED
4 อลิสสา หม้าย ปริญญาตรี
5 เจนน่า ไม่เคยแต่งงาน GED

ตารางฉุกเฉินเหล่านี้ใช้เป็นจุดเริ่มต้นในการจัดระเบียบข้อมูลที่รวบรวมผ่านการสุ่มตัวอย่างอย่างง่าย

ข้อดีของการวิเคราะห์เชิงอนุมาน

มีข้อดีหลายประการในการใช้การวิเคราะห์เชิงอนุมาน โดยหลักแล้วมันให้ข้อมูลรายละเอียดส่วนเกิน ซึ่งมากกว่าที่คุณจะมีหลังจากทำการทดสอบการวิเคราะห์เชิงพรรณนา

ข้อมูลนี้ช่วยให้นักวิจัยและนักวิเคราะห์มีความเข้าใจอย่างลึกซึ้งเกี่ยวกับความสัมพันธ์ระหว่างสองตัวแปร นอกจากนี้ยังสามารถแสดงความตระหนักต่อสาเหตุและผลกระทบและการคาดการณ์เกี่ยวกับแนวโน้มและรูปแบบทั่วทั้งอุตสาหกรรม

นอกจากนี้ เนื่องจากมีการใช้กันอย่างแพร่หลายในโลกธุรกิจและสถาบันการศึกษา จึงเป็นวิธีการวิเคราะห์ทางสถิติที่เป็นที่ยอมรับในระดับสากล

ข้อจำกัดของการวิเคราะห์เชิงอนุมาน

เมื่อพูดถึงสถิติอนุมาน มีข้อจำกัดหลักสองประการ

ข้อจำกัดแรกมาจากข้อเท็จจริงที่ว่าเนื่องจากข้อมูลที่กำลังวิเคราะห์มาจากประชากรที่ยังไม่ได้รับการวัดอย่างสมบูรณ์ นักวิเคราะห์ข้อมูลจึงไม่สามารถแน่ใจได้ 100% ว่าสถิติที่คำนวณนั้นถูกต้อง เนื่องจากการวิเคราะห์เชิงอนุมานอิงตามกระบวนการของการใช้ค่าที่วัดในตัวอย่างเพื่อสรุปค่าที่จะวัดจากประชากรทั้งหมด จึงมีความไม่แน่นอนในระดับหนึ่งเกี่ยวกับผลลัพธ์

ข้อ จำกัด ที่สองคือการทดสอบเชิงอนุมานบางอย่างต้องการให้นักวิเคราะห์หรือนักวิจัยทำการเดาอย่างมีการศึกษาตามทฤษฎีเพื่อทำการทดสอบ คล้ายกับข้อจำกัดแรก จะมีความไม่แน่นอนอยู่รอบๆ การเดาเหล่านี้ ซึ่งอาจหมายถึงผลกระทบบางประการต่อความน่าเชื่อถือของผลการทดสอบทางสถิติบางอย่าง

อย่าด่วนสรุป

ก่อนที่คุณจะข้ามไปยังข้อสรุปที่อาจไม่ถูกต้องเกี่ยวกับข้อมูล อย่าลืมใช้ประโยชน์จากข้อมูลที่รออยู่ในการทดสอบการวิเคราะห์เชิงอนุมาน

ไม่ว่าคุณจะต้องการสรุปประเภทใด หรือตั้งสมมติฐานไว้อย่างไร คุณอาจแปลกใจกับผลลัพธ์ที่ได้จากการทดสอบการวิเคราะห์เชิงอนุมาน

กำลังมองหา ซอฟต์แวร์การวิเคราะห์ทางสถิติ เพื่อตีความชุดข้อมูลทั้งหมดของคุณให้ดีขึ้นใช่หรือไม่ หรืออาจเป็นเครื่องมือที่ทำให้การวิเคราะห์ทางสถิติที่ซับซ้อนที่สุดเป็นเรื่องง่ายและสรุปได้ ตรวจสอบรายชื่อบทวิจารณ์ที่เป็นกลางใน G2!