การถดถอยโลจิสติกคืออะไร? เรียนรู้ว่าควรใช้เมื่อใด
เผยแพร่แล้ว: 2021-07-29ชีวิตเต็มไปด้วยตัวเลือกไบนารีที่ยากลำบาก
ฉันควรมีพิซซ่าชิ้นนั้นหรือไม่? ฉันควรพกร่มหรือไม่?
แม้ว่าการตัดสินใจบางอย่างจะทำได้ถูกต้องโดยการชั่งน้ำหนักข้อดีและข้อเสีย เช่น ไม่ควรกินพิซซ่าสักชิ้นเพราะมันมีแคลอรีมากเป็นพิเศษ การตัดสินใจบางอย่างอาจไม่ง่ายขนาดนั้น
ตัวอย่างเช่น คุณไม่สามารถแน่ใจได้อย่างเต็มที่ว่าฝนจะตกในวันใดวันหนึ่งหรือไม่ ดังนั้นการตัดสินใจว่าจะพกร่มหรือไม่จึงเป็นเรื่องยาก
ในการตัดสินใจเลือกที่ถูกต้อง จำเป็นต้องมีความสามารถในการคาดการณ์ ความสามารถนี้มีกำไรสูงและมีแอพพลิเคชั่นในโลกแห่งความเป็นจริงมากมาย โดยเฉพาะในคอมพิวเตอร์ คอมพิวเตอร์ชอบการตัดสินใจแบบไบนารี ท้ายที่สุดพวกเขาพูดด้วยรหัสไบนารี
การเรียนรู้ของเครื่อง อัลกอริธึม ซึ่งเป็น อัลกอริธึมการถดถอยโลจิสติก ที่แม่นยำยิ่งขึ้น สามารถช่วยทำนายความเป็นไปได้ของเหตุการณ์โดยดูจากจุดข้อมูลในอดีต ตัวอย่างเช่น สามารถทำนายได้ว่าบุคคลใดจะชนะการเลือกตั้งหรือฝนจะตกในวันนี้
การถดถอยโลจิสติกคืออะไร?
การถดถอยโลจิสติกเป็นวิธีการทางสถิติที่ใช้ในการทำนายผลลัพธ์ของตัวแปรตามตามการสังเกตครั้งก่อน เป็นประเภทของการวิเคราะห์การถดถอยและเป็นอัลกอริธึมที่ใช้กันทั่วไปในการแก้ปัญหาการจำแนกประเภทไบนารี
หากคุณสงสัยว่า การวิเคราะห์การถดถอย คืออะไร มันคือเทคนิคการสร้างแบบจำลองเชิงคาดการณ์ประเภทหนึ่งที่ใช้เพื่อค้นหาความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระอย่างน้อยหนึ่งตัว
ตัวอย่างของตัวแปรอิสระคือเวลาที่ใช้ในการศึกษาและเวลาที่ใช้ใน Instagram ในกรณีนี้ เกรดจะเป็นตัวแปรตาม ทั้งนี้เพราะทั้ง “เวลาที่ใช้เรียน” และ “เวลาที่ใช้ใน Instagram” จะส่งผลต่อเกรด หนึ่งบวกและอื่น ๆ ในเชิงลบ
Logistic regression เป็น อัลกอริธึมการจำแนกประเภท ที่ทำนายผลลัพธ์ไบนารีตามชุดของตัวแปรอิสระ ในตัวอย่างข้างต้น นี่จะหมายถึงการคาดเดาว่าคุณจะผ่านหรือล้มเหลวในชั้นเรียน แน่นอนว่า การถดถอยโลจิสติกยังสามารถใช้เพื่อแก้ปัญหาการถดถอยได้ แต่ส่วนใหญ่จะใช้สำหรับปัญหาการจำแนกประเภท
เคล็ดลับ: ใช้ซอฟต์แวร์แมชชีนเลิร์นนิงเพื่อทำงานที่ซ้ำซากจำเจโดยอัตโนมัติและตัดสินใจโดยใช้ข้อมูลเป็นหลัก
อีกตัวอย่างหนึ่งคือการทำนายว่านักศึกษาจะเข้ามหาวิทยาลัยหรือไม่ ด้วยเหตุนี้ จะพิจารณาปัจจัยหลายประการ เช่น คะแนน SAT คะแนนเฉลี่ยของนักเรียน และจำนวนกิจกรรมนอกหลักสูตร การใช้ข้อมูลในอดีตเกี่ยวกับผลลัพธ์ก่อนหน้า อัลกอริธึมการถดถอยโลจิสติกจะจัดเรียงนักเรียนเป็นหมวดหมู่ "ยอมรับ" หรือ "ปฏิเสธ"
การถดถอยโลจิสติกเรียกอีกอย่างว่าการถดถอยโลจิสติกแบบทวินามหรือการถดถอยโลจิสติกแบบไบนารี หากมีตัวแปรตอบกลับมากกว่า 2 คลาส จะเรียกว่า multinomial logistic regression ไม่น่าแปลกใจเลยที่การถดถอยโลจิสติกถูกยืมมาจากสถิติและเป็นหนึ่งในอัลกอริธึมการจำแนกประเภทไบนารีที่พบบ่อยที่สุดในการเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูล
เธอรู้รึเปล่า? การแสดงแทนโครงข่ายประสาทเทียม (ANN) สามารถเห็นได้ว่าเป็นการรวมตัวแยกประเภทการถดถอยโลจิสติกจำนวนมากเข้าด้วยกัน
การถดถอยโลจิสติกทำงานโดยการวัดความสัมพันธ์ระหว่างตัวแปรตาม (สิ่งที่เราต้องการทำนาย) กับตัวแปรอิสระอย่างน้อยหนึ่งตัว (คุณสมบัติ) ทำได้โดยการประเมินความน่าจะเป็นด้วยความช่วยเหลือของฟังก์ชันลอจิสติกส์พื้นฐาน
คำศัพท์สำคัญในการถดถอยโลจิสติก
การทำความเข้าใจคำศัพท์เป็นสิ่งสำคัญในการถอดรหัสผลลัพธ์ของการถดถอยโลจิสติกอย่างเหมาะสม การรู้ว่าคำศัพท์เฉพาะหมายถึงอะไรจะช่วยให้คุณเรียนรู้ได้อย่างรวดเร็ว หากคุณเพิ่งเริ่มใช้สถิติหรือแมชชีนเลิร์นนิง
- ตัวแปร: ตัวเลข ลักษณะ หรือปริมาณใดๆ ที่สามารถวัดหรือนับได้ อายุ ความเร็ว เพศ และรายได้เป็นตัวอย่าง
- สัมประสิทธิ์: ตัวเลข ซึ่งมักจะเป็นจำนวนเต็ม คูณด้วยตัวแปรที่มาพร้อมกัน ตัวอย่างเช่น ใน 12y ตัวเลข 12 คือสัมประสิทธิ์
- EXP: รูปแบบย่อของเลขชี้กำลัง
- ค่าผิดปกติ: จุดข้อมูลที่แตกต่างจากที่เหลืออย่างมาก
- Estimator: อัลกอริทึมหรือสูตรที่สร้างค่าประมาณของพารามิเตอร์
- การทดสอบไคสแควร์: เรียกอีกอย่างว่าการทดสอบไคสแควร์ ซึ่งเป็นวิธีการทดสอบสมมติฐานเพื่อตรวจสอบว่าข้อมูลเป็นไปตามที่คาดไว้หรือไม่
- ข้อผิดพลาดมาตรฐาน: ค่าเบี่ยงเบนมาตรฐานโดยประมาณของประชากรกลุ่มตัวอย่างทางสถิติ
- การทำให้เป็นมาตรฐาน : วิธีการที่ใช้ในการลดข้อผิดพลาดและการปรับให้เหมาะสมโดยการปรับฟังก์ชัน (อย่างเหมาะสม) ในชุดข้อมูลการฝึก
- Multicollinearity: การเกิดขึ้นของความสัมพันธ์ระหว่างตัวแปรอิสระตั้งแต่สองตัวขึ้นไป
- ความพอดี: คำอธิบายว่าแบบจำลองทางสถิติเหมาะสมกับชุดการสังเกตมากเพียงใด
- อัตราต่อรอง: การวัดความแข็งแกร่งของความสัมพันธ์ระหว่างสองเหตุการณ์
- ฟังก์ชัน Log-likelihood: ประเมินความเหมาะสมของแบบจำลองทางสถิติ
- การทดสอบ Hosmer–Lemeshow: การทดสอบที่ประเมินว่าอัตราเหตุการณ์ที่สังเกตได้ตรงกับอัตราเหตุการณ์ที่คาดไว้หรือไม่
ฟังก์ชันลอจิสติกส์คืออะไร?
การถดถอยโลจิสติกตั้งชื่อตามฟังก์ชันที่ใช้ในหัวใจ นั่นคือ ฟังก์ชันลอจิสติกส์ นักสถิติเริ่มใช้เพื่ออธิบายคุณสมบัติของการเติบโตของประชากร ฟังก์ชันซิกมอยด์ และ ฟังก์ชัน ลอจิทเป็นรูปแบบหนึ่งของฟังก์ชันลอจิสติกส์ ฟังก์ชัน Logit เป็นฟังก์ชันผกผันของฟังก์ชันลอจิสติกมาตรฐาน
ผลก็คือ มันเป็นเส้นโค้งรูปตัว S ที่สามารถนำจำนวนจริงใดๆ มาจับคู่เป็นค่าระหว่าง 0 ถึง 1 ได้ แต่จะไม่มีวันแม่นยำที่ขีดจำกัดเหล่านั้น มันถูกแสดงโดยสมการ:
f(x) = L / 1 + e^-k(x - x0)
ในสมการนี้:
- f(X) คือเอาต์พุตของฟังก์ชัน
- L คือค่าสูงสุดของเส้นโค้ง
- e เป็นฐานของลอการิทึมธรรมชาติ
- k คือความชันของเส้นโค้ง
- x คือจำนวนจริง
- x0 คือค่า x ของจุดกึ่งกลางซิกมอยด์
หากค่าที่คาดการณ์ไว้เป็นค่าลบมาก จะถือว่าใกล้ศูนย์ ในทางกลับกัน หากค่าที่คาดการณ์ไว้เป็นค่าบวกที่มีนัยสำคัญ ก็จะถือว่ามีค่าใกล้เคียงกับค่าหนึ่ง
การถดถอยโลจิสติกจะแสดงคล้ายกับวิธีกำหนดถดถอยเชิงเส้นโดยใช้สมการของเส้นตรง ความแตกต่างที่โดดเด่นจากการถดถอยเชิงเส้นคือผลลัพธ์จะเป็นค่าไบนารี (0 หรือ 1) แทนที่จะเป็นค่าตัวเลข
ต่อไปนี้คือตัวอย่างสมการถดถอยโลจิสติก:
y = e^(b0 + b1*x) / (1 + e^(b0 + b1*x))
ในสมการนี้:
- y คือค่าที่คาดการณ์ไว้ (หรือผลลัพธ์)
- b0 คืออคติ (หรือระยะการสกัดกั้น)
- b1 คือสัมประสิทธิ์ของอินพุต
- x เป็นตัวแปรทำนาย (หรืออินพุต)
ตัวแปรตามโดยทั่วไปจะตามหลัง การกระจายเบอร์นูลลี ค่าของสัมประสิทธิ์ถูกประมาณโดยใช้การประมาณความน่าจะเป็น สูงสุด (MLE) การ ไล่ระดับสีแบบ เกรเดียนต์ และ การไล่ระดับสีแบบสุ่ม
เช่นเดียวกับอัลกอริธึมการจำแนกประเภทอื่นๆ เช่น the k-เพื่อนบ้านที่ใกล้ที่สุด, a เมทริกซ์ความสับสน ใช้ในการประเมินความถูกต้องของอัลกอริทึมการถดถอยโลจิสติก
เธอรู้รึเปล่า? การถดถอยโลจิสติกเป็นส่วนหนึ่งของตระกูลแบบจำลองเชิงเส้นทั่วไป (GLM) ที่มีขนาดใหญ่กว่า
เช่นเดียวกับการประเมินประสิทธิภาพของตัวแยกประเภท การรู้ว่าเหตุใดตัวแบบจึงจำแนกการสังเกตในลักษณะเฉพาะก็สำคัญไม่แพ้กัน กล่าวอีกนัยหนึ่ง เราต้องการการตัดสินใจของผู้แยกประเภทเพื่อให้สามารถตีความได้
แม้ว่าความสามารถในการตีความจะไม่ใช่เรื่องง่ายที่จะกำหนด แต่จุดประสงค์หลักก็คือมนุษย์ควรรู้ว่าเหตุใดอัลกอริทึมจึงตัดสินใจโดยเฉพาะ ในกรณีของการถดถอยโลจิสติก สามารถรวมกับการทดสอบทางสถิติเช่น การทดสอบ Wald หรือ การทดสอบอัตราส่วนความน่าจะเป็น เพื่อการตีความ
เมื่อใดควรใช้การถดถอยโลจิสติก
การถดถอยโลจิสติกใช้เพื่อทำนายตัวแปรตามหมวดหมู่ กล่าวอีกนัยหนึ่ง จะใช้เมื่อการคาดการณ์เป็นหมวดหมู่ เช่น ใช่หรือไม่ใช่ จริงหรือเท็จ 0 หรือ 1 ความน่าจะเป็นที่คาดการณ์หรือผลลัพธ์ของการถดถอยโลจิสติกสามารถเป็นหนึ่งในนั้น และไม่มีจุดกึ่งกลาง
ในกรณีของตัวแปรทำนาย พวกเขาสามารถเป็นส่วนหนึ่งของหมวดหมู่ใด ๆ ต่อไปนี้:
- ข้อมูลต่อเนื่อง: ข้อมูลที่สามารถวัดได้ในระดับอนันต์ สามารถใช้ค่าใดก็ได้ระหว่างตัวเลขสองตัว ตัวอย่างคือน้ำหนักเป็นปอนด์หรืออุณหภูมิเป็นฟาเรนไฮต์
- ข้อมูลที่ไม่ต่อเนื่องและระบุ: ข้อมูลที่เหมาะกับหมวดหมู่ที่มีชื่อ ตัวอย่างสั้นๆ คือ สีผม: สีบลอนด์ สีดำ หรือสีน้ำตาล
- ข้อมูลลำดับที่ไม่ต่อเนื่อง: ข้อมูลที่พอดีกับรูปแบบการเรียงลำดับบางอย่างบนมาตราส่วน ตัวอย่างคือการบอกว่าคุณพอใจกับผลิตภัณฑ์หรือบริการเพียงใดในระดับหนึ่งถึงห้า
การวิเคราะห์การถดถอยโลจิสติกมีค่าสำหรับการทำนายความน่าจะเป็นของเหตุการณ์ ช่วยกำหนดความน่าจะเป็นระหว่างสองคลาสใด ๆ

โดยสรุป เมื่อดูข้อมูลในอดีต การถดถอยโลจิสติกสามารถทำนายได้ว่า:
- อีเมลเป็นสแปม
- วันนี้ฝนจะตก
- เนื้องอกเป็นอันตรายถึงชีวิต
- บุคคลทั่วไปจะซื้อรถ
- ธุรกรรมออนไลน์เป็นการฉ้อโกง
- ผู้เข้าแข่งขันจะชนะการเลือกตั้ง
- กลุ่มผู้ใช้จะซื้อสินค้า
- ผู้ถือกรมธรรม์ประกันภัยจะหมดอายุก่อนอายุกรมธรรม์หมดลง
- ผู้รับอีเมลส่งเสริมการขายเป็นการตอบกลับหรือไม่ตอบกลับ
โดยพื้นฐานแล้ว การถดถอยโลจิสติกช่วยแก้ปัญหา ความน่าจะ เป็นและปัญหา การจำแนกประเภท กล่าวอีกนัยหนึ่ง คุณสามารถคาดหวังเฉพาะผลการจำแนกประเภทและความน่าจะเป็นจากการถดถอยโลจิสติก
ตัวอย่างเช่น สามารถใช้เพื่อกำหนดความน่าจะเป็นของบางสิ่งที่ "จริงหรือเท็จ" และสำหรับการตัดสินใจระหว่างผลลัพธ์สองอย่าง เช่น "ใช่หรือไม่ใช่"
แบบจำลองการถดถอยโลจิสติกยังช่วยจัดประเภทข้อมูลสำหรับการดำเนินการแยก แปลง และโหลด (ETL) ไม่ควรใช้การถดถอยโลจิสติกหากจำนวนการสังเกตน้อยกว่าจำนวนจุดสนใจ มิเช่นนั้นอาจนำไปสู่การสวมใส่มากเกินไป
การถดถอยเชิงเส้นกับการถดถอยโลจิสติก
ในขณะที่การถดถอยโลจิสติกทำนายตัวแปรหมวดหมู่สำหรับตัวแปรอิสระตั้งแต่หนึ่งตัวขึ้นไป การถดถอยเชิงเส้น ทำนายตัวแปรต่อเนื่อง กล่าวอีกนัยหนึ่งการถดถอยโลจิสติกให้เอาต์พุตคงที่ในขณะที่การถดถอยเชิงเส้นให้เอาต์พุตต่อเนื่อง
เนื่องจากผลลัพธ์มีความต่อเนื่องในการถดถอยเชิงเส้น จึงมีค่าที่เป็นไปได้อนันต์สำหรับผลลัพธ์ แต่สำหรับการถดถอยโลจิสติก จำนวนของค่าผลลัพธ์ที่เป็นไปได้มีจำกัด
ในการถดถอยเชิงเส้น ตัวแปรตามและตัวแปรอิสระควรสัมพันธ์เชิงเส้น ในกรณีของการถดถอยโลจิสติก ตัวแปรอิสระควรสัมพันธ์เชิงเส้นกับ เข้าสู่ระบบราคา (บันทึก (p/(1-p))
เคล็ดลับ: สามารถใช้การถดถอยโลจิสติกในภาษาการเขียนโปรแกรมใดๆ ที่ใช้สำหรับการวิเคราะห์ข้อมูล เช่น R, Python, Java และ MATLAB
ในขณะที่การถดถอยเชิงเส้นถูกประเมินโดยใช้วิธีกำลังสองน้อยที่สุดธรรมดา การถดถอยโลจิสติกถูกประเมินโดยใช้วิธีการประมาณค่าความน่าจะเป็นสูงสุด
ทั้งโลจิสติกและการถดถอยเชิงเส้นคือ แมชชีนเลิร์นนิงภายใต้การดูแล อัลกอริทึมและการวิเคราะห์การถดถอยสองประเภทหลัก ในขณะที่การถดถอยโลจิสติกใช้เพื่อแก้ปัญหาการจำแนกประเภท การถดถอยเชิงเส้นมักใช้สำหรับปัญหาการถดถอย
ย้อนกลับไปที่ตัวอย่างเวลาที่ใช้ในการศึกษา การถดถอยเชิงเส้นและการถดถอยโลจิสติกสามารถทำนายสิ่งต่าง ๆ ได้ Logistic regression ช่วยทำนายว่านักเรียนสอบผ่านหรือไม่ ในทางตรงกันข้าม การถดถอยเชิงเส้นสามารถทำนายคะแนนของนักเรียนได้
สมมติฐานการถดถอยโลจิสติก
ในขณะที่ใช้การถดถอยโลจิสติก เราตั้งสมมติฐานสองสามข้อ สมมติฐานเป็นส่วนสำคัญในการใช้การถดถอยโลจิสติกอย่างถูกต้องสำหรับการคาดการณ์และแก้ปัญหาการจำแนกประเภท
ต่อไปนี้เป็นสมมติฐานหลักของการถดถอยโลจิสติก:
- multicollinearity น้อยหรือไม่มีเลย ระหว่างตัวแปรอิสระ
- ตัวแปรอิสระมี ความเกี่ยวข้องเชิงเส้นตรงกับอัตราต่อรองของ บันทึก (log (p/(1-p))
- ตัวแปรตามเป็นแบบ dichotomous หรือ binary ; มันเหมาะกับสองประเภทที่แตกต่างกัน สิ่งนี้ใช้กับการถดถอยโลจิสติกแบบไบนารีเท่านั้นซึ่งจะกล่าวถึงในภายหลัง
- ไม่มีตัวแปรที่ไม่มีความหมาย เนื่องจากอาจทำให้เกิดข้อผิดพลาดได้
- ขนาดตัวอย่างข้อมูลมีขนาดใหญ่กว่า ซึ่งเป็นส่วนประกอบสำคัญเพื่อผลลัพธ์ที่ดีกว่า
- ไม่มีค่าผิดปกติ
ประเภทของการถดถอยโลจิสติก
การถดถอยโลจิสติกสามารถแบ่งออกเป็นประเภทต่างๆ ตามจำนวนผลลัพธ์หรือหมวดหมู่ของตัวแปรตาม
เมื่อเราคิดถึงการถดถอยโลจิสติก เราอาจนึกถึงการถดถอยโลจิสติกแบบไบนารี ในส่วนใหญ่ของบทความนี้ เมื่อเราอ้างถึงการถดถอยโลจิสติก เราหมายถึงการถดถอยโลจิสติกแบบไบนารี
ต่อไปนี้เป็นสามประเภทหลักของการถดถอยโลจิสติก
การถดถอยโลจิสติกแบบไบนารี
การถดถอยโลจิสติกแบบไบนารี เป็นวิธีการทางสถิติที่ใช้ในการทำนายความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระ ในวิธีนี้ ตัวแปรตามเป็นตัวแปรไบนารี ซึ่งหมายความว่าสามารถรับได้เพียงสองค่าเท่านั้น (ใช่หรือไม่ใช่ จริงหรือเท็จ สำเร็จหรือล้มเหลว 0 หรือ 1)
ตัวอย่างง่ายๆ ของการถดถอยโลจิสติกแบบไบนารีคือการพิจารณาว่าอีเมลเป็นสแปมหรือไม่
การถดถอยโลจิสติกพหุนาม
การถดถอยโลจิสติกพหุนาม เป็นส่วนเสริมของการถดถอยโลจิสติกแบบไบนารี อนุญาตให้มีผลลัพธ์หรือตัวแปรตามมากกว่าสองหมวดหมู่
คล้ายกับการถดถอยโลจิสติกแบบไบนารี แต่สามารถมีผลลัพธ์ที่เป็นไปได้มากกว่าสองรายการ ซึ่งหมายความว่าตัวแปรผลลัพธ์สามารถมีประเภทที่ ไม่เรียงลำดับที่เป็นไปได้สามประเภท ขึ้นไป - ประเภทที่ไม่มีนัยสำคัญเชิงปริมาณ ตัวอย่างเช่น ตัวแปรตามอาจแสดงถึง "ประเภท A" "ประเภท B" หรือ "ประเภท C"
คล้ายกับการถดถอยโลจิสติกแบบไบนารี การถดถอยโลจิสติกพหุนามยังใช้การประมาณความน่าจะเป็นสูงสุดเพื่อกำหนดความน่าจะเป็น
ตัวอย่างเช่น สามารถใช้การถดถอยโลจิสติกพหุนามเพื่อศึกษาความสัมพันธ์ระหว่างการศึกษาและการเลือกอาชีพ ในที่นี้ การเลือกอาชีพจะเป็นตัวแปรตามซึ่งประกอบด้วยประเภทอาชีพต่างๆ
ลำดับการถดถอยโลจิสติก
การถดถอยโลจิสติกแบบ มีลำดับ หรือที่เรียกว่า การถดถอยแบบมีลำดับ เป็นอีกส่วนขยายของการถดถอยโลจิสติกแบบไบนารี ใช้เพื่อทำนายตัวแปรตามที่มี ประเภทเรียงลำดับที่เป็นไปได้สามประเภท ขึ้นไป - ประเภทที่มีนัยสำคัญเชิงปริมาณ ตัวอย่างเช่น ตัวแปรตามอาจแสดงถึง "ไม่เห็นด้วยอย่างยิ่ง" "ไม่เห็นด้วย" "เห็นด้วย" หรือ "เห็นด้วยอย่างยิ่ง"
สามารถใช้เพื่อกำหนดผลการปฏิบัติงาน (แย่ ปานกลาง หรือดีเยี่ยม) และความพึงพอใจในงาน (ไม่พอใจ พอใจ หรือพอใจมาก)
ข้อดีและข้อเสียของการถดถอยโลจิสติก
ข้อดีและข้อเสียหลายประการของตัวแบบการถดถอยโลจิสติกนำไปใช้กับตัวแบบการถดถอยเชิงเส้น ข้อดีที่สำคัญที่สุดประการหนึ่งของแบบจำลองการถดถอยโลจิสติกคือไม่เพียงจัดประเภท แต่ยังให้ความน่าจะเป็นด้วย
ต่อไปนี้เป็น ข้อดี บางประการของอัลกอริทึมการถดถอยโลจิสติก
- เข้าใจง่าย นำไปปฏิบัติง่าย และมีประสิทธิภาพในการฝึกอบรม
- ทำงานได้ดีเมื่อชุดข้อมูลแยกเชิงเส้นได้
- ความแม่นยำที่ดีสำหรับชุดข้อมูลขนาดเล็ก
- ไม่ได้ตั้งสมมติฐานใด ๆ เกี่ยวกับการกระจายคลาส
- เสนอทิศทางของสมาคม (บวกหรือลบ)
- มีประโยชน์ในการค้นหาความสัมพันธ์ระหว่างคุณสมบัติต่างๆ
- ให้ความน่าจะเป็นที่สอบเทียบอย่างดี
- มีแนวโน้มน้อยที่จะ overfitting ในชุดข้อมูลมิติต่ำ
- สามารถขยายไปสู่การจำแนกหลายคลาส
อย่างไรก็ตาม มีข้อเสียมากมายในการถดถอยโลจิสติก หากมีคุณสมบัติที่จะแยกสองคลาสได้อย่างสมบูรณ์ โมเดลนั้นจะไม่สามารถฝึกได้อีกต่อไป นี้เรียกว่า การแยกที่สมบูรณ์
สิ่งนี้เกิดขึ้นส่วนใหญ่เนื่องจากน้ำหนักสำหรับคุณลักษณะนั้นจะไม่มาบรรจบกันเนื่องจากน้ำหนักที่เหมาะสมที่สุดจะไม่มีที่สิ้นสุด อย่างไรก็ตาม ในกรณีส่วนใหญ่ การแยกโดยสมบูรณ์สามารถแก้ไขได้โดยการกำหนดการกระจายความน่าจะเป็นของตุ้มน้ำหนักก่อนหรือแนะนำการปรับลดตุ้มน้ำหนัก
ต่อไปนี้เป็น ข้อเสีย บางประการของอัลกอริทึมการถดถอยโลจิสติก:
- สร้างขอบเขตเชิงเส้น
- อาจนำไปสู่การ overfitting หากจำนวนคุณสมบัติมากกว่าจำนวนการสังเกต
- ตัวทำนายควรมีค่าเฉลี่ยหรือไม่มีหลายคอลลิเนียร์
- ท้าทายเพื่อให้ได้ความสัมพันธ์ที่ซับซ้อน อัลกอริธึมเช่นโครงข่ายประสาทมีความเหมาะสมและมีประสิทธิภาพมากกว่า
- ใช้ได้เฉพาะในการทำนายฟังก์ชันที่ไม่ต่อเนื่อง
- แก้ปัญหาไม่เชิงเส้นไม่ได้
- ไวต่อค่าผิดปกติ
เมื่อชีวิตให้ทางเลือกแก่คุณ ให้นึกถึงการถดถอยโลจิสติก
หลายคนอาจโต้แย้งว่ามนุษย์ไม่ได้อยู่ในโลกเลขฐานสอง ต่างจากคอมพิวเตอร์ แน่นอน ถ้าคุณได้รับพิซซ่าและแฮมเบอร์เกอร์ชิ้นหนึ่ง คุณสามารถทานทั้งสองอย่างโดยไม่ต้องเลือกเพียงอย่างใดอย่างหนึ่ง แต่ถ้าคุณมองให้ละเอียดยิ่งขึ้น การตัดสินใจแบบไบนารีจะถูกจารึกไว้บนทุกสิ่ง (ตามตัวอักษร) คุณสามารถเลือกที่จะกินหรือไม่กินพิซซ่า ไม่มีพื้นกลาง
การประเมินประสิทธิภาพของแบบจำลองการคาดการณ์อาจเป็นเรื่องยากหากมีข้อมูลจำนวนจำกัด สำหรับสิ่งนี้ คุณสามารถใช้เทคนิคที่เรียกว่า cross-validation ซึ่งเกี่ยวข้องกับการแบ่งพาร์ติชั่นข้อมูลที่มีอยู่ออกเป็นชุดการฝึกและชุดทดสอบ