รู้จักกับ Logistic Regression Analysis
การวิเคราะห์การถดถอยโลจิสติค (Logistic Regression Analysis) เป็นสถิติตัวหนึ่งที่ใช้ในการศึกษา ความสัมพันธ์ระหว่างตัวแปรตามกับตัวแปรอิสระ ซึ่งมีจุดมุ่งหมายเหมือนกับการวิเคราะห์การถดถอยเชิงเส้น (Linear Regression Analysis) คือ มุ่งพยากรณ์หรือทํานายตัวแปรตาม แต่ต่างกันที่ระดับการวัดตัวแปรตาม และ ประเด็นอื่นๆ
การวิเคราะห์การถดถอยโลจิสติก ใช้กับตัวแปรตามที่เป็นตัวแปรเชิงกลุ่ม (Categorical variable) หรือตัว แปรเชิงคุณภาพ (Qualitative variable) และกราฟมีลักษณะการกระจายของข้อมูลเป็นรูปตัว S หรือ S-shaped curve การวิเคราะห์นี้แบ่งเป็น 2 ประเภท ได้แก่ Binary Logistic และ Multinomial Logistic
จุดมุ่งหมายของการวิเคราะห์การถดถอยโลจิสติค 1. ศึกษาความสัมพันธ์ของตัวแปรอิสระที่มีต่อตัวแปรตาม (หรือโอกาสที่จะเกิดเหตุการณ์) หรือตัวแปร อิสระตัวใดที่ทํานายหรือน่าจะเป็นสาเหตุของการเกิดเหตุการณ์ในตัวแปรตามที่สนใจ 2. เพื่อทํานายโอกาสที่จะเกิดเหตุการณ์ที่สนใจจากกลุ่มของตัวแปรอิสระ จากสมการโลจิสติค (Logistic Response Function) ข้อตกลงเบื้องต้นของการวิเคราะห์การถดถอยโลจิสติค (กัลยา วานิชย์บัญชา, 2553) 1. ตัวแปรอิสระ (X’s) เป็นข้อมูลที่อยู่ในระดับอันตรภาค (Interval Scale) หรืออัตราส่วน (Ration Scale) ถ้าข้อมูลอยู่ในระดับเชิงกลุ่มให้ทําเป็นตัวแปรหุ่น (Dummy variable) ที่มไี ด้ 2 ค่าเท่านั้น คือ 0 กับ 1 2. ค่าเฉลี่ยหรือค่าคาดหวังของความคลาดเคลื่อนเป็น 0 นั่นคือ E(e) = 0 3. ei และ ej เป็นอิสระต่อกัน 4. ei และ X i เป็นอิสระต่อกัน 5. ตัวแปรอิสระไม่มีความสัมพันธ์กัน หรือไม่เกิดปัญหา Multicollinearity สําหรับขนาดกลุ่มตัวอย่าง (n) ที่ใช้กับการวิเคราะห์การถดถอยโลจิสติค จะมากกว่าการวิเคราะห์การถดถอย แบบเชิงเส้น โดยทั่วไปกําหนดให้ n 30 p โดยที่ p แทน จํานวนตัวแปรอิสระ (กัลยา วานิชย์บัญชา, 2553)