การใช้สถิติในการวิจัย
สถิติ (Statistics) หมายถึงตัวเลขที่แทนข้อเท็จจริงของสิ่งที่นักวิจัยสนใจ เช่น คะแนน ความพึงพอใจ อายุ รายได้ ฯลฯ สถิติในความหมายของค่าสถิติ หมายถึง ค่าตัวเลขที่คำนวณจากกลุ่มตัวอย่าง เช่น ค่าเฉลี่ยของกลุ่มตัวอย่าง คือ ส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง คือ S.D. หรือ S สัมประสิทธิ์หสัมพันธ์ระหว่างตัวแปร X และ Y คือ rxy เป็นต้น
1. ประเภทของสถิติ
สถิติแบ่งตามระเบียบวิธีทางสถิติ (Statistical Method) จำแนกได้เป็น 2 ประเภท ดังนี้ สถิติพรรณนาหรือสถิติบรรยาย และสถิติอ้างอิงหรืออนุมาน
1.1 สถิติพรรณนา หรือสถิติบรรยาย (Descriptive Statistics) เป็นสถิติที่ใช้สรุปคุณลักษณะของตัวแปรในกลุ่มตัวอย่างหรือประชากรที่ศึกษา วิธีการที่ใช้บรรยายหรือพรรณนา ได้แก่
1) การแจกแจงความถี่ การนำเสนอด้วยตาราง กราฟ และรูปภาพ
2) การคำนวณค่าประสิทธิภาพ E1/E2 ร้อยละ สัดส่วน และอัตราส่วน
3) การวัดแนวโน้มเข้าสู่ส่วนกลาง ได้แก่ ค่าเฉลี่ย มัธยฐาน ฐานนิยม
4) การวัดการกระจาย ได้แก่ พิสัย ส่วนเบี่ยงเบนมาตรฐาน
5) การวัดความสัมพันธ์ระหว่างตัวแปร ได้แก่ สัมประสิทธิสหสัมพันธ์ (Correlation Coefficient)
1.2 สถิติอ้างอิง หรืออนุมาน (Inferential or Inductive Statistics) เป็นสถิติที่ศึกษาข้อมูลจากกลุ่มตัวอย่างเพื่อสรุปอ้างอิงไปยังประชากร การสุ่มตัวอย่าง (Sampling) ที่เป็นตัวแทนที่ดีของประชากร จึงมีความสำคัญต่อการสรุปอ้างอิงค่าสถิติจากกลุ่มตัวอย่างไปยังค่าพารามิเตอร์ของกลุ่มประชากร วิธีการที่ใช้อ้างอิง มีดังนี้
1) การประมาณค่าพารามิเตอร์ (Estimation) เป็นเทคนิคการนำค่าสถิติจากกลุ่มตัวอย่างไปคาดคะเนหรือประมาณค่าพารามิเตอร์ของประชากร ได้แก่ การประมาณค่าแบบจุด และแบบช่วง
2) การทดสอบสมมติฐาน (Hypothesis Testing) สถิติที่ใช้อ้างอิง ได้แก่
- สถิติเพื่อเปรียบเทียบความแตกต่างของข้อมูล 1 กลุ่มหรือ 2 กลุ่ม โดยการทดสอบค่าที (t-test) การทดสอบค่าซี (Z-test)
- สถิติเพื่อเปรียบเทียบความแตกต่างของข้อมูลมากกว่า 2 กลุ่ม โดยการใช้การวิเคราะห์แปรปรวน (Analysis of Variance: ANOVA)
- สถิติเพื่อหาความสัมพันธ์ของข้อมูล ได้แก่ ไคสแควร์ (Chi-square) และการทดสอบ (Correlation) นัยสำคัญของสหสัมพันธ์
2. มาตรวัดตัวแปร
มาตรวัดตัวแปร สามารถจำแนกประเภทเป็น 4 ระดับ ดังนี้ มาตรวัดแบบกลุ่ม มาตรวัดแบบจัดอันดับ มาตรวัดแบบอันตรภาค และมาตรวัดแบบอัตราส่วน
2.1 มาตรวัดแบบกลุ่ม หรือนามบัญญัติ (Nominal Scale) เป็นมาตรวัดตัวแปรที่ใช้แบ่งกลุ่ม หรือเรียกชื่อของสิ่งที่ศึกษาออกเป็นกลุ่ม เช่น เพศ แบ่งออกเป็น เพศชาย และเพศหญิง แต่ไม่สามารถบอกว่าเพศชายมากกว่าเพศหญิงเท่าไร ตัวแปรระดับกลุ่มไม่สามารถบวกลบทางคณิตศาสตร์ได้
สถิติที่ใช้ ได้แก่ ร้อยละ ฐานนิยม ไคสแควร์
2.2 มาตรวัดแบบจัดอันดับ (Ordinal Scale) เป็นมาตรวัดตัวแปรที่บอกตำแหน่ง ทิศทาง แต่ไม่สามารถบอกระยะห่างได้ เช่น วุฒิการศึกษา แบ่งเป็น ปริญญาตรี ปริญญาโท ปริญญาเอก สามารถบอกได้ว่าวุฒิการศึกษาใดสูงกว่ากัน แต่ไม่สามารถนำวุฒิการศึกษามาบวกลบทางคณิตศาสตร์ได้
สถิติที่ใช้ ได้แก่ มัธยฐาน เปอร์เซ็นต์ไทล์ และสหสัมพันธ์แบบจัดอันดับ
2.3 มาตรวัดแบบอัตรภาค (Interval Scale) เป็นมาตรวัดตัวแปรที่บอกปริมาณความมากน้อย หรือความห่างของข้อมูลได้ เช่น คะแนนสอบ 5 คะแนน 10 คะแนน บอกได้ว่ามากกว่ากัน 10-5 = 5 คะแนน แต่ไม่สามารถบอกได้ว่ามีความรู้เป็น 2 เท่า หรือตัวแปรในมาตรวัดแบบลิคเอิร์ท (Likert scale) ที่แบ่งเป็นมาก ปานกลาง น้อย ตัวแปรระดับอัตรภาคสามารถบวกลบทางคณิตศาสตร์ได้ แต่ไม่สามารถคูณหารได้
สถิติที่ใช้ ได้แก่ ค่าเฉลี่ย t-test ANOVA และสหสัมพันธ์
2.4 มาตรวัดแบบอัตราส่วน (Ratio Scale) เป็นมาตรวัดตัวแปรที่บอกปริมาณความห่างและมีศูนย์แท้ เช่น รายได้ น้ำหนัก ส่วนสูง ตัวแปรนี้นำมาบวก ลบ คูณ หาร ทางคณิตศาสตร์ได้ เช่น ผู้ที่มีน้ำหนักหนัก 100 กิโลกรัม หนักเป็น 2 เท่าของผู้มีน้ำหนักที่หนัก 50 กิโลกรัม เป็นต้น
สถิติที่ใช้ ได้แก่ ค่าเฉลี่ย t-test ANOVA และสหสัมพันธ์
ดังนั้น นักวิจัยสามารถออกแบบการวัดตัวแปรให้เหมาะสมกับวัตถุประสงค์ในการวิจัยเพื่อเลือกสถิติมาวิเคราะห์ข้อมูลได้อย่างเหมาะสมต่อไป
3. หลักการใช้สถิติต่างๆ
3.1 การใช้สถิติเปรียบเทียบค่าเฉลี่ยในการวิจัย การใช้สถิติเปรียบเทียบค่าเฉลี่ยในการวิจัย มีหลักการพิจารณาที่สำคัญ คือ
1) พิจารณาวัตถุประสงค์การวิจัยและสมมติฐาน
ถ้านักวิจัยมีวัตถุประสงค์
- เพื่อเปรียบเทียบความพึงพอใจระหว่างเพศชายและเพศหญิง ต้องใช้ t-test แบบ 2 กลุ่มเป็นอิสระต่อกัน (Independent groups)
- เพื่อเปรียบเทียบผลการเรียนก่อน-หลังอบรม ต้องใช้ t-test แบบ 2 กลุ่ม ไม่เป็นอิสระต่อกัน (Dependent groups)
- เพื่อเปรียบเทียบความสามารถในการปฏิบัติงานของผู้ที่มีวุฒิการศึกษาต่างกัน ต้องใช้การวิเคราะห์ความแปรปรวน (Analysis of variance: ANOVA) เพราะกลุ่มตัวอย่างมีการแบ่งวุฒิการศึกษามากกว่า 2 กลุ่ม
2) พิจารณาจากจำนวนกลุ่มตัวอย่าง
นักวิจัยต้องพิจารณาว่า กลุ่มตัวอย่างที่ศึกษาว่ามี 1 กลุ่ม 2 กลุ่ม หรือมากกว่า 2 กลุ่ม เช่น ถ้าวุฒิการศึกษาต้องการเปรียบเทียบค่าเฉลี่ย 2 กลุ่ม ต้องใช้ t-test ถ้าเปรียบเทียบค่าเฉลี่ยมากกว่า 2 กลุ่ม ใช้ ANOVA
3) พิจารณาจากข้อมูลหรือตัวแปร
นักวิจัยต้องพิจารณาว่า ข้อมูลเป็นตัวแปรอยู่ในมาตรวัดแบบใด กรณีใช้ t-test หรือ ANOVA ข้อมูลที่นำมาวิเคราะห์ต้องอยู่ในมาตรวัดแบบอันตรภาคหรืออัตราส่วน
ข้อตกลงเบื้องต้นของการใช้สถิติเปรียบเทียบค่าเฉลี่ย
1) การทดสอบค่าที (t-test) กรณีกลุ่มตัวอย่าง 2 กลุ่ม เป็นอิสระต่อกัน (Independent group) มีข้อตกลงเบื้องต้น ดังนี้
1) ข้อมูลอยู่ในมาตรวัดแบบอันตรภาคหรืออัตราส่วน
2) กลุ่มตัวอย่างได้มาจากการสุ่มจากประชากรที่มีการแจกแจงแบบปกติ
3) ไม่ทราบค่าความแปรปรวนของประชากร
4) ค่าของตัวแปรตามแต่ละหน่วยเป็นอิสระต่อกัน
5) ข้อมูลได้จากกลุ่มตัวอย่าง 2 กลุ่ม ที่เป็นอิสระต่อกัน
2) การทดสอบค่าที (t-test) กรณีกลุ่มตัวอย่าง 2 กลุ่มไม่เป็นอิสระต่อกัน (Dependent group) หรือสัมพันธ์กัน มีข้อตกลงเบื้องต้น ดังนี้
1) ข้อมูลอยู่ในมาตรวัดแบบอันตรภาคหรืออัตราส่วาว
2) กลุ่มตัวอย่างได้มาจากการสุ่มจากประชากรที่มีการแจกแจงแบบปกติ
3) ไม่ทราบค่าความแปรปรวนของประชากร
4) ค่าของตัวแปรตามแต่ละหน่วยเป็นอิสระต่อกัน
5) ข้อมูล 2 ชุด ได้มาจากกลุ่มตัวอย่างเดียวกันแต่ทำการวัด 2 ครั้ง หรือมาจากกลุ่มตัวอย่าง 2 กลุ่มที่สัมพันธ์กัน
3) การวิเคราะห์ความแปรปรวนแบบทางเดียว (One way analysis of variance) กรณีกลุ่มตัวอย่างมากกว่า 2 กลุ่ม มีข้อตกลงเบื้องต้น ดังนี้
1) ข้อมูลอยู่ในมาตรวัดแบบอันตรภาคหรืออัตราส่วน
2) กลุ่มตัวอย่างได้มาจากการสุ่มจากประชากรที่มีการแจกแจงแบบปกติ
3) ความแปรปรวนของประชากรแต่ละกลุ่มเป็นอิสระต่อกัน
4) มีตัวแปรอิสระ 1 ตัว ตัวแปรตาม 1 ตัว
5) ข้อมูลได้จากกลุ่มตัวอย่างมากกว่า 2 กลุ่ม ที่เป็นอิสระต่อกัน
3.2 การใช้สถิติเพื่อหาความสัมพันธ์ของตัวแปร
การหาความสัมพันธ์ระหว่างตัวแปรอิสระ1 ตัวกับตัวแปรตาม 1 ตัว ใช้สหสัมพันธ์อย่างง่าย (Simple correlation) การหาความสัมพันธ์ระหว่างตัวแปรอิสระมากกว่า 1 ตัวกับตัวแปรตาม 1 ตัว ใช้สหสัมพันธ์พหุคูณ (Multiple correlation) ถ้าต้องการหาขนาดความสัมพันธ์ของตัวแปรอิสระ 1 ตัวกับตัวแปรตาม 1 ตัวโดยทำนายค่าของตัวแปรตามจากตัวแปรอิสระ ใช้การถดถอยอย่างง่าย (Simple regression) และการหาขนาดความสัมพันธ์ของตัวแปรอิสระมากกว่า 1 ตัวกับตัวแปรตาม 1 ตัวโดยทำนายค่าของตัวแปรตามจากตัวแปรอิสระ ใช้การถดถอยพหุคูณ (Multiple regression) การวิเคราะห์ความสัมพันธ์ สามารถทำการศึกษากับตัวแปรอิสระและตัวแปรตามอย่างละ 1 ตัวหรือมากกว่า 1 ตัวก็ได้
3.2.1 หลักการใช้สถิติวิเคราะห์ความสัมพันธ์ของตัวแปร
1) พิจารณาวัตถุประสงค์การวิจัยและสมมติฐาน
ถ้านักวิจัยมีวัตถุประสงค์เพื่อหาความสัมพันธ์หรือการทำนาย ดังนี้
- เพื่อศึกษาความสัมพันธ์ระหว่างอายุกับความสามารถในการทำงาน ใช้สหสัมพันธ์อย่างง่าย
- เพื่อศึกษาความสัมพันธ์ระหว่างอายุ อาชีพกับความสามารถในการทำงาน ใช้สหสัมพันธ์พหุคูณ
- เพื่อศึกษาอิทธิพลของอายุกับความสามารถในการทำงาน ใช้การถดถอยอย่างง่าย
- เพื่อศึกษาอิทธิพลของอายุ อาชีพ และรายได้ที่มีผลต่อความสามารถในการทำงาน ใช้การถดถอยพหุคูณ
2) พิจารณาจากจำนวนตัวแปร นักวิจัยต้องพิจารณาว่า มีตัวแปรต้นหรือตัวแปรอิสระ1 ตัวหรือมากกว่า 1 ตัว และตัวแปรตาม 1 ตัวหรือมากกว่า 1 ตัว เช่น นักวิจัยหาความสัมพันธ์ระหว่างตัวแปรอิสระกับตัวแปรตามซึ่งมีอย่างละ 1 ตัว ต้องใช้สหสัมพันธ์อย่างง่าย เป็นต้น
3) พิจารณาจากข้อมูลที่ได้จากการวัด
นักวิจัยต้องพิจารณาว่าข้อมูลที่ได้จากการวัดตัวแปรอยู่ในมาตรวัดแบบใด เช่น ตัวแปรต้นและตัวแปรตาม มีอย่างละ 1 ตัว ข้อมูลที่ได้จากการวัดอยู่ในมาตรวัดแบบอันตรภาค (interval scale)หรืออัตราส่วน ( scale) เช่น อายุ รายได้ ต้องใช้สหสัมพันธ์แบบเพียร์สัน ถ้าข้อมูลที่ได้จากการวัดตัวแปรอยู่ในมาตรวัดแบบจัดอันดับ (ordinal scale) ทั้งคู่ ใช้สหสัมพันธ์แบบจัดอันดับ หรือกรณีข้อมูลที่ได้จากการวัดตัวแปรต้นมีมากกว่า 1 ตัว เช่น เพศ เป็นมาตรวัดแบบนามบัญญัติ (nominal scale) อาชีพ รายได้ เป็นมาตรวัดแบบอันตรภาค และตัวแปรตาม 1 ตัว มีข้อมูลที่ได้จากการวัดอยู่ในมาตรวัดแบบอันตรภาค ใช้สหสัมพันธ์พหุคูณหรือการถดถอยพหุคูณ เป็นต้น
3.2.2 ข้อตกลงเบื้องต้นของการใช้สถิติการวิเคราะห์ความสัมพันธ์
ก. สหสัมพันธ์อย่างง่าย มีข้อตกลงเบื้องต้นดังนี้
1) ตัวแปรอิสระมี 1 ตัวและตัวแปรตาม 1 ตัว
2) ตัวแปรอิสระและตัวแปรตาม มีความสัมพันธ์กันเชิงเส้นตรง
3) ข้อมูลที่ได้จากการวัดตัวแปรอิสระและตัวแปรตามอยู่ในมาตรวัดแบบอันตรภาคขึ้นไป
4) ข้อมูลที่ได้จากการวัดตัวแปรอิสระและตัวแปรตามได้มาโดยการสุ่มและมีการแจกแจงแบบปกติ
ข. สหสัมพันธ์พหุคูณ มีข้อตกลงเบื้องต้น ดังนี้
1) ตัวแปรอิสระมีตั้งแต่ 2 ตัวขึ้นไปและมีตัวแปรตาม 1 ตัว
2) ตัวแปรอิสระและตัวแปรตาม มีความสัมพันธ์กันเชิงเส้นตรง
3) ข้อมูลที่ได้จากการวัด ตัวแปรอิสระและตัวแปรตามอยู่ในมาตรวัดแบบอันตรภาคขึ้นไป
4) ข้อมูลที่ได้จากการวัดตัวแปรอิสระและตัวแปรตามได้มาโดยการสุ่มและมีการแจกแจงแบบปกติ
ค. การถดถอยอย่างง่าย มีข้อตกลงเบื้องต้น ดังนี้
1) ตัวแปรอิสระมี 1 ตัวและตัวแปรตาม 1 ตัว
2) ตัวแปรอิสระและตัวแปรตาม มีความสัมพันธ์กันเชิงเส้นตรง
3) ข้อมูลที่ได้จากการวัด ตัวแปรอิสระและตัวแปรตามอยู่ในมาตรวัดแบบอันตรภาคขึ้นไป
4) ข้อมูลที่ได้จากการวัดตัวแปรอิสระและตัวแปรตามได้มาโดยการสุ่มและมีการแจกแจงแบบปกติ
5) ตัวแปรอิสระสามารถพยากรณ์ค่าของตัวแปรตามได้
ง. การถดถอยพหุคูณ มีข้อตกลงเบื้องต้น ดังนี้
1) ตัวแปรอิสระมีตั้งแต่ 2 ตัวขึ้นไปและมีตัวแปรตาม 1 ตัว
2) ตัวแปรอิสระและตัวแปรตาม มีความสัมพันธ์กันเชิงเส้นตรง
3) ข้อมูลที่ได้จากการวัด ตัวแปรอิสระ อยู่ในมาตรวัดแบบนามบัญญัติหรืออันตรภาค ส่วนตัวแปรตามอยู่ในมาตรวัดแบบอันตรภาคขึ้นไป
4) ข้อมูลที่ได้จากการวัดตัวแปรอิสระและตัวแปรตามได้มาโดยการสุ่มและมีการแจกแจงแบบปกติ
5) ตัวแปรอิสระต่าง ๆ สามารถพยากรณ์ค่าของตัวแปรตามได้
นอกจากนี้ การใช้สถิตินันพาราเมตริก คือ ไค-สแควร์ (chi-square) ก็เป็นสถิติที่นิยมใช้หาความสัมพันธ์ของข้อมูล ใช้ทดสอบความแตกต่างระหว่างความถี่ที่สังกตกับความถี่ที่คาดหวัง กรณีมีกลุ่ม
ตัวอย่างกลุ่มเดียว แต่ถ้ามีกลุ่มตัวอย่าง 2 กลุ่มที่เป็นอิสระจากกันและข้อมูลวัดอยู่ในระดับนามบัญญัติ
นิยมใช้ทดสอบความสัมพันธ์ของตัวแปร ว่ามีความสัมพันธ์กันหรือไม่
การใช้สถิติไคสแควร์ มีข้อตกลงเบื้องต้น ดังนี้ 1) ข้อมูลที่ได้จากการวัดตัวแปรอิสระและตัวแปรตามอยู่ในมาตรวัดแบบนามบัญญัติ หรือข้อมูล ความถี่ 2) การแจกแจงของประชากรไม่จําเป็นต้องเป็นการแจกแจงแบบปกติ
สรุป นักวิจัยต้องมีความรู้ความเข้าใจในการใช้สถิติในการวิจัย จึงจะทำให้เลือกใช้สถิติได้ถูกต้องเหมาะสม ซึ่งทำให้ผลการวิจัยมีความถูกต้อง สอดคล้องกับวัตถุประสงค์ชองการวิจัย