การวิเคราะห์ไคสแควร์ในตารางการจรแบบ 2x2 ถูกนำมาใช้ค่อนข้างแพร่หลายในงานวิจัยทางการแพทย์และสาธารณสุข โดยพบว่าในกรณีที่ความถี่คาดหวังน้อยกว่า 5 จะเลือกใช้ Fishers exact test แต่เมื่อความถี่คาดหวังในเซลล์มีค่าตั้งแต่ 5 ขึ้นไปจะมีการใช้สถิติทดสอบสองวิธีคือ วิธีที่ใช้ค่าปรับแก้ความต่อเนื่องของ Yates กับวิธีไม่ปรับค่าความต่อเนื่องของเพียร์สัน ข้อเสนอแนะเกี่ยวกับเงื่อนไขการใช้สถิติทดสอบทั้งสองในเอกสารและหนังสือทางสถิติ มีหลายอย่าง อาทิเช่น(1-4) 1. ใช้การปรับแก้ความต่อเนื่องของ Yates เมื่อพบว่า ความถี่คาดหวัง (expected frequency)บางกลุ่มมีค่าน้อยกว่า 5 2. ใช้การปรับแก้ความต่อเนื่องของYates เมื่อ 20 ≤ n ≤40 และความถี่คาดหวังทุกตัวมากกว่าหรือเท่ากับ 5 3. ใช้การปรับแก้ความต่อเนื่องของ Yates เมื่อมีความถี่คาดหวังในเซลล์ใดเซลล์หนึ่งอยู่ระหว่าง 5-10 4. ถ้าขนาดตัวอย่างมากกว่าหรือเท่ากับ 50 ไม่จำเป็นต้องปรับค่าไคสแควร์ของเพียร์สัน ข้อเสนอแนะข้างต้นก่อให้เกิดความสับสนและข้อโต้แย้งอย่างมากในทางปฏิบัติเกี่ยวกับเหตุผลหรือความจำเป็นในการตัดสินใจเลือก หรือไม่เลือกใช้วิธีการใดวิธีการหนึ่ง บทความนี้มีวัตถุประสงค์เพื่ออธิบายถึงข้อผิดพลาดและข้อจำกัดของการใช้การปรับแก้ความต่อเนื่องของ Yates ในการวิเคราะห์ข้อมูลในตารางการจรแบบ 2x2 การปรับแก้ความต่อเนื่องของ Yates เกิดจากแนวคิดการปรับค่าข้อมูลแบบไม่ต่อเนื่อง ให้มีความต่อเนื่อง เมื่อถูกประมาณด้วยการแจกแจงแบบต่อเนื่อง นั่นคือ(5) การแจกแจงแบบไคสแควร์เป็นการแจกแจงแบบต่อเนื่อง ส่วนข้อมูลที่เก็บรวบรวมมาเป็นความถี่ เมื่อนำการแจกแจงแบบไคสแควร์ไปประมาณค่าข้อมูลดังกล่าว หากข้อมูลมีขนาดใหญ่สามารถประมาณค่าได้อย่างใกล้เคียง โดยมีวิธีการคำนวณค่า ไคสแควร์จากสูตรของเพียร์สัน ดังนี้(6)

แต่เมื่อข้อมูลมีขนาดเล็ก การประมาณด้วยการแจกแจงแบบไคสแควร์ จะทำให้เกิดการขาดช่วง ของความต่อเนื่องที่ควรจะเป็น ซึ่งทำให้เกิดความลำเอียง (bias) โดยค่าไคสแควร์ที่คำนวณได้มีแนวโน้มที่สูงขึ้น(6,7,9) ดังนั้นเพื่อลดความลำเอียงดังกล่าว จึงได้มีการปรับค่าข้อมูลที่ได้จากตารางการจรแบบ 2x2 โดยการบวกและลบด้วย 0.5 ภายใต้ข้อกำหนดว่าผลรวมในแต่ละแถวและคอลัมน์มีค่าคงที่ (fixed total marginal row and column) ดังตารางที่ 1
 จากสูตรข้างล่าง วิธีปรับแก้ความต่อเนื่องของ Yates คือการนำ 0.5 ไปลบจากผลต่างระหว่างค่าข้อมูลที่สังเกตได้กับค่าความถี่คาดหวัง

การปรับแก้ความต่อเนื่องของ Yates เป็น conservative test เนื่องจากค่าไคสแควร์ที่คำนวณได้เป็นค่าที่ค่อนข้างต่ำ ทำให้ p-value มีค่าสูง (โอกาสที่จะปฏิเสธสมมติฐาน H0 มีน้อยลง) และความผิดพลาดประเภทที่ 1 (type I error) ลดลง ขณะที่ความผิดพลาดประเภทที่ 2 (type II error) มีค่าเพิ่มขึ้น(10- 12) เอกสารและบทความทางวิชาการส่วนใหญ่แสดงความคิดเห็นและแนะนำว่า การปรับแก้ความต่อเนื่องของ Yates เป็นวิธีการที่ไม่เหมาะสมในการวิเคราะห์ตารางการจรแบบ 2x2 เมื่อความถี่คาดหวังในเซลล์มีค่าตั้งแต่ 5 ขึ้นไป(7,14) ด้วยเหตุผลต่างๆ ซึ่งสามารถสรุปได้ 4 ประเด็นดังนี้
ประเด็นที่ 1 รูปแบบตารางการจรแบบ 2x2 ที่เป็นไปได้มี 3 รูปแบบ(8) คือ 1. รูปแบบที่นักวิจัยกำหนดผลรวมความถี่ในแต่ละแถวและคอลัมน์ (n1, n2, m1, m2) ให้มีค่าคงที่ล่วงหน้า ซึ่งในทางปฏิบัติจะพบแบบนี้ไม่บ่อยนัก 2. รูปแบบที่นักวิจัยกำหนดผลรวมความถี่ในแต่ละแถวหรือคอลัมน์ให้มีค่าคงที่ล่วงหน้า (n1, n2 คงที่ หรือ m1, m2 คงที่) ซึ่งเป็นการทดสอบความเป็นเอกพันธ์ (test of homo¬genei¬ty) ตัวอย่างเช่น การกำหนดจำนวนผู้ป่วยกับผู้ไม่ป่วยให้คงที่ ส่วนการได้รับหรือไม่ได้รับปัจจัยเสี่ยงจะมีค่าได้อย่างอิสระ เป็นต้น 3. รูปแบบที่นักวิจัยให้ผลรวมความถี่ในแต่ละแถวและคอลัมน์เป็นอิสระ (n1, n2 และ m1, m2 เป็นอิสระ) ซึ่งเป็นการทดสอบความเป็นอิสระ (test of independence) รูปแบบนี้พบบ่อยในงานวิจัยทางการแพทย์และสาธารณสุข ตัวอย่างเช่น นักวิจัยกำหนดขนาดตัวอย่าง 50 คน เก็บตัวแปร 2 ตัวแปรคือการป่วยและการได้รับปัจจัยเสี่ยง ดังนั้นผลรวมในแต่ละแถวและคอลัมน์จึงมีค่าได้อย่างอิสระ แต่อยู่ภายใต้ขนาดตัวอย่างที่ระบุไว้คือ 50 เป็นต้น
ประเด็นที่ 2 ในตารางรูปแบบที่ 1 (n1, n2, m1, m2 มีค่าคงที่) p-value ที่ได้จากการปรับแก้ความต่อเนื่องของ Yates เป็นค่าประมาณที่ใกล้เคียงกับ p-value ที่ได้จาก Fishers exact test(14, 17) เนื่องจากวิธีการปรับแก้ความต่อเนื่องของ Yates มีรากฐานมาจากทฤษฎีของ Euler-Maclaurin(13) ที่ใช้ประมาณค่าการแจกแจงแบบทวินามและไฮเปอร์จิออเมตริก และต่อมาได้ถูกพัฒนาขึ้นมาใช้ในการประมาณค่าสถิติไคส-แควร์ของเพียร์สัน โดยมุ่งเน้นในการวิเคราะห์ตารางการจร ในตารางรูปแบบที่ 2 และ 3 การใช้ค่าปรับแก้ความต่อเนื่องของ Yates จะเป็นวิธีการที่ไม่เหมาะสม เนื่องจากในการศึกษาโดยใช้แบบจำลองข้อมูลของ Monte Carlo พบว่า เมื่อไม่กำหนดให้ผลรวมความถี่ในแถวและคอลัมน์มีค่าคงที่ การใช้ค่าปรับแก้ความต่อเนื่องของ Yates จะทำให้เกิด overcorrection(15) และการทดสอบทางสถิติ เป็น conservative
ประเด็นที่ 3 การปรับแก้ความต่อเนื่องของ Yates เป็นวิธีการที่เหมาะสมสำหรับการทดสอบสมมติฐานแบบทางเดียว (one-sided test) เท่านั้น เนื่องจากเป็นการเปรียบเทียบค่าสังเกตที่เกิดขึ้นกับ ค่าที่เป็นจริงตามทฤษฎีของตารางการจรในทิศทางเดียวกัน ในการทดสอบสมมติฐานแบบสองทาง (two-sided test) การปรับแก้ความต่อเนื่องของ Yates จะนำไปสู่การเกิด overcorrection และ conservative อย่างเป็นระบบ(13) เนื่องจากในตารางรูปแบบที่ 2 และ 3 การทดสอบสมมติฐานส่วนใหญ่จะกำหนดเป็น two-tailed เพื่อต้องการหาความเป็นเอกพันธ์และความเป็นอิสระ ดังนั้นเมื่อนำวิธีการปรับแก้ความต่อเนื่องของ Yates มาใช้ จึงเป็นวิธีการที่ไม่เหมาะสม
ประเด็นที่ 4 การศึกษาเกี่ยวกับการปรับแก้ความต่อเนื่องโดย Pearson (1947), Mote, Pavate, และ Anderson(1958), Plackett(1964) และ Conover(1968, 1974) ซึ่ง Fleiss ได้สรุปและแนะนำว่า(16) การปรับแก้ความต่อเนื่องของ Yates ไม่ควรถูกนำมาใช้ด้วยเหตุผลว่า p-value มีค่ามากขึ้น, แต่อำนาจในการทดสอบ (power) จะลดลงด้วย นั่นคือ เป็นการลดความน่าจะเป็นที่จะพบความสัมพันธ์จริงหรือความแตกต่างจริง Camilli และ Hopkins ได้ทำการศึกษาโดยจำลองข้อมูลภายใต้แบบแผนงานวิจัยที่แตกต่างกัน พบว่า(7) การใช้วิธีการปรับแก้ความต่อเนื่องของ Yates ทำให้ type I error ที่ได้ ต่ำกว่า significance level (α) ที่กำหนด เมื่อใช้การทดสอบไคสแควร์แบบธรรมดาของเพียร์สันเพื่อทดสอบความเป็นอิสระและความเป็น เอกพันธ์ และไม่มีความจำเป็นในการใช้วิธีดังกล่าวเลย เนื่องจากโดยทั่วไปค่าสถิติไคสแควร์ของเพียร์สัน สามารถควบคุมโอกาสของการเกิด type I errorได้ดีเพียงพอ โดยไม่มี conservative bias เหมือนผลที่ได้จากการปรับแก้ความต่อเนื่องของ Yates สรุปและข้อเสนอแนะ 1. ในกรณีที่ค่าความถี่คาดหวังในเซลล์น้อยกว่า 5 ควรเลือกใช้วิธีการทดสอบของ Fishers exact test 2. ในกรณีที่ค่าความถี่คาดหวังในเซลล์ตั้งแต่ 5 ขึ้นไป ควรเลือกใช้สถิติทดสอบไคส-แควร์ที่ไม่ปรับค่าของเพียร์สัน และไม่ควรใช้วิธีการปรับแก้ความต่อเนื่องของ Yates 3. การทดสอบสมมติฐานแบบสองทางเพื่อทดสอบความเป็นอิสระและความเป็นเอกพันธ์ ไม่ควรใช้การปรับแก้ความต่อเนื่องของ Yates เนื่องจากทำให้เกิด conservative bias และส่งผลให้โอกาสในการปฏิเสธสมมติฐาน H0 มีน้อยลง ทำให้การสรุปผลจากการวิเคราะห์มีความผิดพลาดได้
กิตติกรรมประกาศ ผู้เขียนขอขอบคุณ รองศาสตราจารย์อรุณ จิรวัฒน์กุล ผู้จุดประเด็นและได้กรุณาสละเวลาอ่านต้นฉบับ พร้อมให้คำแนะนำและข้อเสนอแนะที่เป็นประโยชน์อย่างยิ่งในการเขียนบทความ และผู้ช่วยศาสตราจารย์ ดร.กฤษณา ยอดมงคล ที่ช่วยให้คำปรึกษาด้านข้อมูลด้วยดีตลอดมา
เอกสารอ้างอิง 1. บุญธรรม กิจปรีดาบริสุทธิ์. สถิติวิเคราะห์เพื่อการวิจัย. กรุงเทพมหานคร: จามจุรีโปรดักท์, 2546. หน้า 248. 2. วิสาข์ เกษประทุม. สถิตินอนพาราเมตริก. กรุงเทพ¬มหานคร: พ.ศ.พัฒนา, 2545. หน้า 89-90. 3. ประทักษ์ โอประเสริฐสวัสดิ์, บรรณาธิการ. วิจัยทางคลินิก. กรุงเทพมหานคร: โฮลิสติกพับลิชชิ่ง จำกัด, 2538. หน้า 97. 4. กัลยา วานิชย์บัญชา. การวิเคราะห์สถิติ: สถิติสำหรับการบริหารและวิจัย. กรุงเทพมหานคร: โรงพิมพ์จุฬาลงกรณ์มหาวิทยาลัย, 2539. หน้า 206. 5. วีนัส พีชวณิชย์, สมจิต วัฒนาชยากูล, เบญจมาศ ตุลยนิติกุล. สถิติพื้นฐานสำหรับนักสังคมศาสตร์. กรุงเทพมหานคร: ประกายพรึก, 2547. หน้า 479. 6. Yates F. Tests of significance for 22 Contin¬gency Tables. Journal of the Royal Statistical Society, Series A. 1984;147-429. 7. Haviland MG. Yatess correction for continuity and the analysis of 22 contingency tables. (With discussion). Statistics in Medicine 1990; 9:364-83. 8. Richardson J. The analysis of 21 and 22 contingency tables:an historical review. Statis¬ti¬cal Methods in Medical Research 1994;3:107-33. 9. Daya S. Yates continuity correction. Evidence-Based Obstetrics and Gynecology 2001;3:169. 10. Driscoll P, Lecky F. Article 8. An introduction to hypothesis testing. Non-parametric compari¬son of two groups 1. Emergency Medicine Journal 2001;18:281. 11. Rosner B. Fundamentals of Statistics. Massa¬chu¬setts: PWS-KENT; 1989. p. 330. 12. Kimberly E, Tello R, Jun Ying. Hypothesis testing III: count and medians. Radiology 2003;228:604. 13. Stefanescu C, Berger VW, Hershberger S. Yatess continuity correction.[Web Page]2004; Available at http://faculty.london.edu/cstefanescu/ research.html (Accessed 2004 Nov 16). 14. DAgostino RB, Chase W, Belanger A. The appropriateness of some common procedures for testing the equality of two independent binomial populations. American Statistician 1988;42:198-202. 15. Conover WJ. Practical Nonparametric Statistics. New York: John Willey & Sons, 1980. p. 149. 16. Joseph LF. Statistical method for rates and proportions. New York: John Willey & Sons, 1981. p. 27. 17. Agresti A. Analysis of ordinal categorical data. New York: John Willey & Sons, 1984. p. 28. |