Untitled Document
 
 
 
 
Untitled Document
Home
Current issue
Past issues
Topic collections
Search
e-journal Editor page

IS YATES CONTINUITY CORRECTION NECESSARY FOR CHI-SQUARE

จําเป็นหรือไม่….? ที่ไคสแควร์ ต้องใช้ค่าปรับแก้ความตอเนื่องของ Yates

Pongdech Sarakarn (พงษ์เดช สารการ) 1




การวิเคราะห์ไคสแควร์ในตารางการจรแบบ 2x2 ถูกนำมาใช้ค่อนข้างแพร่หลายในงานวิจัยทางการแพทย์และสาธารณสุข โดยพบว่าในกรณีที่ความถี่คาดหวังน้อยกว่า 5 จะเลือกใช้ Fisher’s exact test แต่เมื่อความถี่คาดหวังในเซลล์มีค่าตั้งแต่ 5 ขึ้นไปจะมีการใช้สถิติทดสอบสองวิธีคือ วิธีที่ใช้ค่าปรับแก้ความต่อเนื่องของ Yates กับวิธีไม่ปรับค่าความต่อเนื่องของเพียร์สัน ข้อเสนอแนะเกี่ยวกับเงื่อนไขการใช้สถิติทดสอบทั้งสองในเอกสารและหนังสือทางสถิติ มีหลายอย่าง อาทิเช่น(1- 4)
1.ใช้การปรับแก้ความต่อเนื่องของ Yates เมื่อพบว่า ความถี่คาดหวัง (expected frequency)บางกลุ่มมีค่าน้อยกว่า 5
2.ใช้การปรับแก้ความต่อเนื่องของYates เมื่อ 20 ≤ n ≤ 40 และความถี่คาดหวังทุกตัวมากกว่าหรือเท่ากับ 5
3.ใช้การปรับแก้ความต่อเนื่องของ Yates เมื่อมีความถี่คาดหวังในเซลล์ใดเซลล์หนึ่งอยู่ระหว่าง 5-10
4.ถ้าขนาดตัวอย่างมากกว่าหรือเท่ากับ 50 ไม่จำเป็นต้องปรับค่าไคสแควร์ของเพียร์สัน
ข้อเสนอแนะข้างต้นก่อให้เกิดความสับสนและข้อโต้แย้งอย่างมากในทางปฏิบัติเกี่ยวกับเหตุผลหรือความจำเป็นในการตัดสินใจเลือก หรือไม่เลือกใช้วิธีการใดวิธีการหนึ่ง บทความนี้มีวัตถุประสงค์เพื่ออธิบายถึงข้อผิดพลาดและข้อจำกัดของการใช้การปรับแก้ความต่อเนื่องของ Yates ในการวิเคราะห์ข้อมูลในตารางการจรแบบ 2x2
การปรับแก้ความต่อเนื่องของ Yates เกิดจากแนวคิดการปรับค่าข้อมูลแบบไม่ต่อเนื่อง ให้มีความต่อเนื่อง เมื่อถูกประมาณด้วยการแจกแจงแบบต่อเนื่อง นั่นคือ(5) การแจกแจงแบบไคสแควร์เป็นการแจกแจงแบบต่อเนื่อง ส่วนข้อมูลที่เก็บรวบรวมมาเป็นความถี่ เมื่อนำการแจกแจงแบบไคสแควร์ไปประมาณค่าข้อมูลดังกล่าว หากข้อมูลมีขนาดใหญ่สามารถประมาณค่าได้อย่างใกล้เคียง โดยมีวิธีการคำนวณค่า ไคสแควร์จากสูตรของเพียร์สัน ดังนี้(6)

     การวิเคราะห์ไคสแควร์ในตารางการจรแบบ 2x2 ถูกนำมาใช้ค่อนข้างแพร่หลายในงานวิจัยทางการแพทย์และสาธารณสุข โดยพบว่าในกรณีที่ความถี่คาดหวังน้อยกว่า 5 จะเลือกใช้ Fisher’s exact test แต่เมื่อความถี่คาดหวังในเซลล์มีค่าตั้งแต่ 5 ขึ้นไปจะมีการใช้สถิติทดสอบสองวิธีคือ วิธีที่ใช้ค่าปรับแก้ความต่อเนื่องของ Yates กับวิธีไม่ปรับค่าความต่อเนื่องของเพียร์สัน ข้อเสนอแนะเกี่ยวกับเงื่อนไขการใช้สถิติทดสอบทั้งสองในเอกสารและหนังสือทางสถิติ มีหลายอย่าง อาทิเช่น(1-4)
1. ใช้การปรับแก้ความต่อเนื่องของ Yates เมื่อพบว่า ความถี่คาดหวัง (expected frequency)บางกลุ่มมีค่าน้อยกว่า 5
2. ใช้การปรับแก้ความต่อเนื่องของYates เมื่อ 20 n 40 และความถี่คาดหวังทุกตัวมากกว่าหรือเท่ากับ 5
3. ใช้การปรับแก้ความต่อเนื่องของ Yates เมื่อมีความถี่คาดหวังในเซลล์ใดเซลล์หนึ่งอยู่ระหว่าง 5-10
4. ถ้าขนาดตัวอย่างมากกว่าหรือเท่ากับ 50 ไม่จำเป็นต้องปรับค่าไคสแควร์ของเพียร์สัน
      ข้อเสนอแนะข้างต้นก่อให้เกิดความสับสนและข้อโต้แย้งอย่างมากในทางปฏิบัติเกี่ยวกับเหตุผลหรือความจำเป็นในการตัดสินใจเลือก หรือไม่เลือกใช้วิธีการใดวิธีการหนึ่ง บทความนี้มีวัตถุประสงค์เพื่ออธิบายถึงข้อผิดพลาดและข้อจำกัดของการใช้การปรับแก้ความต่อเนื่องของ Yates ในการวิเคราะห์ข้อมูลในตารางการจรแบบ 2x2
      การปรับแก้ความต่อเนื่องของ Yates เกิดจากแนวคิดการปรับค่าข้อมูลแบบไม่ต่อเนื่อง ให้มีความต่อเนื่อง เมื่อถูกประมาณด้วยการแจกแจงแบบต่อเนื่อง นั่นคือ(5) การแจกแจงแบบไคสแควร์เป็นการแจกแจงแบบต่อเนื่อง ส่วนข้อมูลที่เก็บรวบรวมมาเป็นความถี่ เมื่อนำการแจกแจงแบบไคสแควร์ไปประมาณค่าข้อมูลดังกล่าว หากข้อมูลมีขนาดใหญ่สามารถประมาณค่าได้อย่างใกล้เคียง โดยมีวิธีการคำนวณค่า ไคสแควร์จากสูตรของเพียร์สัน ดังนี้(6)

     แต่เมื่อข้อมูลมีขนาดเล็ก การประมาณด้วยการแจกแจงแบบไคสแควร์ จะทำให้เกิดการขาดช่วง ของความต่อเนื่องที่ควรจะเป็น ซึ่งทำให้เกิดความลำเอียง (bias) โดยค่าไคสแควร์ที่คำนวณได้มีแนวโน้มที่สูงขึ้น(6,7,9)  ดังนั้นเพื่อลดความลำเอียงดังกล่าว จึงได้มีการปรับค่าข้อมูลที่ได้จากตารางการจรแบบ 2x2 โดยการบวกและลบด้วย 0.5 ภายใต้ข้อกำหนดว่าผลรวมในแต่ละแถวและคอลัมน์มีค่าคงที่ (fixed total marginal row and column) ดังตารางที่ 1


     จากสูตรข้างล่าง วิธีปรับแก้ความต่อเนื่องของ Yates คือการนำ 0.5 ไปลบจากผลต่างระหว่างค่าข้อมูลที่สังเกตได้กับค่าความถี่คาดหวัง

     การปรับแก้ความต่อเนื่องของ Yates เป็น conservative test เนื่องจากค่าไคสแควร์ที่คำนวณได้เป็นค่าที่ค่อนข้างต่ำ ทำให้ p-value มีค่าสูง (โอกาสที่จะปฏิเสธสมมติฐาน H0 มีน้อยลง) และความผิดพลาดประเภทที่ 1 (type I error) ลดลง ขณะที่ความผิดพลาดประเภทที่ 2 (type II error) มีค่าเพิ่มขึ้น(10- 12)
เอกสารและบทความทางวิชาการส่วนใหญ่แสดงความคิดเห็นและแนะนำว่า การปรับแก้ความต่อเนื่องของ Yates เป็นวิธีการที่ไม่เหมาะสมในการวิเคราะห์ตารางการจรแบบ 2x2 เมื่อความถี่คาดหวังในเซลล์มีค่าตั้งแต่ 5 ขึ้นไป(7,14) ด้วยเหตุผลต่างๆ ซึ่งสามารถสรุปได้ 4 ประเด็นดังนี้

     ประเด็นที่ 1 รูปแบบตารางการจรแบบ 2x2 ที่เป็นไปได้มี 3 รูปแบบ(8) คือ
1. รูปแบบที่นักวิจัยกำหนดผลรวมความถี่ในแต่ละแถวและคอลัมน์ (n1, n2, m1, m2) ให้มีค่าคงที่ล่วงหน้า ซึ่งในทางปฏิบัติจะพบแบบนี้ไม่บ่อยนัก
2. รูปแบบที่นักวิจัยกำหนดผลรวมความถี่ในแต่ละแถวหรือคอลัมน์ให้มีค่าคงที่ล่วงหน้า (n1, n2 คงที่ หรือ m1, m2 คงที่) ซึ่งเป็นการทดสอบความเป็นเอกพันธ์ (test of homo¬genei¬ty) ตัวอย่างเช่น การกำหนดจำนวนผู้ป่วยกับผู้ไม่ป่วยให้คงที่ ส่วนการได้รับหรือไม่ได้รับปัจจัยเสี่ยงจะมีค่าได้อย่างอิสระ เป็นต้น
3. รูปแบบที่นักวิจัยให้ผลรวมความถี่ในแต่ละแถวและคอลัมน์เป็นอิสระ (n1, n2 และ m1, m2 เป็นอิสระ) ซึ่งเป็นการทดสอบความเป็นอิสระ (test of independence) รูปแบบนี้พบบ่อยในงานวิจัยทางการแพทย์และสาธารณสุข ตัวอย่างเช่น นักวิจัยกำหนดขนาดตัวอย่าง 50 คน เก็บตัวแปร 2 ตัวแปรคือการป่วยและการได้รับปัจจัยเสี่ยง ดังนั้นผลรวมในแต่ละแถวและคอลัมน์จึงมีค่าได้อย่างอิสระ แต่อยู่ภายใต้ขนาดตัวอย่างที่ระบุไว้คือ 50 เป็นต้น

     ประเด็นที่ 2 ในตารางรูปแบบที่ 1 (n1, n2, m1, m2 มีค่าคงที่) p-value ที่ได้จากการปรับแก้ความต่อเนื่องของ Yates เป็นค่าประมาณที่ใกล้เคียงกับ p-value ที่ได้จาก Fisher’s exact test(14, 17) เนื่องจากวิธีการปรับแก้ความต่อเนื่องของ Yates มีรากฐานมาจากทฤษฎีของ Euler-Maclaurin(13) ที่ใช้ประมาณค่าการแจกแจงแบบทวินามและไฮเปอร์จิออเมตริก และต่อมาได้ถูกพัฒนาขึ้นมาใช้ในการประมาณค่าสถิติไคส-แควร์ของเพียร์สัน โดยมุ่งเน้นในการวิเคราะห์ตารางการจร
 ในตารางรูปแบบที่ 2 และ 3 การใช้ค่าปรับแก้ความต่อเนื่องของ Yates จะเป็นวิธีการที่ไม่เหมาะสม เนื่องจากในการศึกษาโดยใช้แบบจำลองข้อมูลของ Monte Carlo พบว่า เมื่อไม่กำหนดให้ผลรวมความถี่ในแถวและคอลัมน์มีค่าคงที่ การใช้ค่าปรับแก้ความต่อเนื่องของ Yates จะทำให้เกิด overcorrection(15) และการทดสอบทางสถิติ เป็น conservative

     ประเด็นที่ 3 การปรับแก้ความต่อเนื่องของ Yates เป็นวิธีการที่เหมาะสมสำหรับการทดสอบสมมติฐานแบบทางเดียว (one-sided test) เท่านั้น เนื่องจากเป็นการเปรียบเทียบค่าสังเกตที่เกิดขึ้นกับ ค่าที่เป็นจริงตามทฤษฎีของตารางการจรในทิศทางเดียวกัน ในการทดสอบสมมติฐานแบบสองทาง (two-sided test) การปรับแก้ความต่อเนื่องของ Yates จะนำไปสู่การเกิด overcorrection และ conservative อย่างเป็นระบบ(13) เนื่องจากในตารางรูปแบบที่ 2 และ 3 การทดสอบสมมติฐานส่วนใหญ่จะกำหนดเป็น two-tailed เพื่อต้องการหาความเป็นเอกพันธ์และความเป็นอิสระ ดังนั้นเมื่อนำวิธีการปรับแก้ความต่อเนื่องของ Yates มาใช้ จึงเป็นวิธีการที่ไม่เหมาะสม

     ประเด็นที่ 4 การศึกษาเกี่ยวกับการปรับแก้ความต่อเนื่องโดย Pearson (1947), Mote, Pavate, และ Anderson(1958), Plackett(1964) และ Conover(1968, 1974) ซึ่ง Fleiss ได้สรุปและแนะนำว่า(16) การปรับแก้ความต่อเนื่องของ Yates ไม่ควรถูกนำมาใช้ด้วยเหตุผลว่า p-value มีค่ามากขึ้น, แต่อำนาจในการทดสอบ (power) จะลดลงด้วย นั่นคือ เป็นการลดความน่าจะเป็นที่จะพบความสัมพันธ์จริงหรือความแตกต่างจริง Camilli และ Hopkins ได้ทำการศึกษาโดยจำลองข้อมูลภายใต้แบบแผนงานวิจัยที่แตกต่างกัน พบว่า(7) การใช้วิธีการปรับแก้ความต่อเนื่องของ Yates ทำให้ type I error ที่ได้ ต่ำกว่า significance level (α) ที่กำหนด เมื่อใช้การทดสอบไคสแควร์แบบธรรมดาของเพียร์สันเพื่อทดสอบความเป็นอิสระและความเป็น
เอกพันธ์ และไม่มีความจำเป็นในการใช้วิธีดังกล่าวเลย เนื่องจากโดยทั่วไปค่าสถิติไคสแควร์ของเพียร์สัน สามารถควบคุมโอกาสของการเกิด type I errorได้ดีเพียงพอ โดยไม่มี conservative bias เหมือนผลที่ได้จากการปรับแก้ความต่อเนื่องของ Yates
 
สรุปและข้อเสนอแนะ
1. ในกรณีที่ค่าความถี่คาดหวังในเซลล์น้อยกว่า 5 ควรเลือกใช้วิธีการทดสอบของ Fisher’s exact test
2. ในกรณีที่ค่าความถี่คาดหวังในเซลล์ตั้งแต่ 5 ขึ้นไป ควรเลือกใช้สถิติทดสอบไคส-แควร์ที่ไม่ปรับค่าของเพียร์สัน และไม่ควรใช้วิธีการปรับแก้ความต่อเนื่องของ Yates
3. การทดสอบสมมติฐานแบบสองทางเพื่อทดสอบความเป็นอิสระและความเป็นเอกพันธ์ ไม่ควรใช้การปรับแก้ความต่อเนื่องของ Yates เนื่องจากทำให้เกิด conservative bias และส่งผลให้โอกาสในการปฏิเสธสมมติฐาน H0 มีน้อยลง ทำให้การสรุปผลจากการวิเคราะห์มีความผิดพลาดได้

กิตติกรรมประกาศ
      ผู้เขียนขอขอบคุณ รองศาสตราจารย์อรุณ จิรวัฒน์กุล ผู้จุดประเด็นและได้กรุณาสละเวลาอ่านต้นฉบับ พร้อมให้คำแนะนำและข้อเสนอแนะที่เป็นประโยชน์อย่างยิ่งในการเขียนบทความ และผู้ช่วยศาสตราจารย์ ดร.กฤษณา ยอดมงคล ที่ช่วยให้คำปรึกษาด้านข้อมูลด้วยดีตลอดมา

เอกสารอ้างอิง
 1. บุญธรรม กิจปรีดาบริสุทธิ์. สถิติวิเคราะห์เพื่อการวิจัย. กรุงเทพมหานคร: จามจุรีโปรดักท์, 2546. หน้า 248.
 2. วิสาข์ เกษประทุม. สถิตินอนพาราเมตริก. กรุงเทพ¬มหานคร: พ.ศ.พัฒนา, 2545. หน้า 89-90.
 3. ประทักษ์ โอประเสริฐสวัสดิ์, บรรณาธิการ. วิจัยทางคลินิก. กรุงเทพมหานคร: โฮลิสติกพับลิชชิ่ง จำกัด, 2538. หน้า 97.
 4. กัลยา วานิชย์บัญชา. การวิเคราะห์สถิติ: สถิติสำหรับการบริหารและวิจัย. กรุงเทพมหานคร: โรงพิมพ์จุฬาลงกรณ์มหาวิทยาลัย, 2539. หน้า 206.
 5. วีนัส พีชวณิชย์, สมจิต วัฒนาชยากูล, เบญจมาศ ตุลยนิติกุล. สถิติพื้นฐานสำหรับนักสังคมศาสตร์. กรุงเทพมหานคร: ประกายพรึก, 2547. หน้า 479.
6. Yates F. Tests of significance for 22 Contin¬gency Tables. Journal of the Royal Statistical Society, Series A. 1984;147-429.
 7. Haviland MG. Yates’s correction for continuity and the analysis of 22 contingency tables. (With discussion). Statistics in Medicine 1990; 9:364-83.
 8. Richardson J. The analysis of 21 and 22 contingency tables:an historical review. Statis¬ti¬cal Methods in Medical Research 1994;3:107-33.
 9. Daya S. Yates’ continuity correction. Evidence-Based Obstetrics and Gynecology 2001;3:169.
 10. Driscoll P, Lecky F. Article 8. An introduction to hypothesis testing. Non-parametric compari¬son of two groups 1. Emergency Medicine Journal 2001;18:281.
 11. Rosner B. Fundamentals of Statistics. Massa¬chu¬setts: PWS-KENT; 1989. p. 330.
 12. Kimberly E, Tello R, Jun Ying. Hypothesis testing III: count and medians. Radiology 2003;228:604.
 13. Stefanescu C, Berger VW, Hershberger S. Yates’s continuity correction.[Web Page]2004; Available at
http://faculty.london.edu/cstefanescu/ research.html (Accessed 2004 Nov 16).
 14. D’Agostino RB, Chase W, Belanger A. The appropriateness of some common procedures for testing the equality of two independent binomial populations. American Statistician 1988;42:198-202.
 15. Conover WJ. Practical Nonparametric Statistics. New York: John Willey & Sons, 1980. p. 149.
 16. Joseph LF. Statistical method for rates and proportions. New York: John Willey & Sons, 1981. p. 27.
17. Agresti A. Analysis of ordinal categorical data. New York: John Willey & Sons, 1984. p. 28.

Untitled Document
Article Location
Volume 1 Number 1

Untitled Document
Article Option
       Abstract
       Fulltext
       PDF File
Untitled Document
 
ทำหน้าที่ ดึง Collection ที่เกี่ยวข้อง แสดง บทความ ตามที่ีมีใน collection ที่มีใน list Untitled Document
Another articles
in this topic collection

Sample size calculation for multiple linear regression: Testing Hypothesis and Estimation (การคำนวณขนาดตัวอย่างสำหรับงานวิจัยที่ใช้ตัวแบบการถดถอยพหุในการวิเคราะห์ข้อมูล:บนพื้นฐานการทดสอบสมมติฐานและการประมาณค่า)
 
Data analysis for multi-center study: ways to handle "center"? (แนวทางการวิเคราะห์ข้อมูลจากการวิจัยสหสถาบัน: จัดการอย่างไรกับตัวแปร "สถาบัน"?)
 
Post hoc Power Calculation is never justified. (การคำนวณ Power หลังจากผลการวิจัยออกมาแล้ว เป็นเรื่องไม่มีเหตุผลที่จะทำ)
 
ANALYSIS of 2x2 CROSSOVER DESIGN WITH CONTINUOUS DATA (ANALYSIS of 2x2 CROSSOVER DESIGN WITH CONTINUOUS DATA)
 
<More>
Untitled Document
 
This article is under
this collection.

Statistics
 
 
 
 
Copyright © 2006. Data Management & Biostatistics Journal.. All Rights Reserved
 
 
 
 

 


Warning: Unknown: Your script possibly relies on a session side-effect which existed until PHP 4.2.3. Please be advised that the session extension does not consider global variables as a source of data, unless register_globals is enabled. You can disable this functionality and this warning by setting session.bug_compat_42 or session.bug_compat_warn to off, respectively in Unknown on line 0