บทนำ
การทดสอบความสมมูล (Equivalence trial) ระหว่างกรรมวิธีใหม่ (New treatment) กับกรรมวิธีมาตรฐาน (Standard treatment) หรือการศึกษาเพื่อเทียบเคียงความเหมือนระหว่างวิธีการรักษาใหม่กับกลุ่มที่ไม่ได้รับการรักษา (Placebo control) โดยมีจุดประสงค์เพื่อที่จะศึกษาหาแนวทางการรักษาโรคที่ก่อให้เกิดผลข้างเคียงจากการรักษาน้อยที่สุด และ/หรือหาแนวทางในการรักษาที่สามารถปฏิบัติได้ง่ายขึ้นและเสียค่าใช้จ่ายในการรักษาน้อยลง แต่ความสามารถหรือคุณสมบัติในการรักษายังคงมีประสิทธิภาพเหมือนกับวิธีการรักษามาตรฐานที่ใช้อยู่ [1 2] อย่างไรก็ตาม ในการประมวลผลทางสถิติคลาสสิก (Classical analysis) ส่วนใหญ่มักจะมุ่งเน้นไปในการทดสอบเพื่อเปรียบเทียบความแตกต่างระหว่าง 2 กลุ่มตัวอย่างที่ทำการศึกษา เพื่อให้ได้ผลสรุปว่า มีความแตกต่างกันอย่างมีนัยสำคัญ (Significant difference) มากกว่าจะหาผลสรุปว่ามีความสมมูลกันอย่างเหมาะสม (Practical equivalence) [3] จึงได้มีการศึกษามากมายที่พยายามจะคิดค้นและเสนอวิธีการวิเคราะห์ทางสถิติที่สอดคล้องกับเป้าหมายของการทดสอบความสมมูล [4 7] แต่ในงานวิจัยเหล่านี้คงมุ่งเน้นเฉพาะการศึกษาและค้นคว้าวิธีการวิเคราะห์ทางสถิติที่เหมาะสมเพื่อทดสอบความสมมูลระหว่าง 2 กลุ่มศึกษาตามลักษณะของข้อมูลในแต่ละประเภท เช่น ข้อมูลเชิงปริมาณ ข้อมูลเชิงคุณภาพ ข้อมูลที่ไม่ทราบค่าที่ชัดเจน (Censored data) เป็นต้น นอกจากการเปรียบเทียบความสมมูลระหว่างกรรมวิธีที่สนใจกับกรรมวิธีมาตรฐาน ผู้วิจัยอาจต้องการเปรียบเทียบความสมมูลระหว่างกรรมวิธีมากกว่า 2 กลุ่มก็สามารถทำได้ รวมถึงการเปรียบเทียบระหว่างปัจจัย 2 ปัจจัย โดยในแต่ละปัจจัยจำแนกออกเป็น 2 ระดับ ซึ่งเป็นลักษณะของการทดลองแบบแฟกทอเรียล 2x2 ในการศึกษาครั้งนี้จึงมีจุดมุ่งหมายที่จะศึกษาวิธีการวิเคราะห์ทางสถิติรวมไปถึงการหาขนาดของตัวอย่างที่เหมาะสมสำหรับการวิเคราะห์ความสมมูลกรณีวางแผนการทดลองแบบแฟกทอเรียล 2x2
หลักการเบื้องต้นของการทดสอบความสมมูล [7] การวิจัยเพื่อต้องการสรุปการทดสอบความสมมูลระหว่างกรรมวิธี 2 กรรมวิธีไม่สามารถดำเนินการภายใต้ลักษณะการทดสอบสมมติฐานทางสถิติคลาสสิก ทั้งนี้เนื่องด้วยในการทดสอบสมมติฐานทางสถิติคลาสสิกเป็นการมุ่งทำการทดสอบภายใต้สมมติฐานว่าง H0: mA - mB = 0 เทียบกับสมมติฐานทางเลือก H1: mA - mB ≠0 เมื่อกำหนด mA และ mB แทนค่าเฉลี่ยของกรรมวิธี A และ B ตามลำดับ โดยในขั้นตอนของการทดสอบความแตกต่างระหว่างกรรมวิธีทั้งสองจะอาศัยค่าเฉลี่ยของตัวอย่าง 2 กลุ่ม ( และ แทนค่าเฉลี่ยของตัวอย่างภายใต้กรรมวิธี A และ B ตามลำดับ) ซึ่งสามารถพิจารณาใช้ตัวสถิติ (เมื่อ คือค่าส่วนเบี่ยงเบนมาตรฐานของผลต่างระหว่างค่าเฉลี่ยของทั้ง 2 กรรมวิธี) สำหรับทำการทดสอบเปรียบเทียบความแตกต่างระหว่างกรรมวิธี 2 กรรมวิธีว่ามีความแตกต่างกันอย่างมีนัยสำคัญหรือไม่ หากผลการทดสอบพบว่า ปฏิเสธสมมติฐาน H0 จะทำให้สามารถกล่าวได้ว่ากรรมวิธีทั้งสองมีความแตกต่างกันอย่างมีนัยสำคัญทางสถิติ แต่ในกรณีที่ผลการทดสอบพบว่า ไม่สามารถปฏิเสธสมมติฐาน H0 จะสามารถกล่าวได้เพียงว่า จากข้อมูลที่ศึกษาไม่สามารถสรุปได้ว่ากรรมวิธีทั้งสองแตกต่างกัน โดยที่ยังไม่สามารถสรุปได้ว่ากรรมวิธีทั้งสองสมมูลกันหรือเหมือนกันอย่างมีนัยสำคัญทางสถิติ ทั้งนี้เพราะกรรมวิธีทั้งสองอาจมีค่าเฉลี่ยแตกต่างกัน เพียงแต่ยังไม่มากพอที่จะสามารถสรุปได้ในทางสถิติว่าแตกต่างกันอย่างมีนัยสำคัญ ในการทดสอบความสมมูลจะอาศัยหลักการในการตั้งสมมติฐานที่สลับด้านกับวิธีการข้างต้น เพื่อให้สามารถสรุปได้ว่า กรรมวิธีทั้งสองมีความสมมูลกันอย่างมีนัยสำคัญทางสถิติ นอกจากนี้ในทางปฏิบัติ ค่าผลต่างระหว่าง 2 กรรมวิธี (เขียนแทนด้วย D) มีค่าเป็น 0 เกิดขึ้นได้ยากมาก ในทางตรงข้าม ถ้าสามารถแสดงให้เห็นว่า ความแตกต่างที่เกิดขึ้นขนาด D จัดอยู่ในเกณฑ์ที่ไม่จำเป็นต้องใส่ใจในทางคลินิก ก็สามารถใช้ยืนยันผลความสมมูลระหว่าง 2 กรรมวิธีได้ โดยไม่จำเป็นที่ค่า D ต้องมีค่าเป็น 0 เสมอไปตามหลักการความเท่ากันในทางคณิตศาสตร์ เพื่อแสดงให้เห็นความแตกต่างระหว่างการทดสอบความสมมูลกับการทดสอบความแตกต่าง (Test for comparison) จะขอยกกรณีตัวอย่างของการเปรียบเทียบระหว่างค่าเฉลี่ยสองกลุ่ม ซึ่งนำเสนอในตารางที่ 1 โดยสมมติให้ขนาดตัวอย่างที่ใช้ในการศึกษามีขนาดใหญ่เพียงพอที่จะยืนยันว่า ผลต่างค่าเฉลี่ยระหว่าง 2 กลุ่มตัวอย่างมีการแจกแจงปกติ ซึ่งมีผลทำให้สามารถใช้ตัวสถิติ Z ในการทดสอบได้อย่างเหมาะสมทั้งในส่วนของการทดสอบความแตกต่าง และการทดสอบความสมมูล
การทดสอบความสมมูลกรณีวางแผนการทดลองแบบแฟกทอเรียล 2x2 ในการศึกษาครั้งนี้จะศึกษาเฉพาะกรณีของการทดลองแบบแฟกทอเรียลซึ่งสนใจผลกระทบจากปัจจัย 2 ตัว โดยแต่ละปัจจัยประกอบด้วยระดับที่แตกต่างกัน 2 ระดับ ซึ่งเป็นลักษณะของการทดลองแบบแฟกทอเรียล 2x2 เนื่องจากค่าสังเกตที่สนใจในการทดลองแบบแฟกทอเรียลสามารถเป็นได้ทั้งลักษณะข้อมูลคุณภาพและข้อมูลปริมาณ การที่ชนิดข้อมูลหรือค่าสังเกตแตกต่างกันย่อมมีผลต่อตัวสถิติที่จะนำมาใช้ในการวิเคราะห์ข้อมูล ดังนั้นในการพิจารณาวิธีการทดสอบความสมมูล จะขอแยกนำเสนอเป็น 2 กรณีตามชนิดของค่าสังเกตที่สนใจ
ก. กรณีค่าสังเกตเป็นตัวแปรเชิงปริมาณ
โดยทั่วไป ในการเปรียบเทียบความแตกต่างระหว่างกลุ่มต่าง ๆ ซึ่งมีค่าสังเกตที่สนใจเป็นตัวแปรเชิงปริมาณและมีการแจกแจงปกติ มักทำการเปรียบเทียบโดยอาศัยความแตกต่างที่เกิดขึ้นระหว่างค่าเฉลี่ยของตัวแปรเชิงปริมาณนั้น ๆ ในแต่ละกลุ่มเป็นเกณฑ์ในการพิจารณาตัดสินโดยอาศัยวิธีการทางสถิติที่เหมาะสม กำหนดสัญลักษณ์ที่ใช้ในการศึกษาอิทธิพลจากปัจจัย 2 ปัจจัยคือ ปัจจัย A และปัจจัย B โดยปัจจัย A มี 2 ระดับ และปัจจัย B มี 2 ระดับ จากการทดลองแบบแฟกทอเรียล 2x2 (รวมแล้วจะประกอบด้วยกรรมวิธีทั้งสิ้น 4 ตัว) เป็นดังตารางที่ 2 สำหรับสมมติฐานที่ใช้ในการทดสอบความสมมูล กรณีค่าสังเกตเป็นตัวแปรปริมาณ คือ - สมมติฐานว่างซึ่งไม่สามารถเทียบเคียงความสมมูล  - สมมติฐานทางเลือกของการเทียบเคียงความสมมูล  โดยที่ mij แทนค่าเฉลี่ยของค่าสังเกตที่สนใจเมื่อได้รับกรรมวิธีกลุ่มที่ ij (i = 1, 2 และ j = 1, 2) และ DL แทนความแตกต่างที่ยอมรับได้ทางคลินิก ถ้าลักษณะการแจกแจงของความแตกต่างมีการแจกแจงปกติและมีความแปรปรวนไม่แตกต่างกัน เทอมผลต่างของ (เมื่อ คือค่าเฉลี่ยตัวอย่างของกรรมวิธีที่ ij) ที่คำนวณได้จากกลุ่มตัวอย่างที่ศึกษาภายใต้สมมติฐาน H0ในกรณีที่ไม่ทราบค่าความแปรปรวนของประชากร จะมีลักษณะการแจกแจงแบบที โดยมีองศาความเป็นอิสระเท่ากับ n โดยเทอมที่กล่าวถึงนี้จะเป็นเทอมที่สามารถใช้ทดสอบผลต่างในเทอม ได้ ด้วยการใช้ตัวสถิติ t
 เมื่อ DL คือค่าขนาดความแตกต่างที่ยอมรับได้ทางคลินิก, sp2 ค่าความแปรปรวนร่วม และ nijขนาดตัวอย่างของกลุ่มกรรมวิธี ij ถ้าค่า P(t ≤ t0) = a0 และ a0 ≤a จะปฏิเสธ H0 : ไม่สามารถเทียบเคียงความสมมูล เพื่อที่จะเชื่อถือใน H1: สามารถเทียบเคียงความสมมูล ภายใต้ระดับนัยสำคัญ a
ข. กรณีค่าสังเกตเป็นตัวแปรเชิงคุณภาพ
โดยทั่วไป การเปรียบเทียบระหว่างกลุ่มต่าง ๆ ซึ่งมีค่าสังเกตเป็นตัวแปรเชิงคุณภาพ มักเปรียบเทียบระหว่างค่าสัดส่วนที่เกิดเหตุการณที่สนใจในแต่ละกลุ่มว่ามีค่าใกล้เคียงกันหรือแตกต่างกันโดยอาศัยวิธีการทางสถิติที่เหมาะสม กำหนดสัญลักษณ์ที่ใช้ในการศึกษาอิทธิพลจากปัจจัย 2 ปัจจัยคือ ปัจจัย A และปัจจัย B โดยปัจจัย A มี 2 ระดับ และปัจจัย B มี 2 ระดับ จากการทดลองแบบแฟกทอเรียล 2x2 (รวมแล้วจะประกอบด้วยกรรมวิธีทั้งสิ้น 4 ตัว) เป็นดังตารางที่ 4 โดยสมมติฐานที่ใช้ในการทดสอบคือ - สมมติฐานว่างซึ่งไม่สามารถเทียบเคียงความสมมูล - สมมติฐานทางเลือกของการเทียบเคียงความสมมูล  โดย pij แทนค่าสัดส่วนที่เกิดเหตุการณ์ที่สนใจเมื่อได้รับกรรมวิธีที่ ij ในกรณีที่ขนาดตัวอย่างที่ศึกษามีขนาดใหญ่ ค่าผลต่างของสัดส่วนจะมีการแจกแจงลู่เข้าสู่การแจกแจงปกติ เพราะฉะนั้นสามารถเลือกใช้ตัวสถิติในการทดสอบคือ  โดย Pij= ค่าสัดส่วนเหตุการณ์ที่สนใจของตัวอย่างเมื่อได้รับกรรมวิธีที่ ij (i = 1, 2 และ j = 1, 2) และ  ถ้าค่า P(Z ≤ Z0) = a0 และ a0 ≤a จะปฏิเสธ H0 : การไม่สามารถเทียบเคียงความสมมูล เพื่อที่จะเชื่อถือใน H1 : สามารถเทียบเคียงความสมมูล ภายใต้ระดับนัยสำคัญ a ในกรณีที่ขนาดตัวอย่างที่ศึกษามีขนาดเล็ก จะทำให้ค่าผลต่างของค่าสัดส่วนไม่ลู่เข้าสู่การแจกแจงปกติ จึงไม่ควรใช้ตัวสถิติข้างต้นในการทดสอบสมมติฐาน ในกรณีนี้สามารถทำการแปลงค่าตัวแปร P เป็น  โดยลักษณะการแจกแจงของ y จะมีลักษณะการแจกแจงเข้าใกล้การแจกแจงปกติด้วยค่าเฉลี่ยเท่ากับ และความแปรปรวนเท่ากับ 1/4n ดังนั้น  สำหรับเกณฑ์ในการตัดสินใจ จะใช้หลักการเดียวกับข้างต้นนั่นคือ ถ้าค่า P(Z ≤ Z0) = a0 และค่า a0 ≤a จะปฏิเสธ H0โดยสรุปผลได้ว่าสามารถเทียบเคียงความสมมูล ภายใต้ระดับนัยสำคัญ a
ขนาดตัวอย่างที่เหมาะสมสำหรับการทดสอบความสมมูล กำหนดให้ขนาดความแตกต่างที่ยังยอมรับได้ว่าสามารถเทียบเคียงความสมมูลกันได้เท่ากับ DL เพื่อให้สามารถยืนยันการเทียบเคียงความสมมูลจากผลต่างที่เกิดขึ้นเท่ากับ d ภายใต้ระดับนัยสำคัญ a และกำลังในการทดสอบเท่ากับ 1 - b ขนาดตัวอย่างสามารถคำนวณได้ดังนี้
ก. การคำนวณขนาดตัวอย่างสำหรับกรณีค่าสังเกตที่สนใจเป็นตัวแปรเชิงปริมาณ สำหรับขั้นตอนการคำนวณขนาดตัวอย่างที่เหมาะสมสามารถดำเนินการในลักษณะเดียวกันกับวิธีการทางสถิติคลาสสิก โดยในที่นี้จะแสดงวิธีการคำนวณขนาดตัวอย่างในกรณีที่ค่าสังเกตที่สนใจเป็นตัวแปรเชิงปริมาณซึ่งได้จากการทดลองแบบแฟกทอเรียล 2x2 สมมติให้ขนาดตัวอย่างเท่ากับ n ซึ่งมีขนาดใหญ่เพียงพอต่อการประมาณการแจกแจงปกติสำหรับเทอม (D - DL) โดยที่ และกำหนดให้ L0 คือเขตวิกฤตภายใต้ H0 ในกรณีสมมติว่าทราบค่าความแปรปรวนของประชากร (s2) ดังนั้นสามารถประมาณเขตวิกฤต L0 โดยใช้ตัวสถิติ Z
(1) ภายใต้ H1สำหรับกรณีที่กำหนดให้ค่าผลต่างไม่เกินค่า d  สามารถคำนวณค่ากำลังในการทดสอบ 1 - b ได้จาก  กำหนดให้ Zb เท่ากับค่าขอบเขตที่สอดคล้องกับค่าความคลาดเคลื่อนแบบที่ 2 ซึ่งสามารถคำนวณค่าได้จากความสัมพันธ์ต่อไปนี้  จากสมการ (1) จะได้ว่า  เพราะฉะนั้นจะได้  จะเห็นได้ว่า ในกรณีนี้ไม่สามารถเขียนสูตรทั่วไปสำหรับการคำนวณขนาดตัวอย่างของแต่ละกลุ่ม เนื่องจากมีจำนวนกลุ่มเป็นจำนวนมาก แนวทางหนึ่งที่สามารถสร้างสูตรทั่วไปคือ การคำนวณขนาดตัวอย่างกลุ่มใดกลุ่มหนึ่งออกมาก่อน จากนั้นค่อยทำการคำนวณขนาดตัวอย่างของกลุ่มที่เหลือ หากกำหนดให้ k1 = n12/n11 , k2 = n21/n11 และ k3 = n22/n11 จะได้  เพราะฉะนั้นสามารถคำนวณขนาดตัวอย่างของกลุ่มอื่นจาก n12 = k1n11, n21 = k2n11 และ n22 = k3n11 ตามลำดับ สำหรับแนวทางการคำนวณขนาดตัวอย่างที่มักนิยมใช้ในทางปฏิบัติคือ กำหนดให้ใช้ขนาดตัวอย่างในแต่ละกลุ่มเท่าๆ กัน n11 = n12 = n21 = n22 = n (นั่นคือ k1 = k2 = k3 = 1) จะได้  ข. การคำนวณขนาดตัวอย่างสำหรับกรณีค่าสังเกตที่สนใจเป็นตัวแปรเชิงคุณภาพ สำหรับขั้นตอนการคำนวณขนาดตัวอย่างที่เหมาะสมในกรณีที่ค่าสังเกตที่สนใจเป็นตัวแปรเชิงคุณภาพซึ่งได้จากการทดลองแบบแฟกทอเรียล 2x2 สามารถดำเนินการในลักษณะเดียวกันกับกรณีค่าสังเกตที่สนใจเป็นตัวแปรเชิงปริมาณ ภายใต้ H0จะมีขอบเขตของการทดสอบแบบทางเดียวร่วมกันกับการทดสอบภายใต้สมมติฐาน H1นั่นคือ ภายใต้ H0: L0 คือค่าขอบเขตของการปฏิเสธ H0 L0 = Za.s โดยที่ s คือส่วนเบี่ยงเบนมาตรฐานของ (p22 - p12) (p21 - p11)
ภายใต้ H1 กำหนดให้ค่าความแตกต่างที่เกิดขึ้นคือ d = (p22 - p12) (p21 - p11) โดยค่าผลต่างที่สังเกตได้คือ D = (P22 P12) (P21 P11) จะได้ P[D + Za.s > DL] = b สามารถจัดรูปได้เป็น  ซึ่งจะพบว่า รูปแบบที่ได้สอดคล้องกับการเทียบเคียงระหว่างค่าเฉลี่ยสำหรับกรณีค่าสังเกตที่สนใจเป็นตัวแปรเชิงปริมาณ นั่นคือ  โดย Zb แทนค่าขอบเขตซึ่งมีพื้นที่ใต้โค้งการแจกแจงปกติมาตรฐานเท่ากับ b ในกรณีที่กำหนดให้ขนาดตัวอย่างในแต่ละกลุ่มมีขนาดเท่ากัน จะได้ว่า  และหากประสิทธิภาพของแต่ละกรรมวิธีไม่แตกต่างกัน (p11 = p12 = p21 = p22) จะได้  นอกจากนี้ยังสามารถประมาณขนาดตัวอย่างที่เหมาะสมในกรณีที่ค่าผลต่างระหว่างค่าสัดส่วนไม่มีการแจกแจงปกติ โดยการใช้วิธีการแปลงค่าข้อมูลดังที่ได้กล่าวไว้ในหัวข้อที่ผ่านมา จากสูตรที่ใช้ในการคำนวณค่า Zb  เมื่อ  เพราะฉะนั้น จะได้  หากกำหนดให้ n12 = k1n11, n21 = k2n11, และ n22 = k3n11 จะได้  หากกำหนดให้ขนาดตัวอย่างในแต่ละกลุ่มเท่ากับ n 
สรุปผลการศึกษา การศึกษาวิจัยเพื่อทดสอบความสมมูลเป็นรูปแบบการศึกษาที่มีความสำคัญในงานวิจัยทางคลินิก โดยมีเป้าหมายในการศึกษาเพื่อเทียบเคียงกรรมวิธีที่มีความเหมือนกันกับกรรมวิธีที่ใช้เป็นมาตรฐาน ซึ่งหากพบว่ากรรมวิธีที่สนใจมีความสมมูลกับตัวมาตรฐาน ก็สามารถพิจารณากรรมวิธีที่สนใจเป็นทางเลือกที่เหมาะสมในการนำมาใช้แทนกรรมวิธีมาตรฐาน ซึ่งการตัดสินใจให้กรรมวิธีที่สนใจเป็นทางเลือกที่เหมาะสมควรจะต้องผ่านกระบวนการทดสอบเพื่อยืนยันโดยวิธีการทางสถิติว่า มีความสมมูลกับตัวมาตรฐานได้อย่างเหมาะสม จากหลักการของการศึกษาวิจัยเพื่อทดสอบความสมมูลนี้ เห็นได้ชัดว่าไม่ไปด้วยกันกับหลักการวิเคราะห์ทางสถิติคลาสสิกที่มุ่งเน้นไปในการเปรียบเทียบความแตกต่างระหว่างกรรมวิธีที่สนใจกับกรรมวิธีมาตรฐาน เพราะฉะนั้นวิธีการวิเคราะห์ทางสถิติสำหรับการทดสอบความสมมูลจึงควรได้รับความสนใจจากนักวิจัยทั้งหลาย โดยเฉพาะนักวิจัยทางด้านวิทยาศาสตร์สุขภาพ จากการศึกษาในครั้งนี้ ได้นำเสนอวิธีการวิเคราะห์โดยใช้ Z test และ t test สำหรับการทดสอบความสมมูลระหว่างกรรมวิธีต่างๆ จากการวางแผนการทดลองแบบแฟกทอเรียล 2x2 ในกรณีที่ค่าสังเกตที่สนใจเป็นตัวแปรเชิงคุณภาพ และเชิงปริมาณตามลำดับ นอกจากนี้ยังได้นำเสนอวิธีการคำนวณขนาดตัวอย่างที่เหมาะสมเพื่อให้การศึกษานั้นมีค่ากำลังในการทดสอบอยู่ในระดับที่เหมาะสม ซึ่งจะทำให้ผลที่ได้จากการศึกษามีความถูกต้องและน่าเชื่อถือมากขึ้น
กิตติกรรมประกาศ ขอขอบคุณคณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่ ที่สนับสนุนทุนวิจัยจากเงินรายได้คณะฯ ในการดำเนินงานวิจัยนี้
เอกสารอ้างอิง
1. Rodary C, Com-Nougue C, Tournade M. How to establish equivalence between treatments: A one-sided clinical trial in paediatric oncology. Statistics in Medicine 1989; 8:593-8. 2. Lallemant M, Jourdain G, Le Coeur S et al. A trial of shortened zidovudine regimens to prevent mother-to-child transmission of human immunodeficiency virus type 1. Perinatal HIV Prevention Trial (Thailand) Investigators. New England Journal of Medicine 2000; 343:982-91. 3. Com-Nougue C, Rodary C, Patte C. How to establish equivalence when data are censored: A randomized trial of treatments for B non-Hodgkin Lymphoma. Statistic in Medicine 1993; 12:1353-64. 4. Ebbutt AF and Frith L. Practical issues in equivalence trials. Statistics in Medicine 1998; 17:1691-701. 5. Lui KJ and Cumberland WG. Sample size determination for equivalence test using rate ratio of sensitivity and specificity in paired sample size. Control Clinical Trials 2001; 22: 373-89. 6. Rohmel J. Therapeutic equivalence investigations: statistical considerations. Statistics in Medicine 1997; 17: 1703-14. 7. Com-Nougue C and Rodary C. Review of statistical procedures to assess the equivalence of two treatments. Revue dEpidemiologie et de Sante Publique 1987; 35: 416-30.
ภาคผนวก
ตาราง 1 เปรียบเทียบการทดสอบความแตกต่างกับการทดสอบความสมมูลระหว่างค่าเฉลี่ยสองกลุ่ม

ตาราง 2 สัญลักษณ์ที่ใช้ในการศึกษาเพื่อเปรียบเทียบระหว่าง 2 ปัจจัย คือ A กับ B กรณีค่าสังเกตที่สนใจเป็นตัวแปรปริมาณ

ตาราง 3 สัญลักษณ์ที่ใช้ในการศึกษาเพื่อเปรียบเทียบระหว่าง 2 ปัจจัย คือ A กับ B กรณีค่าสังเกตที่สนใจเป็นตัวแปรคุณภาพ

|