การวิเคราะห์ข้อมูลที่มีรูปแบบการวิจัยเป็นการวัดผลก่อนและหลัง
ประภัสสร เอื้อลลิตชูวงศ์1, บัณฑิต ถิ่นคำรพ2
1 บัณฑิตศึกษาสาขาวิชาชีวสถิติ, 2 อาจารย์ประจำภาควิชาชีวสถิติและประชากรศาสตร์
คณะสาธารณสุขศาสตร์ มหาวิทยาลัยขอนแก่น
บทคัดย่อ
การเลือกใช้สถิติที่ถูกต้อง/เหมาะสม ในการวิเคราะห์ข้อมูลเป็นสิ่งจำเป็นยิ่ง หากเลือกใช้สถิติไม่ถูกต้องจะทำให้การสรุปผลผิด นอกจากการเลือกใช้สถิติแล้วยังขึ้นอยู่กับรูปแบบของงานวิจัยอีกด้วย ในการวิเคราะห์ข้อมูลที่มีรูปแบบการวิจัยเป็นการวัดผลก่อนและหลัง (before after design) ระหว่าง 2 กลุ่ม คือ กลุ่มทดลองและกลุ่มควบคุม จะมีรูปแบบการวิเคราะห์ได้หลายรูปแบบ ได้แก่ การเปรียบเทียบความแตกต่างค่าเฉลี่ยหลังการทดลองระหว่างกลุ่มควบคุมและกลุ่มทดลอง, การเปรียบเทียบค่าผลต่างของข้อมูลก่อนและหลังการทดลองระหว่างกลุ่มทดลองและกลุ่มควบคุม หรือที่เรียกว่า Change Score, การเปรียบเทียบค่าผลต่างของข้อมูลก่อนและหลังการทดลองระหว่างกลุ่มทดลองและกลุ่มควบคุม โดย คิดเป็นเปอร์เซ็นต์ หรือที่เรียกกันว่า Percentage Change และการวิเคราะห์ความแปรปรวนร่วม หรือที่รู้จักกันดีคือ Analysis of Covariance (ANCOVA) ซึ่งถ้ากรณีที่ก่อนการทดลองทั้งสองกลุ่มไม่แตกต่างกันจะเลือกใช้รูปแบบการวิเคราะห์รูปแบบใดก็ได้ซึ่งให้ผลการวิเคราะห์ที่ไม่แตกต่างกัน ยกเว้นกรณีที่ก่อนการทดลองของทั้งสองกลุ่มแตกต่างกันควรใช้วิธีการวิเคราะห์ความแปรปรวนร่วม เนื่องจากมีการปรับค่าผลกระทบด้วยการวิเคราะห์แบบ covariate adjustment โดยคำนึงถึงผลที่คาดว่าน่าจะส่งผลกระทบต่อหลังการทดลอง จึงไม่ควรนำผลต่างระหว่างก่อนและหลังการทดลองของทั้งสองกลุ่มมาเปรียบเทียบกัน
บทนำ
งานวิจัยทางด้านการแพทย์และสาธารณสุขส่วนมากมีรูปแบบการวิเคราะห์ข้อมูลที่มีการวัดผลก่อนและหลัง โดยกลุ่มหนึ่งเป็นกลุ่มทดลอง และกลุ่มที่สองเป็นกลุ่มควบคุม ซึ่งมีตัวแปรตาม (Outcome) เป็นข้อมูลประเภทตัวแปรต่อเนื่อง (Continuous variables) เช่น คะแนนความรู้,น้ำหนัก เป็นต้น ซึ่งมีรูปแบบการวิเคราะห์ข้อมูลที่มีการวัดผลก่อนและหลังของสองกลุ่มนั้นได้ 4 รูปแบบ คือ 1. การเปรียบเทียบความแตกต่างค่าเฉลี่ยหลังการทดลองระหว่างกลุ่มควบคุมและกลุ่มทดลอง 2. การเปรียบเทียบค่าผลต่างของข้อมูลก่อนและหลังการทดลองระหว่างกลุ่มทดลองและกลุ่มควบคุม หรือที่เรียกว่า Change Score 3. การเปรียบเทียบค่าผลต่างของข้อมูลก่อนและหลังการทดลองระหว่างกลุ่มทดลองและกลุ่มควบคุม โดยคิดเป็นเปอร์เซ็นต์ หรือที่เรียกกันว่า Percentage Change และ 4. การวิเคราะห์ความแปรปรวนร่วม (Analysis of covariance (ANCOVA))6 ซึ่งในแต่ละวิธีจะให้ผลการศึกษาที่แตกต่างกันและมีข้อดีข้อเสียต่างกัน แต่ยังมีงานวิจัยส่วนมากที่ยังใช้กันอย่างผิด ๆ คือ ในกรณีก่อนการทดลองสองกลุ่มมีความแตกต่างกันอยู่แล้วและคาดว่าน่าจะส่งผลกระทบต่อหลังการทดลอง ยังคงใช้วิธีนำผลต่างระหว่างก่อนและหลังการทดลองของทั้งสองกลุ่มมาเปรียบเทียบกัน โดยไม่มีการปรับค่าผลกระทบด้วยการวิเคราะห์แบบ covariate adjustment2 ซึ่งในบทความนี้จะชี้ให้เห็นว่า เมื่อมีความแตกต่างระหว่างก่อนการทดลอง การวิเคราะห์ความแปรปรวนร่วม (ANCOVA) เป็นวิธีที่ใช้ควบคุมค่าผลต่างเหล่านั้นได้อย่างเหมาะสม5 และยังสามารถลดการเกิด regression to the mean ด้วย เนื่องจากเป็นเทคนิคที่ใช้การวิเคราะห์ความแปรปรวน (ANOVA) และการวิเคราะห์การถดถอย (Regression Analysis) ร่วมกัน1 โดยมีวัตถุประสงค์เพื่อช่วยลดความแปรปรวนของความคลาดเคลื่อน (error variance)4 และช่วยควบคุมตัวแปรเกินบางตัวที่อาจจะมีผลกระทบต่อตัวแปรตาม โดยการนำค่าของตัวแปรบางตัวที่คาดว่ามีผลกระทบกับตัวแปรตาม มาพิจารณาเป็นตัวแปรร่วม (Covariate) ซึ่งจากกระบวนการวิเคราะห์ความแปรปรวนร่วมนี้จะมีผลให้ค่าของตัวแปรตามที่วัดได้นั้นได้รับการปรับ (Adjusted) โดยการแยกผลที่เกิดจากอิทธิพลของตัวแปรร่วมออก ทำให้ทราบถึงผลลัพธ์ที่เกิดจากตัวแปรอิสระที่มีผลต่อตัวแปรตามจริง ๆ
วิธีการ
การศึกษาวิจัยที่มีรูปแบบการศึกษาเป็นแบบการวัดผลก่อนและหลังที่ผ่านมาส่วนใหญ่จะนำคะแนนหลังการทดลองหรือผลต่างของคะแนนก่อนและหลังมาทดสอบโดยไม่ได้คำนึงถึงว่ามีอิทธิพลจากตัวแปรร่วมที่มีผลต่อผลการศึกษาทำให้เกิดความผิดพลาดในการแปลผล และอีกกรณีเนื่องมาจากการวิเคราะห์ผลต่างของคะแนนก่อนและหลังจะไม่สามารถควบคุมได้ในกรณีที่คะแนนก่อนการทดลองแตกต่างกันจึงทำให้เกิด regression to the mean7 ดังนั้นในบทความนี้จะชี้ให้เห็นว่าวิธีการวิเคราะห์ที่เหมาะสมที่สุดของข้อมูลที่มีรูปแบบการวิจัยเป็นการวัดผลก่อนและหลัง คือ การวิเคราะห์ความแปรปรวนร่วม (Analysis of covariance) ซึ่งสามารถควบคุมการเกิด regression to the mean ดังตัวอย่างเช่น การวัดคะแนนความรู้ก่อนและหลังการให้โปรแกรมสุขศึกษาโดยการจำลองข้อมูลออกเป็น 2 สถานการณ์ คือ กรณีก่อนการทดลองของทั้งสองกลุ่มแตกต่างกัน (Baseline Imbalance) และ กรณีก่อนการทดลองของทั้งสองกลุ่มไม่แตกต่างกัน (Baseline Balance) โดย 2 กลุ่มที่กล่าวถึงนี้ คือ กลุ่มหนึ่งเป็นกลุ่มทดลอง (กลุ่มที่ได้รับโปรแกรมสุขศึกษา) และกลุ่มที่สองเป็นกลุ่มควบคุม (กลุ่มที่ไม่ได้รับโปรแกรมสุขศึกษา) โดยมีการเปรียบเทียบทั้ง 4 รูปแบบ รายละเอียดแสดงในภาคผนวก
วิธีการทางสถิติ
รูปแบบการวิเคราะห์ข้อมูลที่มีลักษณะการวัดผลก่อนและหลังนั้นจะเริ่มจากการพิจารณาว่าจะใช้ตัวแปรผลตัวใดตอบคำถามได้ตรงที่สุด ซึ่งจะพิจารณาจากคำถามวิจัย ในบทความนี้จะกล่าวถึงวิธีการวิเคราะห์ 4 รูปแบบ คือ การเปรียบเทียบความแตกต่างค่าเฉลี่ยหลังการทดลองระหว่างกลุ่มควบคุมและกลุ่มทดลอง , การเปรียบเทียบค่าผลต่างของข้อมูลก่อนและหลังการทดลองระหว่างกลุ่มทดลองและกลุ่มควบคุม หรือที่เรียกว่า Change Score , การเปรียบเทียบค่าผลต่างของข้อมูลก่อนและหลังการทดลองระหว่างกลุ่มทดลองและกลุ่มควบคุม โดยคิดเป็นเปอร์เซ็นต์ หรือที่เรียกกันว่า Percentage Change และการวิเคราะห์ความแปรปรวนร่วม ซึ่งจะกล่าวรายละเอียดในแต่ละวิธีดังนี้
รูปแบบที่ 1 กรณีการเปรียบเทียบความแตกต่างค่าเฉลี่ยหลังการทดลองระหว่างกลุ่มทดลองและกลุ่มควบคุม (post treatment only ignore for baseline) จากข้อมูลข้างต้นจะใช้คะแนนความรู้หลังการทดลอง เปรียบเทียบกันระหว่างกลุ่มทดลองและกลุ่มควบคุม เพื่อดูว่าเมื่อสิ้นสุดการทดลอง กลุ่มที่ได้รับโปรแกรมสุขศึกษามีคะแนนความรู้มากกว่ากลุ่มที่ไม่ได้โปรแกรมสุขศึกษาหรือไม่ ในกรณีนี้ก็จะเหมือนกับการใช้สถิติ Independent t test ในการทดสอบค่าเฉลี่ยสองกลุ่มที่เป็นอิสระต่อกัน
รูปแบบที่ 2 การเปรียบเทียบคะแนนผลต่างของความรู้ก่อนและหลังการทดลองระหว่างกลุ่มทดลองและกลุ่มควบคุม ซึ่งจากข้อมูลข้างต้นจะใช้คะแนนความรู้ก่อนการทดลอง (pretest หรือ baseline) และคะแนนความรู้หลังจากการทดลอง (posttest) ของแต่ละกลุ่มคือกลุ่มทดลองและกลุ่มควบคุม เพื่อดูว่าแต่ละกลุ่มมีคะแนนความรู้เพิ่มขึ้นจากเดิมหรือไม่ ในกรณีนี้ก็จะเหมือนกับการใช้สถิติ Independent t test ในการเปรียบเทียบค่าเฉลี่ยของ Change Score ในกลุ่มทดลองและกลุ่มควบคุม
รูปแบบที่ 3 การเปรียบเทียบค่าผลต่างของคะแนนความรู้ก่อนและหลังการทดลองระหว่างกลุ่มทดลองและกลุ่มควบคุม โดยคิดเป็นเปอร์เซ็นต์ เพื่อดูว่าแต่ละกลุ่มมีคะแนนความรู้เพิ่มขึ้นจากเดิมร้อยละเท่าไร (คำนวณได้จาก คะแนนก่อนลบด้วยคะแนนหลังการทดลองหารด้วยคะแนนก่อนการทดลองคูณด้วย 100)
รูปแบบที่ 4 การวิเคราะห์ความแปรปรวนร่วม (Post treatment adjusted to baseline หรือ ANCOVA) จากประเด็นงานวิจัยนี้จะพิจารณาที่คะแนนความรู้ก่อนให้โปรแกรมสุขศึกษา (ตัวแปร pretest) และเมื่อหลังจากได้รับโปรแกรมสุขศึกษาแล้วมีการวัดคะแนนความรู้อีกครั้ง (ตัวแปร posttest) โดยที่ pretest และ posttest จะมีความสัมพันธ์กัน โดยตัวแปร posttest เป็นตัวแปรตาม และตัวแปร pretest เป็นตัวแปรร่วม (Covariate) ซึ่งเป็นตัวแปรเชิงปริมาณ โดยเป็นรูปแบบของ Model คือ

ตารางที่ 1 แสดงคะแนนความรู้ก่อนและหลังการให้โปรแกรมสุขศึกษาโดยการจำลองข้อมูล
id |
group |
t_im0 |
t_im1 |
t_b0 |
t_b1 |
|
id |
group |
t_im0 |
t_im1 |
t_b0 |
t_b1 |
1 |
1 |
10 |
17 |
10 |
17 |
|
31 |
2 |
9 |
13 |
10 |
13 |
2 |
1 |
15 |
17 |
14 |
17 |
|
32 |
2 |
10 |
9 |
10 |
9 |
3 |
1 |
15 |
19 |
8 |
19 |
|
33 |
2 |
6 |
5 |
6 |
5 |
4 |
1 |
10 |
17 |
7 |
17 |
|
34 |
2 |
11 |
11 |
11 |
11 |
5 |
1 |
16 |
18 |
11 |
18 |
|
35 |
2 |
8 |
9 |
8 |
9 |
6 |
1 |
12 |
15 |
12 |
15 |
|
36 |
2 |
7 |
10 |
7 |
10 |
7 |
1 |
15 |
18 |
12 |
18 |
|
37 |
2 |
9 |
12 |
12 |
12 |
8 |
1 |
15 |
18 |
12 |
18 |
|
38 |
2 |
7 |
10 |
7 |
10 |
9 |
1 |
10 |
17 |
10 |
17 |
|
39 |
2 |
6 |
10 |
6 |
10 |
10 |
1 |
11 |
19 |
11 |
19 |
|
40 |
2 |
10 |
13 |
13 |
13 |
11 |
1 |
11 |
17 |
11 |
17 |
|
41 |
2 |
8 |
10 |
8 |
10 |
12 |
1 |
12 |
16 |
10 |
16 |
|
42 |
2 |
12 |
14 |
12 |
14 |
13 |
1 |
15 |
17 |
11 |
17 |
|
43 |
2 |
11 |
8 |
11 |
8 |
14 |
1 |
12 |
15 |
8 |
15 |
|
44 |
2 |
8 |
9 |
8 |
9 |
15 |
1 |
14 |
17 |
10 |
17 |
|
45 |
2 |
11 |
7 |
11 |
7 |
16 |
1 |
13 |
19 |
10 |
19 |
|
46 |
2 |
10 |
10 |
10 |
10 |
17 |
1 |
15 |
16 |
9 |
16 |
|
47 |
2 |
12 |
13 |
12 |
13 |
18 |
1 |
10 |
16 |
10 |
16 |
|
48 |
2 |
11 |
8 |
11 |
8 |
19 |
1 |
10 |
17 |
10 |
17 |
|
49 |
2 |
12 |
14 |
9 |
14 |
20 |
1 |
14 |
17 |
9 |
17 |
|
50 |
2 |
9 |
10 |
9 |
10 |
21 |
1 |
16 |
20 |
9 |
20 |
|
51 |
2 |
11 |
13 |
13 |
13 |
22 |
1 |
10 |
15 |
9 |
15 |
|
52 |
2 |
10 |
14 |
11 |
14 |
23 |
1 |
13 |
16 |
13 |
16 |
|
53 |
2 |
13 |
12 |
13 |
12 |
24 |
1 |
10 |
15 |
10 |
15 |
|
54 |
2 |
9 |
11 |
10 |
11 |
25 |
1 |
10 |
19 |
10 |
19 |
|
55 |
2 |
10 |
11 |
12 |
11 |
26 |
1 |
10 |
18 |
10 |
18 |
|
56 |
2 |
12 |
12 |
12 |
12 |
27 |
1 |
16 |
20 |
9 |
20 |
|
57 |
2 |
10 |
10 |
10 |
10 |
28 |
1 |
16 |
20 |
9 |
20 |
|
58 |
2 |
11 |
11 |
11 |
11 |
29 |
1 |
12 |
19 |
12 |
19 |
|
59 |
2 |
10 |
13 |
10 |
13 |
30 |
1 |
11 |
19 |
11 |
19 |
|
60 |
2 |
12 |
13 |
12 |
13 |
หมายเหตุ 1 คือ กลุ่มที่ได้รับโปรแกรมสุขศึกษา, 2 คือ กลุ่มที่ไม่ได้รับโปรแกรมสุขศึกษา
t_im0 คือ ความรู้ก่อนของทั้งสองกลุ่มแตกต่างกัน (Baseline imbalance)
t_b0 คือ ความรู้ก่อนของทั้งสองกลุ่มไม่แตกต่างกัน (Baseline balance)
t_im1 , t_b1 คือ คะแนนความรู้หลังการทดลอง
ผลการศึกษา
จากผลการศึกษา พบว่า สถิติที่ใช้ในการวิเคราะห์ข้อมูลที่มีรูปแบบการศึกษาแบบการวัดก่อนและหลัง (before after design) มีวิธีที่ใช้วิเคราะห์ได้ 4 รูปแบบ ซึ่งในแต่ละรูปแบบนั้นให้ผลการ วิเคราะห์ที่แตกต่างกัน ในกรณีที่คะแนนความรู้ก่อนการทดลองของทั้งสองกลุ่มไม่แตกต่างกันไม่ว่าจะเลือกใช้รูปแบบการวิเคราะห์แบบใดก็ให้ผลเหมือนกัน (ค่าเฉลี่ยของความแตกต่างในแต่ละวิธีได้ค่าใกล้เคียงกันแทบจะไม่พบความแตกต่าง) ดังผลการวิเคราะห์ในตารางที่ 2 แต่ในกรณีที่คะแนนความรู้ก่อนการทดลองทั้งสองกลุ่มแตกต่างกัน จะสังเกตเห็นได้จากค่าเฉลี่ยความแตกต่างของแต่ละวิธีจะให้ค่าที่แตกต่างกัน ทำให้เห็นได้ว่าน่าจะมีผลมาจากคะแนนก่อนการทดลอง ดังผลการวิเคราะห์ในตารางที่ 3 ดังนั้นในกรณีที่คะแนนความรู้ก่อนการทดลองแตกต่างกันต้องคำนึงถึงว่ามีผลกระทบต่อคะแนนความรู้หลังการทดลองหรือไม่ หากพบว่ามีผลต่อคะแนนความรู้หลังการทดลองไม่ควรนำค่าผลต่างของคะแนนความรู้ระหว่างก่อนและหลังการทดลองของทั้งสองกลุ่มมาเปรียบเทียบกันโดยตรง เนื่องจากว่าจะทำให้ผลการวิเคราะห์ข้อมูลผิดและยังทำให้เกิด regression to the mean ด้วย หากเรานำผลต่างระหว่างก่อนและหลังการทดลองของทั้งสองกลุ่มมาเปรียบเทียบกันโดยตรงจะพบว่า คะแนนความรู้ก่อนและหลังการทดลองของทั้งสองกลุ่มแตกต่างกันอย่างมีนัยสำคัญทางสถิติ แต่หากทำการวิเคราะห์ความแปรปรวนร่วมจะพบว่าความรู้ก่อนและหลังของทั้งสองกลุ่มนั้นแตกต่างกันก็จริง ทั้งนี้เนื่องมาจากมีการปรับค่าผลกระทบด้วยการวิเคราะห์แบบ covariate adjustment2 ทำให้ช่วยลดการเกิดความแปรปรวนของความคลาดเคลื่อน (error variance)4 จึงได้ค่าช่วงเชื่อมั่นที่แคบ3 และมีความกระชับ รายละเอียดดังภาพที่ 3

ภาพที่ 1 คะแนนก่อน-หลังการได้รับและไม่ได้รับโปรแกรมสุขศึกษา กรณีก่อนการทดลองของทั้งสองกลุ่มไม่แตกต่างกัน
ตารางที่ 2 ผลการวิเคราะห์ข้อมูลคะแนนความรู้ของกลุ่มที่ได้รับโปรแกรมสุขศึกษาและไม่ได้โปรแกรม สุขศึกษาในแต่ละรูปแบบ กรณีก่อนการทดลองของทั้งสองกลุ่มไม่แตกต่างกัน (Baseline balance)
รูปแบบการวิเคราะห์ |
คะแนนความรู้ (mean และ sd) |
ความต่างของค่าเฉลี่ย
(95% CI) |
P-value |
กลุ่มทดลอง (ได้รับโปรแกรม สุขศึกษา) (n=30) |
กลุ่มควบคุม (ไม่ได้รับโปรแกรมสุขศึกษา) (n=30) |
Baseline balance |
10.23 (1.52) |
10.17 (2.04) |
0.07 (-0.86 ถึง 1.00) |
0.89 |
Post treatment only ignore for baseline |
17.43 (1.55) |
10.83 (2.21) |
6.60 (5.61 ถึง 7.59) |
<0.001 |
Change score = before-after or after-before |
7.20 (2.22) |
0.67 (2.07) |
6.53 (5.42 ถึง 7.64) |
<0.001 |
Percentage change |
0.74 (0.31) |
0.09 (0.24) |
0.65 (0.51 ถึง 0.80) |
<0.001 |
Post treatment adjusted to baseline (ANCOVA) |
|
|
6.58 (5.64 ถึง 7.52) |
<0.001 |

ภาพที่ 2 คะแนนก่อน-หลังการได้รับและไม่ได้รับโปรแกรมสุขศึกษา กรณีก่อนการทดลองของทั้งสองกลุ่มแตกต่างกัน
ตารางที่ 3 ผลการวิเคราะห์ข้อมูลคะแนนความรู้ของกลุ่มที่ได้รับโปรแกรมสุขศึกษาและไม่ได้โปรแกรม สุขศึกษาในแต่ละรูปแบบ กรณีก่อนการทดลองของทั้งสองกลุ่มแตกต่างกัน (Baseline imbalance)
รูปแบบการวิเคราะห์ |
คะแนนความรู้ (mean และ sd) |
ความต่างของค่าเฉลี่ย
(95% CI) |
P-value |
กลุ่มทดลอง (ได้รับโปรแกรม สุขศึกษา) (n=30) |
กลุ่มควบคุม (ไม่ได้รับโปรแกรมสุขศึกษา) (n=30) |
Baseline imbalance |
12.63 (2.31) |
9.83 (1.86) |
2.80 (1.72 ถึง 3.89) |
<0.001 |
Post treatment only ignore for baseline |
17.43 (1.55) |
10.83 (2.21) |
6.60 (5.61 ถึง 7.59) |
<0.001 |
Change score = before-after or after-before |
4.80 (2.20) |
1.00 (2.08) |
3.80 (2.69 ถึง 4.91) |
<0.001 |
Percentage change |
0.42 (0.24) |
0.12 (0.24) |
0.29 (0.17 ถึง 0.42) |
<0.001 |
Post treatment adjusted to baseline (ANCOVA) |
|
|
5.50 (4.42 ถึง 6.59) |
<0.001 |
ดังนั้นจึงสรุปได้ว่า ในกรณีที่ต้องการพิจารณาความแตกต่างที่แท้จริงของผลการให้โปรแกรม สุขศึกษาแล้วมีการวัดผลคะแนนก่อนและหลัง สถิติที่เหมาะสมที่สุดคือ การวิเคราะห์ความแปรปรวนร่วม (Analysis of Covariance) เพราะวิธีการวิเคราะห์ความแปรปรวนร่วมเป็นวิธีที่ใช้การวิเคราะห์ความแปรปรวน (ANOVA) และการวิเคราะห์การถดถอย (Regression Analysis) ร่วมกัน

ภาพที่ 3 95%ช่วงเชื่อมั่นของการวิเคราะห์รูปแบบแต่ละวิธี
หมายเหตุ Post คือ Post treatment only ignore for baseline; Change คือ Change Score
และ ANCOVA คือ Analysis of covariance
เอกสารอ้างอิง
1. กัลยา วานิชย์บัญชา. 2548. การวิเคราะห์สถิติชั้นสูงด้วย SPSS for Windows. พิมพ์ครั้งที่ 4. กรุงเทพฯ: ธรรมสาร.
2. อรุณ จิรวัฒน์กุล. สถิติและสติ : ตัวแปรผล และการวิเคราะห์ในการทดลองเพื่อประเมินผลการสอนแบบเปรียบเทียบสองกลุ่ม. วารสารวิชาการสาธารณสุข. 2547; 13(6): 899-900.
3. Adrian G Barnett, Jolieke C van der Pols and Annette J Dobson. Regression to the mean: what it is and how to deal with it. International Journal of Epidemiology. 2005; 34: 215-220.
4. Dimiter M. Dimitrov and Phillip D. Rumrill, Jr. Pretest-posttest designs and measurement of change. Work. 2003; 20:159-165.
5. John Jamieson. Analysis of covariance (ANCOVA) with difference scores. International Journal of Psychophysiology. 2004; 52: 277-283.
6. Victers AJ. The use of percentage change from baseline as an outcome in a controlled trial is statistically inefficient: a simulation study. BMC Med Res Methodol. 2001;1:16.
7. Vickers AJ and Altman DG. Analysing controlled trials with baseline and follow up measurements. BMJ. 2001; 323:1123-4.
ภาคผนวก
การจำลองข้อมูลคะแนนก่อนและหลังการให้โปรแกรมสุขศึกษา
. list
+------------------------------------------+
| id group t_im0 t_im1 t_b0 t_b1 |
|------------------------------------------|
1. | 1 1 10 17 10 17 |
2. | 2 1 15 17 14 17 |
3. | 3 1 15 19 8 19 |
. | . . . . . . |
. | . . . . . . |
. | . . . . . . |
58. | 58 2 11 11 11 11 |
59. | 59 2 10 13 10 13 |
60. | 60 2 12 13 12 13 |
+------------------------------------------+
รูปแบบการวิเคราะห์ข้อมูลแต่ละรูปแบบ
กรณีความรู้ก่อนของทั้งสองกลุ่มไม่แตกต่างกัน (Baseline balance)
. ttest t_b0, by(group)
Two-sample t test with equal variances
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
1 | 30 10.23333 .2782678 1.524135 9.664212 10.80245
2 | 30 10.16667 .3716485 2.035603 9.40656 10.92677
---------+--------------------------------------------------------------------
combined | 60 10.2 .230205 1.78316 9.739361 10.66064
---------+--------------------------------------------------------------------
diff | .0666667 .4642796 -.8626899 .9960233
------------------------------------------------------------------------------
Degrees of freedom: 58
Ho: mean(1) - mean(2) = diff = 0
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
t = 0.1436 t = 0.1436 t = 0.1436
P < t = 0.5568 P > |t| = 0.8863 P > t = 0.4432
รูปแบบที่ 1 Post treatment only ignore for baseline
. ttest t_b1, by(group)
Two-sample t test with equal variances
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
1 | 30 17.43333 .2823682 1.546594 16.85583 18.01084
2 | 30 10.83333 .40424 2.214114 10.00657 11.6601
---------+--------------------------------------------------------------------
combined | 60 14.13333 .4942989 3.828823 13.14424 15.12242
---------+--------------------------------------------------------------------
diff | 6.6 .4930941 5.612965 7.587035
------------------------------------------------------------------------------
Degrees of freedom: 58
Ho: mean(1) - mean(2) = diff = 0
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
t = 13.3849 t = 13.3849 t = 13.3849
P < t = 1.0000 P > |t| = 0.0000 P > t = 0.0000
รูปแบบที่ 2 Change Score = before-after or after-before
. gen change_b = t_b1-t_b0
. ttest change_b, by(group)
Two-sample t test with equal variances
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
1 | 30 7.2 .4051394 2.21904 6.371397 8.028603
2 | 30 .6666667 .3785433 2.073367 -.1075413 1.440875
---------+--------------------------------------------------------------------
combined | 60 3.933333 .5063811 3.922411 2.920067 4.9466
---------+--------------------------------------------------------------------
diff | 6.533333 .5544664 5.423448 7.643218
------------------------------------------------------------------------------
Degrees of freedom: 58
Ho: mean(1) - mean(2) = diff = 0
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
t = 11.7831 t = 11.7831 t = 11.7831
P < t = 1.0000 P > |t| = 0.0000 P > t = 0.0000
รูปแบบที่ 3 Percent Change
. gen fraction_b = (t_b1-t_b0)/t_b0
. ttest fraction_b, by(group)
Two-sample t test with equal variances
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
1 | 30 .7412926 .0565524 .3097504 .6256299 .8569553
2 | 30 .0886841 .0432616 .2369534 .0002042 .177164
---------+--------------------------------------------------------------------
combined | 60 .4149883 .0552323 .4278274 .3044688 .5255079
---------+--------------------------------------------------------------------
diff | .6526085 .0712021 .510082 .795135
------------------------------------------------------------------------------
Degrees of freedom: 58
Ho: mean(1) - mean(2) = diff = 0
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
t = 9.1656 t = 9.1656 t = 9.1656
P < t = 1.0000 P > |t| = 0.0000 P > t = 0.0000
รูปแบบที่ 4 Post treatment adjusted to baseline (ANCOVA)
. anova t_b1 t_b0 group, continuous (t_b0) regress
Source | SS df MS Number of obs = 60
-------------+------------------------------ F( 2, 57) = 102.31
Model | 676.487309 2 338.243654 Prob > F = 0.0000
Residual | 188.446024 57 3.3060706 R-squared = 0.7821
-------------+------------------------------ Adj R-squared = 0.7745
Total | 864.933333 59 14.659887 Root MSE = 1.8183
------------------------------------------------------------------------------
t_b1 Coef. Std. Err. t P>|t| [95% Conf. Interval]
------------------------------------------------------------------------------
_cons 7.266145 1.390101 5.23 0.000 4.482516 10.04977
t_b0 .350871 .1327752 2.64 0.011 .0849933 .6167486
group
1 6.576609 .4695562 14.01 0.000 5.636338 7.516879
2 (dropped)
------------------------------------------------------------------------------
กรณีความรู้ก่อนของทั้งสองกลุ่มแตกต่างกัน (Baseline imbalance)
. ttest t_im0, by(group)
Two-sample t test with equal variances
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
1 | 30 12.63333 .4220457 2.31164 11.77015 13.49651
2 | 30 9.833333 .3393142 1.8585 9.139358 10.52731
---------+--------------------------------------------------------------------
combined | 60 11.23333 .3244871 2.513467 10.58404 11.88263
---------+--------------------------------------------------------------------
diff | 2.8 .5415318 1.716006 3.883994
------------------------------------------------------------------------------
Degrees of freedom: 58
Ho: mean(1) - mean(2) = diff = 0
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
t = 5.1705 t = 5.1705 t = 5.1705
P < t = 1.0000 P > |t| = 0.0000 P > t = 0.0000
รูปแบบที่ 1 Post treatment only ignore for baseline
. ttest t_im1, by(group)
Two-sample t test with equal variances
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
1 | 30 17.43333 .2823682 1.546594 16.85583 18.01084
2 | 30 10.83333 .40424 2.214114 10.00657 11.6601
---------+--------------------------------------------------------------------
combined | 60 14.13333 .4942989 3.828823 13.14424 15.12242
---------+--------------------------------------------------------------------
diff | 6.6 .4930941 5.612965 7.587035
------------------------------------------------------------------------------
Degrees of freedom: 58
Ho: mean(1) - mean(2) = diff = 0
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
t = 13.3849 t = 13.3849 t = 13.3849
P < t = 1.0000 P > |t| = 0.0000 P > t = 0.0000
รูปแบบที่ 2 Change Score = before-after or after-before
. gen change_im = t_im1-t_im0
. ttest change_im, by(group)
Two-sample t test with equal variances
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
1 | 30 4.8 .4022923 2.203446 3.97722 5.62278
2 | 30 1 .3805622 2.084425 .2216629 1.778337
---------+--------------------------------------------------------------------
combined | 60 2.9 .3695317 2.86238 2.160569 3.639431
---------+--------------------------------------------------------------------
diff | 3.8 .5537749 2.691499 4.908501
------------------------------------------------------------------------------
Degrees of freedom: 58
Ho: mean(1) - mean(2) = diff = 0
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
t = 6.8620 t = 6.8620 t = 6.8620
P < t = 1.0000 P > |t| = 0.0000 P > t = 0.0000
รูปแบบที่ 3 Percent Change
. gen fraction_im = (t_im1-t_im0)/t_im0
. ttest fraction_im, by(group)
Two-sample t test with equal variances
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
1 | 30 .4170849 .0446611 .2446188 .3257427 .508427
2 | 30 .1221353 .0429594 .2352981 .0342735 .209997
---------+--------------------------------------------------------------------
combined | 60 .2696101 .0362268 .2806117 .1971204 .3420997
---------+--------------------------------------------------------------------
diff | .2949496 .0619687 .1709058 .4189934
------------------------------------------------------------------------------
Degrees of freedom: 58
Ho: mean(1) - mean(2) = diff = 0
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
t = 4.7597 t = 4.7597 t = 4.7597
P < t = 1.0000 P > |t| = 0.0000 P > t = 0.0000
รูปแบบที่ 4 Post treatment adjusted to baseline (ANCOVA)
. anova t_im1 t_im0 group, continuous (t_im0) regress
Source | SS df MS Number of obs = 60
-------------+------------------------------ F( 2, 57) = 114.49
Model | 692.542949 2 346.271475 Prob > F = 0.0000
Residual | 172.390384 57 3.0243927 R-squared = 0.8007
-------------+------------------------------ Adj R-squared = 0.7937
Total | 864.933333 59 14.659887 Root MSE = 1.7391
------------------------------------------------------------------------------
t_im1 Coef. Std. Err. t P>|t| [95% Conf. Interval]
------------------------------------------------------------------------------
_cons 6.981709 1.116712 6.25 0.000 4.745532 9.217886
t_im0 .3916906 .1088768 3.60 0.001 .1736685 .6097127
group
1 5.503266 .5427364 10.14 0.000 4.416455 6.590077
2 (dropped)
------------------------------------------------------------------------------
การหมุนข้อมูลเพื่อใช้ในการสร้างกราฟของคะแนนก่อนและหลังการได้รับโปรแกรมสุขศึกษาและไม่ได้รับโปรแกรมสุขศึกษา
. reshape long t_im t_b time, i(id) j(visit)
(note: j = 0 1)
Data wide -> long
-----------------------------------------------------------------------
Number of obs. 60 -> 120
Number of variables 8 -> 6
j variable (2 values) -> visit
xij variables:
t_im0 t_im1 -> t_im
t_b0 t_b1 -> t_b
time0 time1 -> time
-----------------------------------------------------------------------
. list
+----------------------------------------+
| id visit group t_im t_b time |
|----------------------------------------|
1. | 1 0 1 10 10 0 |
2. | 1 1 1 17 17 1 |
3. | 2 0 1 15 14 0 |
4. | 2 1 1 17 17 1 |
. | . . . . . . |
. | . . . . . . |
. | . . . . . . |
117. | 59 0 2 10 10 0 |
118. | 59 1 2 13 13 1 |
119. | 60 0 2 12 12 0 |
120. | 60 1 2 13 13 1 |
+----------------------------------------+
การสร้างกราฟเปรียบเทียบคะแนนก่อนและหลังการให้โปรแกรมสุขศึกษา กรณีก่อนการทดลองของทั้งสองกลุ่มแตกต่างกัน (Baseline imbalance)
. longplot t_im visit, i(id) by(group)

การสร้างกราฟเปรียบเทียบคะแนนก่อนและหลังการให้โปรแกรมสุขศึกษา กรณีก่อนการทดลองของทั้งสองกลุ่มไม่แตกต่างกัน (Baseline balance)
. longplot t_b visit, i(id) by(group)
 |