Untitled Document
 
 
 
 
Untitled Document
Home
Current issue
Past issues
Topic collections
Search
e-journal Editor page

Missing data and management

ข้อมูลสูญหายและแนวทางการจัดการ

ปิยะภรณ์ ประสิทธิ์วัฒนเสรี 1, สุคนธ์ ประสิทธิ์วัฒนเสรี 2




 บทนำ
       ข้อมูลสูญหาย (missing data) เป็นกรณีที่พบได้บ่อยในงานวิจัยทุกสาขา และนักวิจัยจำเป็นต้องพิจารณาถึงแนวทางที่เหมาะสมสำหรับใช้จัดการกับข้อมูลสูญหายในทุก ๆ ครั้งที่พบกับปัญหานี้ ซึ่งวิธีการที่ใช้สำหรับจัดการกับข้อมูลสูญหายมีทางเลือกให้พิจารณาค่อนข้างหลากหลาย หากเลือกใช้วิธีจัดการกับข้อมูลสูญหายที่ไม่เหมาะสมย่อมส่งผลทำให้เกิดการบิดเบือนผลการวิเคราะห์ อย่างไรก็ตามจากการศึกษาของ Wood และคณะ (2004) ที่ได้ทำการศึกษาจากผลงานวิจัยที่ได้รับการตีพิมพ์ในวารสาร BMJ, JAMA, Lancet และ N Engl J Med จำนวน 71 ชิ้น พบว่า มีงานวิจัยถึง 89% ที่มีปัญหาเรื่องข้อมูลสูญหาย และมีเพียง 21% เท่านั้นที่มีการจัดการกับปัญหาข้อมูลที่ไม่สมบูรณ์ จากผลการศึกษานี้แสดงให้เห็นว่า การจัดการกับปัญหาข้อมูลสูญหายยังคงถูกละเลยกันอย่างเป็นปกติ แม้แต่ในงานวิจัยทางระบาดวิทยาและงานวิจัยเชิงทดลอง
       โดยเอกสารชิ้นนี้ต้องการเน้นย้ำถึงบทบาทความสำคัญของข้อมูลสูญหายที่มีต่องานวิจัย โดยจะกล่าวถึงแนวทางในการจัดการกับข้อมูลสูญหายอย่างคร่าว ๆ เพื่อประโยชน์ต่อการพิจารณาเลือกวิธีการที่เหมาะสมสำหรับจัดการกับข้อมูลที่ไม่สมบูรณ์ โดยในที่นี้จะยังไม่ขอกล่าวถึงรายละเอียดของวิธีการวิเคราะห์ต่าง ๆ

ข้อมูลสูญหาย
      ข้อมูลสูญหายคือค่าสังเกตที่ต้องการทราบค่าแต่ไม่สามารถทราบค่าได้ โดยที่ค่านั้นควรจะสามารถทราบค่าได้หากวิธีการที่ใช้ในการรวบรวมข้อมูลหรือในการวัดค่ามีประสิทธิภาพดีขึ้นหรือมีความเหมาะสมมากขึ้น ลองพิจารณาจากตัวอย่างของการวัดระดับความดันเลือดของเด็กในชั้นเรียนหนึ่ง ซึ่งผลจากการตรวจวัดทำให้ทราบค่าความดันเลือดของเด็กทั้งหมดว่ามีค่าอยู่ในช่วง 90 – 180 mm Hg ยกเว้นในเด็กหนึ่งรายที่ป่วย จึงไม่ได้มาในวันที่ทำการตรวจวัดความดันเลือด ทำให้ไม่ทราบค่าระดับความดันเลือดของเด็กผู้นี้ ซึ่งเรียกได้ว่าเป็นค่าสูญหาย (missing value)
      หากจะให้กล่าวถึงความสำคัญของข้อมูลสูญหายที่มีต่อการวิจัย ควรต้องมุ่งไปยังประเด็นของผลกระทบต่องานวิจัยที่เกิดจากกรณีข้อมูลสูญหาย โดยข้อมูลสูญหายที่เกิดขึ้นอาจไม่ก่อผลกระทบใด ๆ ต่อผลการวิจัย หรืออาจก่อให้เกิดผลกระทบที่รุนแรงต่องานวิจัยก็ย่อมได้ ทั้งนี้สามารถจำแนกผลกระทบจากข้อมูลสูญหายอย่างคร่าว ๆ ได้ดังนี้
- ข้อมูลสูญหายสามารถทำให้เกิดการสูญเสียกำลังในการทดสอบ (power of the test) เนื่องจากขนาดตัวอย่างที่ใช้ลดลงอันเป็นผลจากการตัดข้อมูลสูญหายออกจากการศึกษา ยกตัวอย่างเช่นในตอนเริ่มต้นการศึกษา คำนวณขนาดตัวอย่างที่เหมาะสมในการศึกษาเท่ากับ 300 คน แต่ภายหลังจากการรวบรวมข้อมูลปรากฏว่า ผลจากข้อมูลสูญหายทำให้กลุ่มตัวอย่างที่มีข้อมูลสมบูรณ์เหลือเพียง 250 คน หากทำการวิเคราะห์ในกลุ่มตัวอย่างที่มีขนาดเล็กลงย่อมส่งผลต่อการสูญเสียระดับความเชื่อมั่น และการเพิ่มขึ้นของความแปรผันในการศึกษา
- ข้อมูลสูญหายอาจก่อให้เกิดความเอนเอียงของค่าประมาณ ยกตัวอย่างเช่น ในการศึกษาเกี่ยวกับลักษณะพฤติกรรมการดูแลสุขภาพ หากลักษณะข้อคำถามที่ใช้เป็นคำถามที่กระทบต่อความรู้สึกได้ง่าย (sensitive question) ไม่ว่าจะเป็นพฤติกรรมการเสพสารเสพติด หรือพฤติกรรมการมีเพศสัมพันธ์ หรือแม้แต่คำถามทั่ว ๆ ไปทางสังคม อย่างรายได้ต่อปี ซึ่งอาจไม่ได้รับความร่วมมือในการตอบคำถามจากหลาย ๆ คน ทำให้ข้อมูลที่ได้อาจไม่สามารถแทนลักษณะของประชากรได้ครบถ้วน ทั้งนี้เพราะผู้ที่ไม่ให้ความร่วมมือในการตอบคำถามเหล่านี้ ส่วนใหญ่อาจเป็นผู้ที่มีพฤติกรรมที่ไม่เป็นที่ยอมรับในสังคม หรือเป็นผู้ที่มีรายได้ต่ำมาก หรือในทางตรงกันข้ามอาจเป็นผู้ที่มีรายได้สูงมาก ทำให้ไม่ต้องการตอบคำถามเหล่านี้
- สืบเนื่องจากผลกระทบก่อนหน้านี้ ข้อมูลสูญหายก่อให้เกิดความยากลำบากในการตรวจสอบอิทธิพลของตัวแปรต่าง ๆ ยกตัวอย่างจากกรณีข้างต้น หากต้องการศึกษาความเกี่ยวข้องกันระหว่างรายได้กับพฤติกรรมการดูแลสุขภาพ หากเกิดปัญหาในลักษณะที่ผู้ที่มีรายได้น้อยหรือมากไม่ยอมให้คำตอบเกี่ยวกับรายได้ต่อปี จะทำให้ข้อมูลที่ใช้ในการวิเคราะห์มีเพียงกลุ่มผู้ที่มีรายได้ปานกลาง หากผลการวิเคราะห์พบว่าไม่มีความเกี่ยวข้องกันระหว่างรายได้กับพฤติกรรมการดูแลสุขภาพ ผลสรุปที่ได้อาจผิดพลาด เพราะในความเป็นจริงอาจมีความสัมพันธ์กันก็เป็นไปได้
     
       ทั้งนี้จะเห็นได้ว่า ข้อมูลสูญหายสามารถส่งผลต่อการวิจัยทั้งในส่วนของการวิเคราะห์ และการสรุปผลตีความ โดยที่ระดับความรุนแรงของผลกระทบนี้ขึ้นอยู่กับองค์ประกอบจากหลายส่วน แต่ที่สำคัญก็คือ ขนาดของข้อมูลสูญหาย ประเภทของข้อมูลสูญหายที่เกิดขึ้น และวิธีการจัดการกับข้อมูลสูญหาย
. . . Full text.

Untitled Document
Article Location
Volume 4 Number 3

Untitled Document
Article Option
       Extract
       Fulltext
       PDF File
Untitled Document
 
ทำหน้าที่ ดึง Collection ที่เกี่ยวข้อง แสดง บทความ ตามที่ีมีใน collection ที่มีใน list Untitled Document
Another articles
in this topic collection

 
Editorials (บทบรรณาธิการ)
 
FORECASTING MODELS FOR MONTHLY PATIENT MOVEMENTS IN ADMISSIONS AND DISCHARGES OF RAJAVITHI HOSPITAL (ตัวแบบการพยากรณ์ การเคลื่อนไหวการรับและการจําหน่ายผู้ป่วยรายเดือน ของโรงพยาบาลราชวิถี ADMISSIONS AND DISCHARGES OF RAJAVITHI HOSPITAL)
 
Example article (บทความตัวอย่าง)
 
<More>
Untitled Document
 
This article is under
this collection.

Data Management
 
 
 
 
Copyright © 2006. Data Management & Biostatistics Journal.. All Rights Reserved
 
 
 
 

 


Warning: Unknown: Your script possibly relies on a session side-effect which existed until PHP 4.2.3. Please be advised that the session extension does not consider global variables as a source of data, unless register_globals is enabled. You can disable this functionality and this warning by setting session.bug_compat_42 or session.bug_compat_warn to off, respectively in Unknown on line 0