แม้ว่าจะมีการกำหนด “ความสำคัญ” อย่างเหมาะสมและคำนวณค่า P อย่างระมัดระวัง การอนุมานทางสถิติก็ยังมีปัญหาอื่นๆ อีกมากมาย ประเด็นสำคัญในหมู่พวกเขาคือประเด็น “หลายหลาก” ซึ่งเป็นการทดสอบสมมติฐานหลายข้อพร้อมๆ กัน เมื่อมีการทดสอบยาหลายตัวในคราวเดียว หรือทดสอบยาตัวเดียวในหลายกลุ่ม โอกาสที่จะได้ผลลัพธ์ที่มีนัยสำคัญทางสถิติแต่เป็นเท็จจะเพิ่มขึ้นอย่างรวดเร็ว การทดลองเกี่ยวกับกิจกรรมของยีนที่เปลี่ยนแปลงไปในโรคต่างๆ อาจทดสอบยีนได้ถึง 20,000 ยีนในคราวเดียว เป็นต้น การใช้ค่า P เท่ากับ .05 การศึกษาดังกล่าวสามารถค้นหายีน 1,000 ยีนที่ดูเหมือนจะแตก
ต่างกันแม้ว่าจะไม่มีส่วนใดที่เกี่ยวข้องกับโรคนี้จริงๆ
การตั้งค่าเกณฑ์ที่มีนัยสำคัญทางสถิติให้สูงขึ้นจะกำจัดพยาธิใบไม้บางส่วนออกไป แต่จะมีค่าใช้จ่ายในการกำจัดยีนที่เปลี่ยนแปลงอย่างแท้จริงออกจากรายการเท่านั้น ในโรคเมตาบอลิซึม เช่น เบาหวาน เป็นต้น ยีนจำนวนมากมีกิจกรรมต่างกันจริง ๆ แต่การเปลี่ยนแปลงนั้นเล็กมากจนการทดสอบทางสถิติจะมองข้ามส่วนใหญ่ว่าเป็นความผันผวนเพียงอย่างเดียว จากยีนหลายร้อยตัวที่ทำงานผิดปกติ สถิติมาตรฐานอาจระบุเพียงหนึ่งหรือสองยีน การเปลี่ยนแปลงเกณฑ์เพื่อจับ 80 เปอร์เซ็นต์ของผู้กระทำผิดที่แท้จริงอาจสร้างรายชื่อยีน 13,000 ยีน ซึ่งกว่า 12,000 ตัวเป็นผู้บริสุทธิ์จริงๆ
เมื่อตระหนักถึงปัญหาเหล่านี้ นักวิจัยบางคนจึงคำนวณ “อัตราการค้นพบที่ผิดพลาด” เพื่อเตือนความบังเอิญที่ปลอมแปลงเป็นผลกระทบที่แท้จริง และนักวิจัยด้านพันธุศาสตร์ได้เริ่มใช้ “การศึกษาความสัมพันธ์ทั่วทั้งจีโนม” ที่พยายามแก้ไขปัญหาหลายหลาก ( SN: 6/21/08, p. 20 )
ปัจจุบัน นักวิจัยหลายคนมักจะรายงานผลลัพธ์ด้วยช่วงความเชื่อมั่น ซึ่งคล้ายกับขอบของข้อผิดพลาดที่รายงานในแบบสำรวจความคิดเห็น ช่วงเวลาดังกล่าว โดยปกติจะเป็นช่วงที่ควรรวมค่าจริงที่มีความเชื่อมั่น 95 เปอร์เซ็นต์ จะช่วยให้เข้าใจได้ดีขึ้นว่าการค้นหานั้นแม่นยำเพียงใด แต่การคำนวณความเชื่อมั่น 95 เปอร์เซ็นต์ขึ้นอยู่กับคณิตศาสตร์เดียวกันกับค่า .05 P และยังคงแบ่งปันปัญหาบางอย่าง
การทดลองทางคลินิกและข้อผิดพลาด
ปัญหาทางสถิติยังส่งผลกระทบต่อ “มาตรฐานทองคำ” สำหรับการวิจัยทางการแพทย์ การทดลองทางคลินิกแบบสุ่มที่มีการควบคุมซึ่งทดสอบยาสำหรับความสามารถในการรักษาหรืออำนาจที่จะทำร้าย การทดลองดังกล่าวสุ่มให้ผู้ป่วยได้รับสารที่กำลังทดสอบหรือยาหลอก การเลือกแบบสุ่มควรรับประกันว่าลักษณะส่วนบุคคลของผู้ป่วยจะไม่ลำเอียงในการเลือกผู้ที่จะเข้ารับการรักษาจริง แต่ในทางปฏิบัติ ความลำเอียงในการคัดเลือกยังคงเกิดขึ้นได้ Vance Berger และ Sherri Weinstein ตั้งข้อสังเกตในปี 2547 ในControlled Clinical Trials “ประโยชน์บางประการที่กำหนดให้เป็นการสุ่ม เช่น กำจัดอคติในการคัดเลือกทั้งหมด สามารถอธิบายได้ว่าเป็นแฟนตาซีมากกว่าความเป็นจริง” พวกเขาเขียน
การสุ่มยังควรตรวจสอบให้แน่ใจว่าความแตกต่างที่ไม่รู้จักระหว่างบุคคลนั้นผสมกันในสัดส่วนที่ใกล้เคียงกันในกลุ่มที่ทำการทดสอบ แต่สถิติไม่ได้รับประกันว่าจะมีการแจกแจงที่เท่าเทียมกันมากกว่าที่พวกเขาห้าม 10 หัวติดต่อกันเมื่อพลิกเพนนี ด้วยการทดลองทางคลินิกหลายพันครั้ง บางส่วนจะไม่ได้รับการสุ่มตัวอย่างที่ดี และดีเอ็นเอมีความแตกต่างกันมากกว่าหนึ่งล้านจุดในแคตตาล็อกทางพันธุกรรมของมนุษย์ ดังนั้นแม้ในการทดลองเพียงครั้งเดียว ความแตกต่างก็อาจไม่ผสมกันอย่างเท่าเทียมกัน ในการทดลองขนาดใหญ่พอสมควร ปัจจัยที่ไม่สุ่มตัวอย่างอาจสมดุลกัน หากปัจจัยบางอย่างมีผลในเชิงบวกและบางส่วนมีผลลบ ( ดูช่อง3) ถึงกระนั้น ผลการทดลองได้รับการรายงานเป็นค่าเฉลี่ยที่อาจบดบังความแตกต่างของแต่ละบุคคล ปิดบังผลที่เป็นประโยชน์หรือเป็นอันตราย และอาจนำไปสู่การอนุมัติยาที่อาจเป็นอันตรายถึงชีวิตสำหรับบางชนิด และการปฏิเสธการรักษาที่มีประสิทธิภาพต่อผู้อื่น
แพทย์ David Kent และ Rodney Hayward เขียนใน American Scientist ในปี 2550 ว่า “การพิจารณาการรักษาที่ดีที่สุดสำหรับผู้ป่วยแต่ละรายนั้นแตกต่างจากการพิจารณาว่าการรักษาแบบใดดีที่สุดโดยเฉลี่ย” “การรายงานตัวเลขเพียงจำนวนเดียวทำให้เข้าใจผิดว่าผลการรักษาคือ คุณสมบัติของยามากกว่าการมีปฏิสัมพันธ์ระหว่างยากับโปรไฟล์ความเสี่ยงและผลประโยชน์ที่ซับซ้อนของผู้ป่วยกลุ่มใดกลุ่มหนึ่ง”
ข้อกังวลอีกประการหนึ่งคือกลยุทธ์ทั่วไปในการรวมผลลัพธ์จากการทดลองจำนวนมากเข้าเป็น “การวิเคราะห์เมตา” เดียว ซึ่งเป็นการศึกษาการศึกษา ในการทดลองเดี่ยวที่มีผู้เข้าร่วมค่อนข้างน้อย การทดสอบทางสถิติอาจตรวจไม่พบผลกระทบเล็กน้อยแต่เกิดขึ้นจริงและอาจมีความสำคัญ โดยหลักการแล้ว การรวมการศึกษาที่มีขนาดเล็กลงเพื่อสร้างตัวอย่างที่ใหญ่ขึ้นจะทำให้การทดสอบสามารถตรวจพบผลกระทบเล็กน้อยดังกล่าวได้ แต่เทคนิคทางสถิติสำหรับการทำเช่นนั้นจะใช้ได้ก็ต่อเมื่อตรงตามเกณฑ์ที่กำหนดเท่านั้น ประการหนึ่ง การศึกษาทั้งหมดที่ดำเนินการเกี่ยวกับยาจะต้องได้รับการเผยแพร่และไม่ได้เผยแพร่ และการศึกษาทั้งหมดควรทำในลักษณะเดียวกัน โดยใช้โปรโตคอล คำจำกัดความ ประเภทของผู้ป่วยและขนาดยาเดียวกัน เมื่อรวมการศึกษาเข้ากับความแตกต่าง ก่อนอื่นจำเป็นต้องแสดงให้เห็นว่าความแตกต่างเหล่านั้นจะไม่ส่งผลกระทบต่อการวิเคราะห์ Goodman ตั้งข้อสังเกต แต่นั่นแทบจะไม่เกิดขึ้นเลย
แนะนำ : ข่าวดารา | กัญชา | เกมส์มือถือ | เกมส์ฟีฟาย | สัตว์เลี้ยง