การตีความข้อมูล: เคล็ดลับสร้างความมั่นใจในวิธีอ่านตัวเลข

นักข่าวต่างประเทศมากประสบการณ์แนะเคล็ดลับการนำเสนอข่าวที่เกี่ยวข้องกับ 'ข้อมูลตัวเลข' ทำอย่างไรให้คำนวณไม่ผิดพลาด และตัวเลขที่ออกมานำไปทำข่าวเชิงเปรียบเทียบได้ โดยเฉพาะในช่วงโควิด-19 ที่ต้องพึงระวังอย่างมากในการเปรียบเทียบตัวเลขผู้ป่วยและผู้เสียชีวิต ซึ่งแต่ละประเทศมีปัจจัยในการคำนวณและประเมินผลต่างกัน

แม้คุณจะคำนวณถูกต้อง แต่การใส่ผลรวมที่ผิดพลาด ก็อาจทำให้ผู้อ่านเข้าใจผิดได้
ที่มา: Shutterstock (อ้างใน GIJN)
 

การเรียนรู้วิธีค้นหาและจัดการข้อมูลเป็นสิ่งสำคัญเมื่อต้องใช้ข้อมูลต่างๆ เพื่อทำงานข่าวสืบสวนสอบสวน แต่สิ่งสำคัญอีกประการหนึ่งคือคุณต้องตีความสิ่งที่ค้นพบอย่างถูกต้อง และดึงข้อสรุปที่ถูกต้องจากตัวเลข ตัวกรอง และโปรแกรมสเปรดชีต แม้คุณจะคำนวณถูกต้อง แต่หากใส่ผลรวมผิดพลาด ก็อาจทำให้ผู้อ่านเข้าใจผิดได้

แล้วทำไมถึงเกิดเรื่องเหล่านี้ขึ้น คำตอบคือเพราะบางครั้ง ข้อมูลที่เรากำลังจัดการอยู่นั้นไม่ได้ตอบคำถามที่เราถามจริงๆ หากเป็นในกรณีอื่น เราอาจลืมใช้จรรยาบรรณสื่อมวลชนแบบดั้งเดิมในขั้นตอนการเก็บรวบรวมและวิเคราะห์ข้อมูลเพื่อทำข่าวสืบสวนสอบสวน ดังนั้น เราควรระมัดระวังและไม่เลือกสถิติมาสนับสนุนมุมมองของเราโดยไม่คำนึงถึงบริบท หรือมุ่งตอบโจทย์คำถามของเรามากเกินไปจนมองข้ามสิ่งที่ข้อมูลสื่อสารออกมา สิ่งที่ต้องย้ำบ่อยๆ คือในงานวารสารศาสตร์เชิงข้อมูล ข้อมูลคือแหล่งที่มาของเรา และเราจำเป็นต้องเคารพในข้อมูลนั้น

ข้อผิดพลาดทั่วไป

บทเรียนที่หนึ่งคือต้องแน่ใจว่าคุณไม่ได้เขียนข้อสรุปเกี่ยวกับบุคคลใดบุคคลหนึ่ง โดยอิงจากข้อมูลที่รวบรวมขึ้นโดยแบ่งตามประเทศหรือการแบ่งข้อมูลแบบอื่นๆ เพราะความเป็นจริงจากมุมมองของคนในประเทศหรือสถานที่ที่คุณกำลังพูดถึงอาจแตกต่างอย่างมากกับความเข้าใจของคนจากที่อื่น

เฮเทอร์ เคราส์ (Heather Krause) นักวิทยาศาสตร์ข้อมูล ผู้ริเริ่มโครงการเพื่อความเท่าเทียมในวิทยาศาสตร์เชิงข้อมูล We All Count และผู้ก่อตั้งบริษัท Datassist จากประเทศแคนาดา อธิบายปัญหานี้ ที่เรียกว่า Ecological Fallacy พร้อมตัวอย่างเรื่องบุหรี่ โดยเขาระบุว่าเมื่อตรวจสอบอายุขัยและจำนวนบุหรี่ที่คนสูบในหลายประเทศ ดูเหมือนว่าจะมีความสัมพันธ์เชิงบวก

กล่าวคือ ผู้คนในประเทศที่มีอัตราการสูบบุหรี่สูงนั้นมีอายุขัยยืนยาวขึ้น อย่างไรก็ตาม การสรุปว่า ‘สูบบุหรี่ทำให้คุณมีอายุยืนยาวขึ้น’ นั้นเป็นเรื่องไม่ถูกต้อง เพราะนอกจากจะสวนทางกับตรรกะและข้อมูลการศึกษาทางวิทยาศาสตร์แล้ว ข้อมูลจากการศึกษานี้ไม่ได้ประเมินว่าบุหรี่ทำอะไรกับบุคคล แต่แค่เปรียบเทียบผลรวมตัวชี้วัด 2 ตัวในระดับชาติแบบง่ายๆ เท่านั้น

สิ่งที่ต้องย้ำให้บ่อยครั้งคือ ในงานวารสารศาสตร์เชิงข้อมูล ข้อมูลคือแหล่งที่มาของเรา และเราจำเป็นต้องเคารพในข้อมูลนั้น

ตรรกะวิบัติหรือการอ้างเหตุผลผิดๆ เช่นนี้เผยให้เห็นอีกหนึ่งปัญหาที่อาจนำไปสู่การตีความแบบผิดๆ เช่น ข้อมูลที่นำมาเปรียบเทียบกันนั้นไม่มีการเชื่อมโยงตามหลักเหตุและผล หรือความสัมพันธ์ของข้อมูล (Correlation) ไม่ใช่สิ่งทำให้เกิดผล (Causation) เนื่องจากข้อมูลไม่ได้รวบรวมไว้เพื่อดูว่าการสูบบุหรี่มากขึ้นส่งผลต่ออายุขัยหรือไม่ การวิเคราะห์ทางสถิตินี้จึงแสดงการคาดการณ์แทนที่จะเป็นผลเชิงสาเหตุ

ผู้สื่อข่าวที่ดูข้อมูลทั้งสองชุดนี้ควรคำนึงถึงตัวแปรอื่นๆ เพื่อหาคำอธิบายที่เป็นไปได้สำหรับความสัมพันธ์ของชุดข้อมูล เช่น เรื่องกำลังซื้อของผู้บริโภค ที่นอกจากจะเอื้อให้คนในประเทศที่ร่ำรวยซื้อบุหรี่แล้ว ยังเอื้อให้คนในประเทศเหล่านั้นเข้าถึงการดูแลสุขภาพที่ดีกว่าได้อีกด้วย

นอกจากต้องแน่ใจว่าการคำนวณของเราถูกต้องแล้ว ในฐานะนักข่าว เราต้องประเมินว่าตัวเลขดังกล่าวเปิดเผยความเป็นจริงที่เรากำลังพยายามรายงานหรือไม่ แซนดรา ครูเชียเนลลี (Sandra Crucianelli) ผู้อำนวยการหน่วยงานข้อมูลเชิงลึกประจำสำนักข่าว Infobae ของอาร์เจนตินา กล่าวเตือนเอาไว้ว่า “ระวังให้มากกับค่าเฉลี่ย เพราะตัวเลขเหล่านั้นอาจทำให้เข้าใจผิด หากมีช่วงระหว่างค่ามากเกินไป”

สิ่งนี้เกิดขึ้นค่อนข้างบ่อย เมื่อรายงานเกี่ยวกับเงินเดือนหรือปัญหาอื่นๆ ที่เกี่ยวข้องกับความไม่เท่าเทียมในประเทศที่มีความเหลื่อมล้ำสูง ตัวเลขเงินเดือนโดยเฉลี่ยไม่ใช่ภาพแทนความเป็นจริง เนื่องจากข้อมูลนี้ไม่ได้สะท้อนช่องว่างระหว่างคนรวยกับคนจน

มิกูเอล ปาซ (Miguel Paz) อดีตนักวิจัยของมูลนิธินีแมน (Nieman Foundation) และผู้ก่อตั้งเว็บไซต์ Reveniu.com แนะนำให้นักข่าวใช้ค่ามัธยฐาน ซึ่งเป็นค่าที่อยู่ในตำแหน่งศูนย์กลางของรายการข้อมูลที่มีการจัดระเบียบ เพราะค่ามัธยฐานนั้นใกล้เคียงกับค่าของคนส่วนใหญ่

“เราต้องหยุดใช้ค่าเฉลี่ย!” ปาซกล่าวเตือนนักข่าวอยู่บ่อยครั้ง ในฐานที่เป็นผู้พัฒนาโครงการวารสารศาสตร์เชิงข้อมูลหลายโครงการ และเป็นผู้จัดประชุมเชิงปฏิบัติการในประเด็นเรื่องข้อผิดพลาดทางข้อมูลที่อาจเกิดขึ้นได้ แม้นักข่าวจะคำนวณตัวเลขไว้อย่างถูกต้องแล้วก็ตาม

การระบาดใหญ่ได้พิสูจน์ให้เห็นแล้วว่าเป็นสิ่งสำคัญสำหรับนักข่าวในทุกสาขาที่จะต้องรู้เท่าทันข้อมูล เพื่อจัดการกับข้อมูลที่รวบรวมได้อย่างถูกต้อง

อย่างไรก็ดี เปอร์เซ็นต์และอัตราต่างๆ ยังเป็นสิ่งดีที่ใช้อธิบายเงื่อนไขทางสังคมและประชากรศาสตร์ ผู้เขียนเห็นรายงานของสื่อหลายสิบฉบับบอกว่า "เมเดยินเป็นเมืองที่อันตรายที่สุด" หรือ "โบโกตาเป็นเมืองที่แย่ที่สุดสำหรับคนที่มีโทรศัพท์มือถือ" แต่รายงานเหล่านี้ใช้เฉพาะค่าสัมบูรณ์เท่านั้น ดังนั้นจึงไม่สะท้อนสถานการณ์ความปลอดภัยที่แท้จริงไม่ได้ หากนักข่าวที่ทำงานเกี่ยวกับเรื่องพวกนี้ใช้การวิเคราะห์เชิงสัมพัทธ์ โดยพิจารณาบริบทข้อมูลที่สัมพันธ์กับประชากรหรือการใช้โทรศัพท์มือถือ พวกเขาจะพบว่าตัวเลขเหล่านั้นไม่ได้เลวร้ายอย่างที่ค่าสัมบูรณ์ชี้ให้เห็นในบริบทของกรุงโบโกตา เมืองหลวงของประเทศโคลอมเบีย ที่มีประชากรอาศัยอยู่กว่า 8 ล้านคน หรือในเมืองเมเดยิน ที่มีประชากรกว่า 2.5 ล้านคน อีกทั้งในความเป็นจริงแล้ว เมืองอื่นๆ ควรถูกให้ความสนใจด้วยเช่นกัน โดยเฉพาะเมืองที่มีอัตราการเกิดอาชญากรรมต่อหัวที่สูงกว่าปกติ

นอกจากนี้ พาดหัวข่าวที่ได้กล่าวถึงในย่อหน้าที่แล้ว ยังแสดงให้เห็นว่าการเหมารวม (Generalization) อาจทำให้เกิดปัญหาได้อย่างไร ดังนั้นในการสำรวจว่าเมืองใดเป็นอันตรายที่สุด จึงจำเป็นต้องแสดงตัวบ่งชี้จำนวนมากขึ้นเพื่อให้มีความรอบด้านยิ่งขึ้น

โควิด-19 และจุดเปลี่ยนที่ยิ่งใหญ่ด้านข้อมูล

นักข่าวต้องกลายเป็นนักข่าวเชิงข้อมูลในชั่วข้ามคืน เพื่อแสดงให้เห็นจำนวนผู้ป่วยที่เพิ่มขึ้น
แต่การเปรียบเทียบระหว่างประเทศอาจเป็นเรื่องยาก | ที่มา: Shutterstock (อ้างใน GIJN)
 

สิ่งที่คล้ายกันกับตัวอย่างที่กล่าวมานั้นเกิดขึ้นแล้วในการรายงานข่าวเกี่ยวกับ COVID-19 ที่การรายงานข่าวหลายครั้งต้องเปรียบเทียบจำนวนผู้ติดเชื้อหรือผู้เสียชีวิตในแต่ประเทศ แต่การเปรียบเทียบจำนวนเหล่านี้มักไม่ถูกต้อง เนื่องจากการใช้อัตราการติดเชื้อหรือจำนวนผู้ติดเชื้อเทียบกับจำนวนประชากรเป็นสิ่งที่ถูกต้องกว่า แต่ด้วยปัจจัยต่างๆ ยิ่งทำให้การเปรียบเทียบระหว่างประเทศทำได้ยาก

ตัวอย่างเช่น ในช่วงเดือนแรกของการระบาด บางประเทศไม่ได้รวมการเสียชีวิตที่เกิดขึ้นในบ้านพักคนชรา แต่ภายหลังได้รวมไว้ ในบางประเทศ จะนับตัวเลขผู้เสียชีวิตจากโควิด-19 เฉพาะในกรณีที่ไวรัสเป็นสาเหตุหลักของการเสียชีวิตหรือต้องมีการทดสอบยืนยันว่าติดเชื้อไวรัสนี้จริงในขณะที่เสียชีวิต ในขณะที่อีกหลายประเทศมีเกณฑ์ที่หละหลวมกว่านี้ นอกจากนี้ การพิจารณาระยะเวลาการระบาดในแต่ละประเทศเป็นสิ่งที่สำคัญเช่นกัน เนื่องจากปัจจัยอื่นๆ อย่างระบบสุขภาพที่เข้มแข็งหรืออ่อนแอจะสร้างความแตกต่างในการที่รัฐบาลแต่ละประเทศตอบสนองต่อการระบาดของเชื้อไวรัส

จากการรายงานข่าวโรคระบาดครั้งใหญ่ มีตัวบ่งชี้สำคัญอีกประการหนึ่งที่ต้องคำนึงถึง นั่นคือ อัตราการเสียชีวิตจากการติดเชื้อ หรือจำนวนผู้เสียชีวิตจากโควิด-19 หารด้วยผู้ติดเชื้อทั้งหมด ปัญหาของตัวเลขนี้คือ แต่ละประเทศได้กำหนดระบบการวินิจฉัยของตนเอง บางประเทศมีการทดสอบมากกว่าประเทศอื่น บางประเทศเปลี่ยนความถี่ในการทดสอบเมื่อมีการระบาดใหญ่ ซึ่งทำให้การเปรียบเทียบเป็นไปไม่ได้ และในหลายประเทศ เชื่อกันว่าผู้ป่วยที่ลงทะเบียนมีจำนวนน้อยกว่าจำนวนผู้ป่วยจริงอยู่มาก (เนื่องจากขาดอุปกรณ์ทดสอบ) รวมถึงตัวเลขผู้เสียชีวิต (เนื่องจากไม่ได้ลงทะเบียนผู้เสียชีวิตทั้งหมดที่เกี่ยวข้องกับโควิด-19) สิ่งเหล่านี้ทำให้การเปรียบเทียบตัวเลขระหว่างประเทศ เช่น สหราชอาณาจักร สหรัฐอเมริกา และอินเดียเป็นเรื่องที่ยากลำบาก ช่วงแรกที่โรคโควิด-19 เริ่มระบาดหนักในสหราชอาณาจักร ทางการอนุญาตให้ผู้ที่ได้รับการตรวจหาเชื้อต้องเป็นผู้ที่เข้ารับการรักษาในโรงพยาบาลเท่านั้น ซึ่งทำให้อัตราการเสียชีวิตดูสูงกว่าที่เป็นจริง เนื่องจากระบบการทดสอบเลือกเฉพาะกรณีที่ร้ายแรงที่สุดเท่านั้น

การระบาดใหญ่ได้พิสูจน์ให้เห็นแล้วว่าสิ่งสำคัญสำหรับนักข่าวในทุกสาขา คือ ต้องรู้เท่าทันข้อมูล เพื่อจัดการกับข้อมูลที่รวบรวมได้อย่างถูกต้อง และควรระมัดระวังอย่านำตัวแปรที่ไม่เปรียบเทียบกันไม่ได้มาใช้แบบผิดๆ แม้เจ้าหน้าที่รัฐจำนวนมากจะทำผิดพลาดในเรื่องนี้ แต่ในฐานะนักข่าว เราต้องเรียนรู้ที่จะมองเห็นข้อผิดพลาดเหล่านี้และหลีกเลี่ยงการทำผิดซ้ำ

อีกตัวอย่างหนึ่งจากช่วงก่อนเกิดโรคระบาดครั้งใหญ่ คือ Colombiacheck องค์กรสื่อที่ตรวจสอบข้อเท็จจริงแห่งแรกในโคลอมเบีย องค์กรดังกล่าวตรวจสอบข้อเรียกร้องจากสมาชิกรัฐสภาหญิงที่กล่าวว่าที่ดินในชนบทส่วนใหญ่ตกอยู่ในมือของชุมชนคนผิวดำและชนเผ่าพื้นเมือง ซึ่งก่อให้เกิดความขัดแย้งอย่างมาก เนื่องจากชุมชนเหล่านี้มักตกเป็นเหยื่อของการยึดที่ดินอันเป็นผลจากความขัดแย้งในประเทศที่มีมาช้านาน ระหว่างการตรวจสอบคำกล่าวของเธอ ผู้สื่อข่าวได้เรียนรู้ว่าแม้ว่าตัวเลขอย่างเป็นทางการจะแสดงให้เห็นว่าคน 2 กลุ่มนี้ครอบครองที่ดินมากกว่าชาวโคลอมเบียเชื้อสายอื่นๆ แต่ถือเป็นความผิดพลาด หากเสนอข่าวไปว่าการถือครองโฉนดที่ดินร่วมของชุมชนเหล่านั้นหมายถึงการที่บุคคลในชุมชนดังกล่าวมีอำนาจเป็นเจ้าของที่ดินมากกว่า

เคล็ดลับการปกป้องวิธีตีความข้อมูลของคุณ

ต่อไปนี้เป็นรายการตรวจสอบเพื่อให้แน่ใจว่าคุณกำลังตีความข้อมูลอย่างถูกต้องก่อนเผยแพร่:

  • ถามตัวเองเสมอว่าข้อมูลเกี่ยวข้องกับคำถามการสืบสวนของคุณจริงๆ หรือไม่ มีข้อมูลเพียงพอหรือไม่ เช่น ฉันมองจากมุมมองของฝ่ายขวาหรือไม่ ฉันถามคำถามเพียงพอกับข้อมูลหรือไม่ ฉันย่อยข้อมูลมากพอที่จะเห็นความแตกต่างที่สำคัญทั้งหมดหรือไม่ ตัวแปรเทียบเคียงได้หรือไม่
  • บอกเล่าเรื่องราวตามระดับข้อมูลที่คุณมี หากคุณมีข้อมูลระดับประเทศ สิ่งที่คุณค้นพบควรระบุถึงแนวโน้มหรือการคาดการณ์ระดับประเทศเท่านั้น หากคุณมีข้อมูลในระดับบุคคล คุณสามารถสรุปได้เพียงพฤติกรรมหรือแนวโน้มของผู้คน
  • ตรวจสอบว่าตัวแปรที่คุณกำลังวิเคราะห์มีความสัมพันธ์เชิงสาเหตุโดยตรง (อันหนึ่งเป็นสาเหตุให้อีกตัวแปรหนึ่งเกิดขึ้น) หรือมีองค์ประกอบตัวกลางที่ควรนำมาพิจารณาหรือไม่ คุณสามารถทำได้โดยดูที่วิธีการรวบรวมและประมวลผลข้อมูล
  • หากความสัมพันธ์ไม่ใช่สาเหตุ แต่เป็นการทำนาย อย่าลืมเล่าเรื่องในลักษณะนั้นด้วยประโยคเช่น “ถ้า x เพิ่มขึ้น มีแนวโน้มว่า y จะตกลงมา” หากความสัมพันธ์เป็นเรื่องบังเอิญ ให้พิจารณาละทิ้งจุดนั้น
  • ตระหนักถึงการขึ้นทะเบียนแต่ละรายการ (บุคคล ข้อเท็จจริง กรณีศึกษา สถานที่) หมายถึงอะไร และอธิบายสิ่งที่คุณค้นพบตามข้อมูลนั้นๆ
  • เมื่อคุณพบสิ่งผิดปกติ อย่าเร่งรีบเผยแพร่ข่ายอย่าง ขั้นแรกให้ดูว่าคุ้มหรือไม่ที่จะนำเสนอข่าวคำอธิบายสำหรับค่าที่สูงหรือต่ำเกินไป พร้อมดูว่าข้อมูลมีข้อบกพร่อง หรือมีองค์ประกอบพิเศษที่อธิบายค่าผิดปกติหรือไม่
  • พิจารณาการใช้สถิติในการวิเคราะห์ข้อมูล อาจเป็นเปอร์เซ็นต์ การใช้ค่าเฉลี่ย อัตรา หรืออัตราส่วน การตัดสินใจของคุณจะขึ้นอยู่กับลักษณะของข้อมูลและหัวข้อ
  • พูดคุยกับผู้เชี่ยวชาญ นักสถิติสามารถช่วยคุณระบุประเภทของข้อมูลที่คุณกำลังเผชิญอยู่ การคาดคะเน การเป็นเหตุเป็นผล การเปรียบเทียบหรืออื่นๆ นอกจากนี้ ผู้เชี่ยวชาญเฉพาะด้านของเรื่องราวอาจช่วยให้คุณเห็นช่องว่างการตีความที่ผิดพลาด องค์ประกอบที่ขาดหายไป รวมถึงความสัมพันธ์ใหม่ของข้อมูล

ท้ายที่สุด นักข่าวควรพึงระลึกไว้เสมอว่าเรื่องราวต่างๆ ที่ได้รับการตีพิมพ์อันเป็นผลมาจากการลงลึกในข้อมูลเหล่านี้ส่งผลต่อการตัดสินใจของประชาชนและรัฐบาล การประมวลผลข้อมูลและการรู้เท่าทันข้อมูลมีความสำคัญ หากเราไม่คำนึงถึงปัจจัยที่จำเป็นทั้งหมดและสรุปผลโดยปราศจากการวิเคราะห์ตามบริบทที่จำเป็น เราอาจดึงความสนใจไปยังจุดโฟกัสที่ผิด อาจชักจูงให้คนทำสิ่งที่เป็นอันตรายต่อตนเอง หรือสร้างเรื่องราวที่เบียดขับผู้คนกลุ่มหนึ่งโดยไม่ได้ตั้งใจ

แปลและเรียบเรียงจาก:

มีเรียม โฟเรโร เอรีซา (Miriam Forero Ariza) เป็นผู้สื่อข่าวอิสระชาวโคลอมเบีย ที่ทำงานด้านข่าวสืบสวนสอบสวนและข่าวเชิงข้อมูล ผลงานของเธอเผยแพร่โดย VICE, Colombiacheck และ El Espectador เธอมีประสบการณ์ทำงานนับสิบปี ในความร่วมมือทำข่าวเชิงสืบสวนสอบสวน การวิเคราะห์ข้อมูล การประมวลข้อมูลเป็นภาพ เธอยังเป็นผู้แต่งร่วมของคู่มือนักข่าวเชิงข้อมูลที่ชื่อ  Iberoamerican Data Journalism Handbook

ร่วมบริจาคเงิน สนับสนุน ประชาไท โอนเงิน กรุงไทย 091-0-10432-8 "มูลนิธิสื่อเพื่อการศึกษาของชุมชน FCEM" หรือ โอนผ่าน PayPal / บัตรเครดิต (รายงานยอดบริจาคสนับสนุน)

ติดตามประชาไทอัพเดท ได้ที่:
Facebook : https://www.facebook.com/prachatai
Twitter : https://twitter.com/prachatai
YouTube : https://www.youtube.com/prachatai
Prachatai Store Shop : https://prachataistore.net
ข่าวรอบวัน
สนับสนุนประชาไท 1,000 บาท รับร่มตาใส + เสื้อโปโล

ประชาไท