ถอดบทเรียนการสร้างฐานข้อมูลเพื่อการผลิตข่าวเชิงสืบสวนสอบสวน

ที่มา: Julia Joppien / Unsplash (อ้างใน GIJN)

 

เมื่อต้นปี 2021 ที่ผ่านมา ขณะที่ประเทศโคลอมเบียต้องสั่นสะเทือนจากการประท้วง การเผชิญหน้าด้วยอาวุธและข้อกล่าวหาเรื่องการลุแก่อำนาจของตำรวจ นักข่าวเองก็ต่างพยายามติดตามเหตุการณ์ต่างๆ ให้ทัน

เมื่อวิกฤตทวีความรุนแรงขึ้น สื่ออิสระและองค์กรสิทธิมนุษยชนหลายแห่งเริ่มสร้างฐานข้อมูลของตนเอง เพื่อบันทึกตัวเลขผู้เสียชีวิตที่เชื่อมโยงกับการประท้วง ซึ่งองค์กรพัฒนาเอกชนหลายแห่งได้นับยอดเอาไว้อยู่ที่มากกว่า 70 รายในต้นเดือนกรกฎาคม นอกจากนั้นพวกเขายังได้เริ่มบันทึกข้อกล่าวหาเรื่องการใช้อำนาจโดยมิชอบ ความรุนแรง และการกักขังผู้ประท้วงอีกด้วย

สำนักข่าวทั่วโลกต่างก็กำลังสร้างฐานข้อมูลของตนเองเมื่อเผชิญกับการขาดแคลนข้อมูลที่เป็นทางการ หรือในกรณีที่ข้อมูลที่มีอยู่ไม่น่าเชื่อถือ ในบางแห่งก็มีการสร้างไว้เพื่อเป็นแหล่งข้อมูลการรายงานหรือการสืบสวนในขณะที่มีเหตุการณ์เกิดขึ้น หรือเมื่อจำเป็นต้องตรวจสอบแหล่งข้อมูลต่างๆ

หนึ่งในฐานข้อมูลดังกล่าวได้รับการออกแบบโดย “Rutas del Conflicto” (หรือ Routes of Conflict) องค์กรสื่อดิจิทัลที่ปกติใช้เทคนิคการสืบสวนและการทำข่าวเชิงข้อมูลครอบคลุมความขัดแย้งทางอาวุธตลอด 50 ปีทีผ่านมาของโคลอมเบียเมื่อต้นปีนี้ กลุ่มดังกล่าวได้เริ่มพูดถึงความรุนแรงที่เกี่ยวข้องกับการประท้วง ซึ่งเริ่มต้นจากการเสนอให้ปฏิรูปภาษี แต่กลับกลายเป็นการประท้วงต่อต้านรัฐบาลทั่วๆ ไป

นำทีมโดยนักข่าวชื่อออสการ์ ปาร์รา (Óscar Parra) ร่วมกับทีมนักข่าว นักศึกษาวารสารศาสตร์ นักพัฒนา และนักออกแบบกราฟิก Rutas del Conflicto ได้สร้างฐานข้อมูลเพื่อลงทะเบียนผู้เสียชีวิตในระหว่างการประท้วงที่สั่นสะเทือนเมืองต่างๆ ทั่วประเทศ

ทีมงานนี้สร้างฐานข้อมูลเพื่อตรวจสอบกรณีความรุนแรงต่างๆ ผ่านการรวบรวมข้อมูลจากกิจกรรมประจำวัน รายงานข่าว องค์กรพัฒนาเอกชน (NGO) และการสัมภาษณ์พยานและญาติของเหยื่อ ซึ่งฐานข้อมูลนี้ก็ช่วยให้พวกเขาทำแผนที่เหตุการณ์และสำรวจได้ว่าเหยื่อคือใคร สถานการณ์ที่แวดล้อมการเสียชีวิตของเหยื่อ รวมถึงเปิดโปงความทารุณของเจ้าหน้าที่ตำรวจที่บ่อยครั้งอยู่เบื้องหลังของเหตุการณ์

นี่ไม่ใช่ครั้งแรกที่ปาร์ราได้สร้างฐานข้อมูลที่สามารถใช้สำหรับงานสื่อสารมวลชน ในความเป็นจริง Rutas del Conflicto เปิดตัวในปี 2012 โดยการทำข่าวเกี่ยวกับกระบวนการยุติธรรมในช่วงเปลี่ยนผ่าน ซึ่งอดีตสมาชิกกองกำลังแห่งหนึ่งในโคลอมเบียได้ให้หลักฐานเกี่ยวกับบทบาทของพวกเขาในสงครามโคลอมเบียกับกองกำลังติดอาวุธปฏิวัติโคลอมเบีย (Revolutionary Armed Forces of Colombia—People's Army) หรือ FARC

ปาร์ราตระหนักดีว่าการพิจารณาคดีมักเปิดเผยรายละเอียดเกี่ยวกับการสังหารหมู่ที่มีพลเรือนและกองกำลังของรัฐถูกสังหาร “ดังนั้น ฉันคิดว่าควรจัดกลุ่มข้อมูลทั้งหมดนั้นในฐานข้อมูลเพื่อพยายามสร้างเครื่องมือทำแผนที่และไทม์ไลน์” เขากล่าว และเสริมว่าเรื่องราวส่วนบุคคลที่เกี่ยวข้องกับการปรากฏตัวในศาลแต่ละครั้ง ไม่สามารถให้ภาพรวมของสิ่งที่เกิดขึ้นได้ในแบบที่แผนที่สามารถทำได้

ปาร์ราใช้ความรู้ของเขาในฐานะอดีตวิศวกรด้านระบบ บวกกับความหลงใหลในงานวารสารศาสตร์เชิงสืบสวนเพื่อฝึกอบรมนักเรียนกลุ่มหนึ่งและหาเงินทุนก่อตั้ง Rutas del Conflicto ซึ่งต่อมาได้รับรางวัล Data Journalism Award ประจำปี 2017 สำหรับเว็บไซต์วารสารศาสตร์ข้อมูลยอดเยี่ยม

Peace on the Ground เป็นโครงการข้อมูลที่ตรวจสอบความรุนแรงในโคลอมเบียหลังจากการลงนามในข้อตกลงสันติภาพ | ที่มา: ได้รับความอนุเคราะห์จาก Rutas del Conflicto (อ้างใน GIJN)
 

หลังจากนั้น ทีมงานได้ดำเนินการตามขั้นตอนเดียวกันในการรวบรวม จัดระเบียบ และประมวลผลข้อมูลเกี่ยวกับวิธีการที่เหยื่อของความขัดแย้งถูกบังคับให้สูญหายไปในแถบแม่น้ำทั่วประเทศ รวมถึงความสัมพันธ์ระหว่างความรุนแรงในโคลอมเบียกับข้อพิพาทเกี่ยวกับอสังหาริมทรัพย์

ขณะเดียวกัน สำนักข่าวทั่วโลกต่างก็กำลังสร้างฐานข้อมูลของตนเองเมื่อเผชิญกับการขาดแคลนข้อมูลที่เป็นทางการ หรือในกรณีที่ข้อมูลที่มีอยู่ไม่น่าเชื่อถือ หรือเพื่อเป็นแหล่งข้อมูลการรายงานหรือการสืบสวนในขณะที่กำลังเกิดเหตุการณ์ขึ้น หรือเมื่อจำเป็นต้องตรวจสอบแหล่งข้อมูลต่างๆ

“การไม่มีข้อมูลที่คุณต้องการไม่ใช่เหตุผลที่จะไม่เล่าเรื่องที่คุณเชื่อว่าอาจเป็นประโยชน์ต่อสาธารณะ” รอมเนีย โคลแมน (Romina Colman) ผู้เชี่ยวชาญด้านวารสารศาสตร์เชิงข้อมูลชาวอาร์เจนตินาและบรรณาธิการแผนกข้อมูลลาตินอเมริกาในโครงการ Organized Crime and Corruption Reporting (OCCRP) กล่าว

ในขณะที่นักข่าวเชิงสืบสวนอาจพบข้อมูลในรูปแบบต่างๆ เช่น รายงานที่มาในรูปแบบไฟล์สกุล .pdf เอกสารที่ยุ่งเหยิง บทสัมภาษณ์และข้อสังเกตของนักข่าว ไฟล์ที่ถูกสแกนมา เอกสารที่เขียนด้วยลายมือ ไปจนถึงจดหมายเหตุเก่า ทั้งหมดนี้ หากมีความชำนาญที่ถูกต้องเหมาะสม สิ่งเหล่านี้จะสามารถถูกเปลี่ยนเป็นฐานข้อมูลที่สามารถประมวลผลได้ทั้งหมด

“ฉันได้เรียนรู้สิ่งนี้ในปี 2009 เมื่อฉันทำงานเกี่ยวกับการสร้างฐานข้อมูลกับสมาชิก GIJN ที่สมาคมนักข่าวสืบสวนของโคลอมเบีย (Consejo de Redacción) เราต้องการสร้างฐานข้อมูลสำหรับพันธมิตรนักข่าวที่จะช่วยพวกเขาตรวจสอบเจ้าหน้าที่ของรัฐและการทุจริต สมัยนั้นเครื่องมือในการดึงข้อมูลจากเอกสารมีน้อยมาก การทำวารสารศาสตร์ด้วยข้อมูลเพิ่งเริ่มต้นในโคลอมเบีย และเราเข้าถึงข้อมูลดิจิทัลจากรัฐบาลได้อย่างจำกัด”

ดังนั้น เราจึงเริ่มด้วยการถอดความเอกสารที่เป็นกระดาษหลายร้อยฉบับ หลายฉบับเป็นลายมือ ซึ่งเจ้าหน้าที่รัฐได้เขียนไว้เกี่ยวกับเรื่องการทับซ้อนกันแห่งผลประโยชน์ของตัวเองและผู้บริจาคในการหาเสียง ใน 2-3 ปีต่อมา เราสามารถรวบรวมบันทึกได้มากกว่า 2 ล้านชิ้น หลังจากเพิ่มข้อมูลที่เกี่ยวข้องอื่นๆ จากแหล่งข้อมูลทางการกว่า 20 แห่ง จนนำไปสู่การเปิดโปงการประพฤติมิชอบทางการเมืองหลายครั้ง เช่น นิตยสารสืบสวนชั้นนำ Semana ที่ทำข่าวเรื่องการแจกจ่ายที่ดินโดยมิชอบ

ในขณะที่นักข่าวเชิงสืบสวนอาจพบข้อมูลในรูปแบบต่างๆ เช่น รายงานที่มาในรูปแบบไฟล์สกุล .pdf เอกสารที่ยุ่งเหยิง บทสัมภาษณ์และข้อสังเกตของนักข่าว ไฟล์ที่ถูกสแกนมา เอกสารที่เขียนด้วยลายมือ ไปจนถึงจดหมายเหตุเก่า ทั้งหมดนี้ หากมีความชำนาญที่ถูกต้องเหมาะสม สิ่งเหล่านี้จะสามารถถูกเปลี่ยนเป็นฐานข้อมูลที่สามารถประมวลผลได้ทั้งหมด

ในปี 2011 ซึ่งเป็นปีที่เทคนิคการจัดการและวิเคราะห์ข้อมูลได้รับความนิยมในฐานะเทคนิคเชิงวารสารศาสตร์  โคลอมเบียได้เข้าร่วมโครงการ Open Government Partnership โครงการระดับโลกที่ลงนามโดย 78 ประเทศเพื่อปรับปรุงความโปร่งใส ทีมของฉันจึงได้รับโอกาสให้สร้างฐานข้อมูลเพื่อบอกเล่าเรื่องราวที่เกี่ยวข้องต่อไป เรื่องหนึ่งที่ได้ทำคือการเจาะลึกถึงความเชื่อมโยงระหว่างเจ้าหน้าที่บัญชีท้องถิ่น เจ้าหน้าที่ของรัฐผู้มีหน้าที่ตรวจสอบการทำงานของนายกเทศมนตรีและผู้ว่าราชการจังหวัด นอกจากนี้ สมาชิกของทีมได้วิเคราะห์ว่าใครเป็นผู้ให้เงินสนับสนุนการรณรงค์หาเสียงในการเลือกตั้งประธานาธิบดีและรัฐสภาในปี 2018 โดยการตรวจสอบรายงานของผู้สมัครกับสัญญาของภาครัฐ การจดทะเบียนบริษัท และข้อมูลประวัติของเจ้าหน้าที่รัฐในท้องถิ่น

แม้ว่านักข่าวได้เริ่มสร้างฐานข้อมูลตั้งแต่ช่วงทศวรรษ 1980 แต่ในช่วงไม่กี่ปีมานี้ เทคโนโลยีสำหรับการดึงข้อมูลจากหน้าเว็บ การแปลงไฟล์ .pdf การแก้ไขไฟล์ที่สแกนได้ และการรวบรวมข้อมูลจำนวนมากได้เกิดขึ้นและเข้าถึงได้มากขึ้น นักข่าวเองก็ได้รับการฝึกอบรมในสิ่งที่เคยเรียกว่าการรายงานโดยใช้คอมพิวเตอร์ช่วย ซึ่งปัจจุบันเรียกว่าวารสารศาสตร์เชิงข้อมูล ก็เพิ่มมากขึ้น นอกจากนั้น ความร่วมมือระหว่างนักข่าวกับนักพัฒนาหรือวิศวกรคอมพิวเตอร์ก็เพิ่มมากขึ้นเช่นกัน ทำให้การสร้างฐานข้อมูลสำหรับวัตถุประสงค์ด้านข่าวเป็นเรื่องง่ายและเป็นไปได้มากขึ้น

สำนักข่าวทั่วโลกได้สร้างฐานข้อมูลเพื่อตรวจสอบทรัพย์สินที่ยึดมาจากอาชญากรในอิตาลี การเสียชีวิตจากปืนไฟฟ้าและการใช้กำลังของตำรวจในสหรัฐอเมริกา ตลอดจนทำความร่วมมือด้านการสืบสวนข้ามชาติ เมื่อเร็วๆ นี้ กลุ่มนักข่าวจาก 12 ประเทศได้สร้างฐานข้อมูลที่มีข้อมูลที่ไม่เคยมีการจัดระบบมาก่อน ซึ่งเกี่ยวข้องกับคดีการใช้ความรุนแรงต่อนักปกป้องสิทธิด้านสิ่งแวดล้อมในละตินอเมริกาจำนวน 2,460 คดี ทางกลุ่มได้ตีพิมพ์รายงานการสืบสวน 36 เรื่องเกี่ยวกับชุดข้อมูลนี้ในโครงการพิเศษที่เรียกว่า Land of Resistance (Tierra de Resistentes

ภาพของนักข่าวส่วนหนึ่งจากโครงการ | ที่มา: Tierra de Resistentes (อ้างใน GIJN)
 

ในอีกด้านหนึ่งของโลก โครงการ OCCRP ได้รับรางวัล Sigma Award ปี 2020 สำหรับการฟอกเงินโดยชนชั้นนำในรัสเซีย ซึ่งทีมงานใช้เทคโนโลยีที่ทันสมัยในการดึงข้อมูลธุรกรรมมากกว่า 1.3 ล้านรายการจากบันทึกธนาคารหลายร้อยรายการ งานนี้เผยให้เห็นว่าผู้มีอำนาจและนักการเมืองชาวรัสเซียแอบลงทุนเงินนับล้านของพวกเขาที่ได้มาอย่างผิดกฎหมายในธุรกิจที่ต่างประเทศอย่างลับๆ เพื่อฟอกเงินและหลบเลี่ยงภาษีได้อย่างไร

โครงการเหล่านี้มีความโดดเด่นในการรวบรวมข้อมูลจากหลายแหล่งที่ไม่ได้เปิดเผยต่อสาธารณะหรืออยู่กระจัดกระจายกัน เพื่อนำมาเล่าเรื่องที่มีผลกระทบในวงกว้าง ซึ่งการทำเช่นนั้นจะเป็นไปไม่ได้หากไม่มีฐานข้อมูลให้นักข่าวเจาะลึกเรื่องราวนั้นๆ อย่างไรก็ดี นักข่าวเชิงสืบสวนเองก็สามารถสร้างฐานข้อมูลในขนาดที่เล็กกว่าแต่ยังสร้างส่งผลกระทบอย่างมหาศาลได้อยู่ และต่อไปนี้คือคำแนะนำทีละขั้นตอนเกี่ยวกับวิธีการสร้างฐานข้อมูลสำหรับการสืบสวน

1. เตรียมตัวให้พร้อม

  • สำรวจเอกสารที่คุณจะดึงข้อมูล ดูว่าสามารถจัดเป็นรูปแบบใดๆ ได้หรือไม่ องค์ประกอบที่คล้ายคลึงกันของเอกสารเหล่านี้สามารถบ่งบอกวิธีการจัดโครงสร้างฐานข้อมูลได้ หากคุณเริ่มต้นจากศูนย์และจะได้รับบันทึกจากการสัมภาษณ์และการรายงานแบบดั้งเดิม ให้วิเคราะห์กรณีหรือเรื่องราวที่คล้ายคลึงกันเพื่อค้นหาจุดร่วม การพูดคุยกับผู้เชี่ยวชาญในขั้นตอนการสำรวจนี้อาจเป็นประโยชน์
  • กำหนดขอบเขตของข้อมูลที่คุณจะรวบรวม เช่น ข้อมูลจะครอบคลุมช่วงเวลาใด จะรวมกรณีใดบ้างและจะยกเว้นกรณีใด (ซึ่งต้องใช้เกณฑ์ที่ชัดเจนและเฉพาะเจาะจงอย่างยิ่ง) เอกสารที่คุณเข้าถึงมีจำนวนจำกัดหรือไม่ ทรัพยากรของโครงการของคุณ เช่น เวลา ทีม เงินทุน เทคโนโลยี ฯลฯ จะช่วยคุณตอบคำถามเหล่านี้
  • ทำรายการคำถามที่คุณต้องการตอบระหว่างการสอบสวน สิ่งนี้จะช่วยนำทางในการออกแบบฐานข้อมูล
  • ส่งเสริมการทำงานเป็นทีม โดยเฉพาะอย่างยิ่งในระยะเริ่มแรก การปรึกษาหารือกับพื่อนร่วมทีมช่วยให้ขั้นตอนเบื้องต้นที่สำคัญนี้ง่ายขึ้นและทำให้งานของคุณแข็งแกร่งขึ้น อันที่จริง สิ่งนี้คือจุดเริ่มต้นของโครงการ Tierra de Resistentes: ฐานข้อมูลและการสอบสวนที่ถูกสร้างขึ้นในระหว่างการประชุมเชิงปฏิบัติการด้านวารสารศาสตร์เชิงสืบสวน

2. ออกแบบและพัฒนาฐานข้อมูล

  • เริ่มต้นด้วยการกำหนดรายการบันทึกที่หัวตารางแนวนอน (row) เช่น แบ่งเป็นกรณี บุคคล สถานที่ ผลิตภัณฑ์ เหตุการณ์ ประเทศ ธุรกรรม เป็นต้น
  • จากนั้น ให้สร้างหัวข้อขอบเขตข้อมูล (field) ในแถวตารางแนวตั้ง (column) ยกตัวอย่างเช่น หากหัวตารางแนวนอนเป็นชื่อบุคคล แถวตารางแนวตั้งก็อาจจะเป็นชื่อ เลขประจำตัวประชาชน อายุ สถานที่ อาชีพ เป็นต้น
  • กำหนดคีย์เวิร์ดสำหรับแต่ละระเบียน หากทำได้ การตั้งคีย์เวิร์ดเป็นหมายเลขได้ก็จะดีกว่า คุณสามารถสร้างรหัสให้กับการรวมข้อมูลสองหรือสามกรณีได้ เพื่อทำให้แต่ละระเบียนไม่ซ้ำกัน คีย์เวิร์ดนี้จะจำเป็นหากคุณต้องการตรวจสอบระหว่างชุดข้อมูลตั้งแต่สองชุดขึ้นไป
  • ควรมีการใส่ช่อง “อื่นๆ” เพื่อใส่รายละเอียดต่างๆ ซึ่งโดยปกติแล้วจะเป็นข้อความย่อหน้าสั้นๆ เกี่ยวกับลักษณะพิเศษที่จะเป็นประโยชน์สำหรับการเล่าเรื่องและการจัดหมวดหมู่ เช่น คุณควรนึกถึงเรื่องราวที่นำไปต่อยอดได้ ตัวอย่างเช่น การสร้างหัวข้อ "เชื้อชาติ" เพื่อวิเคราะห์ว่ามีรูปแบบการเหยียดเชื้อชาติที่เกี่ยวข้องกับชุดข้อมูลใดชุดหนึ่งหรือไม่
  • การใช้รูปแบบเดียวกันทั้งหมดในโครงร่างเป็นสิ่งที่สำคัญยิ่ง ตรวจสอบให้แน่ใจว่าตัวเลขถูกพิมพ์เป็นตัวเลข วันที่อยู่ในรูปแบบที่ถูกต้อง และชื่อของประเภทข้อมูลสะกดเหมือนกันเสมอ ในแต่ละช่องหัวข้อขอบเขตข้อมูลควรออกแบบให้สามารถเลือกได้มากกว่าหนึ่งอย่าง แทนการใช้คำถามปลายเปิด
  • เพิ่มช่องเพื่อบันทึกว่าใครเป็นคนป้อนข้อมูลแต่ละส่วนและแหล่งที่มาต้นฉบับคืออะไร (ฝังลิงก์เพื่อเชื่อมต่อไปยังข้อมูลดังกล่าวด้วย) ซึ่งจะเป็นประโยชน์ในภายหลังเมื่อคุณต้องการตรวจสอบข้อมูล
  • เลี่ยงการใส่หัวข้อขอบเขตข้อมูล (field) เยอะเกินไป สร้างเฉพาะส่วนที่เกี่ยวข้องกับการตรวจสอบของคุณ เช่นเดียวกับการวิเคราะห์ข้อมูล และการวิเคราะห์ที่ทีมของคุณจะสามารถกรอกข้อมูลได้
  • ฐานข้อมูลของคุณอาจต้องการมากกว่าหนึ่งตาราง ขึ้นอยู่กับความซับซ้อนของหัวข้อและความสัมพันธ์ระหว่างองค์ประกอบที่เกี่ยวข้อง
  • ตรวจสอบให้แน่ใจว่าการออกแบบฐานข้อมูลนั้นใช้งานง่ายสำหรับทุกคนที่เกี่ยวข้องในโครงการ ไม่ว่าพวกเขาจะมีเทคโนโลยีระดับใดก็ตาม “ควรเป็นเครื่องมือที่นักข่าวร่วมสร้างขึ้นเพื่อนักข่าวโดยเฉพาะ” Paul Radu ผู้ร่วมก่อตั้งและหัวหน้าฝ่ายนวัตกรรมของ OCCRP กล่าว
  • ทำให้ฐานข้อมูลสามารถปรับระดับได้ เพราะการออกแบบของคุณอาจเป็นก้าวแรกของโครงการที่ใหญ่ขึ้นในอนาคต ไม่ว่าจะโดยคุณ ทีมของคุณ หรือบุคคลอื่น

3. ทดสอบ ทดสอบ และทดสอบ

  • ลองทดสอบนำร่องฐานข้อมูล ลองกรอกข้อมูลเพื่อดูว่าการทำงานนั้นเป็นไปตามที่คุณคาดหวังหรือไม่ และประเมินว่าฐานข้อมูลจะเป็นประโยชน์สำหรับเรื่องราวที่คุณหวังว่าจะทำหรือไม่ วิธีที่ดีอย่างหนึ่งในการประเมินว่าโครงการอาจใช้เวลานานเท่าใด คือลองวัดและคำนวณเวลาเฉลี่ยที่ใช้ในการสร้างระเบียน ตรวจสอบ และยืนยันข้อมูล
  • ทำรายการ “สิ่งที่อาจเกิดขึ้น” เพื่อวิเคราะห์อุปสรรคหรือสถานการณ์ข้อผิดพลาดที่อาจเกิดขึ้น และกำหนดวิธีที่คุณจะหลีกเลี่ยงสิ่งเหล่านั้น
  • ประเมินความน่าเชื่อถือและความต่อเนื่องของหัวข้อขอบเขตข้อมูลที่สำคัญที่สุด หากแหล่งข้อมูลหลายแห่งให้ข้อมูลเรื่องเดียวกัน แต่มีรายละเอียดที่แตกต่าง เช่น วันที่หรือตัวเลข คุณอาจต้องย้ายข้อมูลไปยังช่องรายละเอียดที่คุณสามารถอธิบายความไม่ตรงกันนี้ได้ แทนที่จะสรุปตามอำเภอใจว่าใครเป็นคนพูดความจริง

4. กรอกข้อมูลลงไป

  • นำสิ่งที่คุณเรียนรู้ระหว่างกระบวนการทดสอบไปฝึกอบรมแบบลงมือปฏิบัติจริงให้กับนักข่าวที่จะรวบรวม ป้อนข้อมูล และวิเคราะห์ข้อมูลในฐานข้อมูล ตรวจสอบให้แน่ใจว่าทุกคนเข้าใจแนวคิดและการจัดหมวดหมู่แบบเดียวกัน
  • ใช้เครื่องมือจัดเก็บข้อมูลร่วมกัน เพื่อไม่ให้การเข้าถึงขึ้นอยู่กับบุคคลเพียงคนเดียว
  • แยกข้อมูลโดยใช้หมวดหมู่ที่คุณกำหนดในขั้นตอนการออกแบบ เพื่อสร้างความชัดเจนว่าใครเป็นผู้รวบรวมข้อมูลใดและหลีกเลี่ยงการทำงานซ้ำซ้อน
  • หากคุณต้องการดึงข้อมูลจากเว็บไซต์หรือจากเอกสาร ให้มุ่งเน้นไปยัสิ่งที่เกี่ยวข้องกับการสืบสวนของคุณมากที่สุด ถ้ามีคำถามว่าอะไรคือสิ่งที่จะกำหนดใจความเรื่องราวของคุณ หนึ่งในคำตอบคือตัวอย่างจากโครงการ Troika ที่กำหนดให้ “วัตถุประสงค์” ของการทำธุรกรรมเป็นกุญแจสำคัญ
  • หากปริมาณข้อมูลมีมากเกินไปที่จะจัดการได้ ให้พิจารณาว่าจ้างผู้เชี่ยวชาญภายนอกหรือบริษัทเพื่อถอดความเอกสารลงในฐานข้อมูลที่ออกแบบไว้ก่อนหน้านี้

5. ตรวจสอบข้อเท็จจริง

  • การสร้างฐานข้อมูลเป็นเพียงขั้นตอนแรกของการสอบสวน ก่อนวิเคราะห์ข้อมูลและสรุปผล คุณต้องยืนยันกับแหล่งข้อมูลต้นฉบับ ไม่ว่าจะเกี่ยวข้องกับเอกสารหรือบุคคลหลักของเรื่องราวนั้น “เรานำข้อมูลของเราไปยังเทศบาลที่มีการสังหารหมู่ เพื่อให้ผู้รอดชีวิตสามารถแก้ไขข้อผิดพลาดที่สื่อและคนอื่นๆ บอกเล่ามาหลายปีแล้ว” Parra อธิบายเกี่ยวกับโครงการหนึ่งของเขาที่ Rutas del Conflicto
  • ตัดสินใจว่าจะทำการตรวจสอบอย่างไร โดยแนวทางจะมีความแตกต่างกันไปตามขอบเขตของโครงการของคุณ คุณสามารถตรวจสอบบันทึกทุกรายการโดยอ้างอิงกับเอกสารต้นฉบับ หรือจะสุ่มตรวจสอบเฉพาะจุดก็ได้ แต่ควรครอบคลุมรายการบันทึกจำนวนมากในฐานข้อมูล ไม่ว่าในกรณีใด บุคคลที่ตรวจสอบข้อมูลไม่ควรเป็นคนเดียวกันกับผู้ป้อนข้อมูล
  • แล้วอะไรคือสิ่งที่คุณควรมองหาในการตรวจสอบ การสะกดคำผิด ตัวเลขจำนวน วันที่ รายการที่ซ้ำกัน และรายการบันทึกที่ไม่ตรงตามเกณฑ์
  • แนวคิดสองประการในการทบทวนตัวเลข: ตั้งค่าให้โปรแกรมสรุปผลรวมโดยอัตโนมัติและเปรียบเทียบกับตัวเลขในเอกสารต้นฉบับ และจัดเรียงข้อมูลเพื่อค้นหาค่าที่ผิดปกติ (ตัวเลขที่มากเกินไป น้อยเกินไป หรือที่อาจเป็นข้อผิดพลาด)
  • ฐานข้อมูลจะไม่พร้อมใช้งานจนกว่าจะผ่านการตรวจสอบข้อเท็จจริง การตรวจสอบข้อมูล การตรวจสอบโดยแหล่งข้อมูลส่วนบุคคล และการตรวจสอบทางกฎหมาย
แผนที่แสดงการโจมตีกลุ่มนักอนุรักษ์สิ่งแวดล้อมในอเมริกาใต้และอเมริกากลาง
| ที่มาภาพ: Tierra de Resistentes (อ้างใน GIJN)
 

ซอฟต์แวร์

ในฐานะนักข่าว คุณไม่จำเป็นต้องเป็นนักพัฒนาระบบเพื่อทำโปรเจกต์ฐานข้อมูล แต่ให้รวมบุคคลที่มีความเชี่ยวชาญด้านนี้ในทีมของคุณและทำงานร่วมกันแทน โดยรายการเครื่องมือดังต่อไปนี้อาจมีประโยชน์ ได้แก่

  • แอปพลิเคชันสำหรับสร้างเว็บฟอร์มที่จะช่วยให้นักข่าวกรอกฐานข้อมูลอย่าง Google Forms, Node.jsDjango หรือ Flask
  • พื้นที่จัดเก็บฐานข้อมูล: MongoDB Atlas หรือ Firebase ของ Google
  • สำหรับการจัดโครงสร้างและประมวลผลข้อมูล: Python (ซึ่งสามารถเชื่อมต่อกับตัวเลือกการจัดเก็บที่กล่าวถึงข้างต้น), PostgreSQLELK Stack และ Filemaker
  • สำหรับการดึงข้อมูลและการแปลง PDF: Wondershare Pdf Converter ProiLovePDFSmallpdf, TabulaImport.io
  • คุณสามารถดาวน์โหลดข้อมูลจากระบบฐานข้อมูลและทำงานบน Excel หรือ Google Spreadsheets ได้ การเริ่มต้นด้วยตัวเลือกใดตัวเลือกหนึ่งเหล่านี้อาจเป็นตัวเลือกที่ดีที่สุดสำหรับโครงการขนาดเล็ก

คำแนะนำและเคล็ดลับขั้นสุดท้าย

  • การรักษาความปลอดภัยเป็นปัญหาสำคัญในโครงการประเภทนี้ ดังนั้นให้ใช้การสื่อสารด้วยเครื่องมือหรือซอฟต์แวร์ที่มีการเข้ารหัส การสำรองข้อมูล และพิจารณาเรื่องความปลอดภัยส่วนบุคคล
  • เรียนรู้วิธีใช้ Excel และทำงานร่วมกับนักวิทยาศาสตร์ข้อมูลและนักพัฒนา
  • เรียนรู้เครื่องมือที่ทำให้งานง่ายขึ้น: เครื่องมือสำหรับการค้น, แบบฟอร์มออนไลน์เพื่อป้อนฐานข้อมูล, ตัวแปลงไฟล์ .pdf, การสแกนด้วย OCR (การระบุลักษณะอักขระด้วยแสง) และการประมวลผลข้อความจำนวนมาก ที่ OCCRP พวกเขาสร้าง Aleph ซึ่งเป็นแพลตฟอร์มที่ทำหน้าที่เกือบทั้งหมดเหล่านี้ ช่วยให้เข้าถึงได้ง่าย ค้นหา การทับศัพท์ และการเรียกดูบันทึกเอกสารหลายรูปแบบจำนวนมาก
  • เนื่องจากโครงการเหล่านี้มักต้องการทีมขนาดใหญ่ ตัดสินใจว่าใครจะเป็นผู้นำโครงการ และพิจารณาคำแนะนำสำหรับการทำงานร่วมกันในการสืบสวน
  • ทำให้วิธีการและแหล่งที่มาโปร่งใสสำหรับผู้ชมของคุณภายใต้มาตรการความปลอดภัยและความมั่นคง แสดงตัวอย่างเอกสารต้นฉบับที่คุณสร้างฐานข้อมูลเพื่อสร้างความน่าเชื่อถือ
  • เผยแพร่ข้อมูลติดต่อของคุณควบคู่ไปกับเนื้อหาการสอบสวน เพื่อให้ผู้อ่านสามารถติดต่อมาเมื่อมีคำถามหรือหากพวกเขาเห็นข้อผิดพลาดในฐานข้อมูล

แหล่งข้อมูลเพิ่มเติม:

แปลและเรียบเรียงจาก:

มีเรียม โฟเรโร เอรีซา (Miriam Forero Ariza) เป็นผู้สื่อข่าวอิสระเชิงสืบสวนสอบสวนและข้อมูล ซึ่งงานของเธอได้รับการเผยแพร่ใน Vice, Colombiacheck และ El Espectador เธอมีประสบการณ์ทำงานมานับทศวรรษในงานข่าวสืบสวนสอบสวนแบบความร่วมมือ การวิเคราะห์ข้อมูล และการแปลงข้อมูลเป็นภาพ เธอยังเป็นผู้แต่งร่วมของตำราวารสารศาสตร์เชิงข้อมูลที่ชื่อว่า “the Iberoamerican Data Journalism Handbook” อีกด้วย

 

ร่วมบริจาคเงิน สนับสนุน ประชาไท โอนเงิน กรุงไทย 091-0-10432-8 "มูลนิธิสื่อเพื่อการศึกษาของชุมชน FCEM" หรือ โอนผ่าน PayPal / บัตรเครดิต (รายงานยอดบริจาคสนับสนุน)

ติดตามประชาไทอัพเดท ได้ที่:
Facebook : https://www.facebook.com/prachatai
Twitter : https://twitter.com/prachatai
YouTube : https://www.youtube.com/prachatai
Prachatai Store Shop : https://prachataistore.net
สนับสนุนประชาไท 1,000 บาท รับร่มตาใส + เสื้อโปโล

ประชาไท