O'Reilly Radar: ความสำคัญที่เพิ่มมากขึ้นของวารสารศาสตร์ข้อมูล

 

อะไรคือวารสารศาสตร์ข้อมูล

ข้อมูล ข้อมูล ข้อมูล!

ส.ส. คนไหนโดดประชุมบ่อย? งบประมาณกองทัพคิดเป็นกี่เท่าของงบประมาณสาธารณสุข? การชุมนุมประท้วงแต่ละครั้งมีคนเข้าร่วมมากน้อยเท่าใด? จังหวัดไหนมีอัตราว่างงานสูงที่สุด? แต่ละเดือนมีเว็บไซต์ถูกปิดกั้นเท่าไร? ในหนึ่งปีนายกรัฐมนตรีเดินทางไปที่ไหนบ้าง? มหาวิทยาลัยไหนเก็บค่าเรียนแพงที่สุด?

เราสามารถตอบบางคำถามข้างต้นได้ด้วยการค้นข้อมูลที่ถูกเผยแพร่อยู่แล้ว แต่มันอาจจะหมายถึงการนั่งเปิดไฟล์เอกสาร PDF เป็นร้อยหน้า นั่งไล่ดูตารางข้อมูลที่ไม่เป็นระเบียบหลายพันแถว หรือนั่งจ้องตัวเลขยาวยืดและนึกเปรียบเทียบสัดส่วนเอาเองในหัว

กฎหมายกำหนดให้ข้อมูลจำนวนมากถูกเผยแพร่ต่อสาธารณะ แต่น้อยคนนักที่จะใช้ประโยชน์จากมันได้ เพราะมันไม่อยู่ในสภาพที่เข้าใจง่ายหรือเอาไปใช้ต่อได้สะดวก

วารสารศาสตร์ข้อมูล (Data Journalism) ว่าง่าย ๆ ก็คือการเปลี่ยน “ข้อมูล” ให้เป็น “ข่าว”

 

การวิเคราะห์จำแนกความก้าวหน้าของข้อมูลภาครัฐ จำเป็นต้องใช้เครื่องมือใหม่ ๆ และแหล่งข้อมูลที่ไว้ใจได้

หนึ่งในประเด็นหลักจากงาน News Foo ที่ยังคงดังก้องอยู่ในหัวผมก็คือ ความสำคัญของวารสารศาสตร์ข้อมูล ความชำนิชำนาญในเรื่องดังกล่าวได้รับความสนใจอีกครั้งในฤดูหนาวนี้ เมื่อ ทิม เบอร์เนิร์ส-ลี [ผู้คิดค้นเวิลด์ไวด์เว็บ] ระบุว่าความสามารถในการวิเคราะห์ข้อมูลคืออนาคตของวารสารศาสตร์

เมื่อคุณมองไปที่วารสารศาสตร์ข้อมูลและภาพกว้าง เหมือนกับที่ แอนโธนี เดอบาร์รอส แห่งหนังสือพิมพ์ยูเอสเอทูเดย์ ได้ทำและเขียนในบล็อกของเขาเมื่อเดือนพฤศจิกายนที่ผ่านมา มันชัดเจนว่าเทคโนโลยีต่าง ๆ ในขณะนี้ เป็นพัฒนาการของการเล่าเรื่องที่ถูกยกระดับขึ้นด้วยเทคโนโลยี ซึ่งสืบย้อนไปได้ถึงการใช้คอมพิวเตอร์ช่วยในการรายงานข่าว (computer-assisted reporting – CAR).

เหมือนกับที่เดอบาร์รอสชี้ให้เราเห็น สิ่งที่ CAR ต้องการจะบอก “นั้นเกี่ยวกับการค้นหาเรื่องราว และใช้เครื่องมือง่าย ๆ เพื่อทำมัน: ตารางคำนวณ, ฐานข้อมูล, แผนที่, สถิติ” เช่น ไมโครซอฟท์แอคเซส, เอกซ์เซล, SPSS, และเอสคิวแอล เซิร์ฟเวอร์
สิ่งเหล่านั้นยังคงเป็นจริงอยู่ในปัจจุบัน แม้นักวารสารข้อมูลในตอนนี้จะมีเครื่องมือใหม่ ๆ ที่ทรงพลังสำหรับการเก็บเล็กผสมน้อยข้อมูลจากเว็บ ด้วยเครื่องมืออย่าง ScraperWiki และ Needlebase, เขียนโปรแกรมสคริปต์ด้วย Perl, หรือ RubyPython,MySQL และ Django

การทำความเข้าใจกับประวัติศาสตร์ของการใช้คอมพิวเตอร์ช่วยในการรายงาน ข่าว เป็นกุญแจสำคัญที่จะวางเครื่องมือใหม่ ๆ เหล่านี้ ลงไปในบริบทที่เหมาะสม “เราใช้เครื่องมือเหล่านี้เพื่อค้นหาและเล่าเรื่อง” เดอบาร์รอสเขียน “เราใช้มันเหมือนที่เราใช้โทรศัพท์ เรื่องราวยังคงเป็นสิ่งสำคัญสิ่งเดียว”

การประชุมเรื่องวารสารศาสตร์ข้อมูลที่งาน News Foo นั้น มีขึ้นในวันเดียวกับที่นักพัฒนาพลเมืองได้เข้าร่วมในมหกรรม “open data hackathon” ซึ่งมีขึ้นทั่วโลก [รวมถึงประเทศไทย] และหนังสือพิมพ์นิวยอร์กไทมส์ได้เป็นเจ้าภาพจัดงาน Times Open Hack Day นักพัฒนาจำนวนมากในการประกวดลักษณะนี้ มีความสนใจที่จะทำงานกับข้อมูลแบบเปิด แต่บทสนทนาที่ News Foo ก็ได้แสดงให้เห็นว่า หน่วยงานรัฐบาลยังคงต้องทำงานอีกมากแค่ไหน เพื่อที่จะทำสัญญาที่จะเปิดเผยข้อมูลที่รัฐบาลเก็บเอาไว้เพื่ออนาคตของวารสารศาสตร์ ให้กลายเป็นจริง

ประเด็นปัญหาที่พบนั้นสำคัญอย่างมาก ข้อมูลภาครัฐนั้นมักจะ “สกปรก” ไปด้วยช่องข้อมูลที่ผิดพลาดหรือไม่มีเมตาดาตา
นักข่าวจำเป็นต้องตรวจเช็คความถูกต้องและทำความสะอาดชุดข้อมูล ด้วยเครื่องมือเช่น Google Refine โครงการ Recovery Tracker ของเว็บไซต์ข่าว ProPublica ซึ่งช่วยติดตามข้อมูลงบประมาณและแผนกระตุ้นเศรษฐกิของสหรัฐ เป็นหนึ่งในตัวอย่างที่ดีที่สุดของการปฏิบัติการดังกล่าวในชีวิตจริง [ProPublica ดึงข้อมูลมาจากเว็บไซต์ Recovery.gov ของรัฐบาล ทำความสะอาดข้อมูล และเพิ่มเติมข้อมูลที่ขาดหายไป เพื่อให้ชุดข้อมูลนำไปใช้ได้จริง]

มาตรฐานอันสูงสุดเมื่อเร็ว ๆ นี้สำหรับวารสารศาสตร์ข้อมูล ก็คือโครงการ Toxic Waters จากนิวยอร์กไทมส์ ซึ่งชนะรางวัลพูลิตเซอร์ ขนาดของโครงการดังกล่าวทำให้มันยากที่จะติดตาม อย่างไรก็ตามนักพัฒนาของไทมส์ก็ยังทำงานอย่างหนักกับโครงการเจ๋ง ๆ อย่าง Inside Congress

คุณสามารถดูการสร้างภาพข้อมูลจากโครงการ Toxic Waters และตัวอย่างอื่น ๆ ของวารสารศาสตร์ข้อมูล ได้จากการนำเสนอในแบบ Ignite จากงาน News Foo

 

Making open government data sing

ที่ ProPublica ทีมวารสารศาสตร์ข้อมูลนั้นตระหนักถึงการเชื่อมโยงระดับลึกลงไปสู่แอพพลิเค ชั่นข่าว ด้วยทัศนะที่ว่าภาพข้อมูลที่ถูกสร้างขึ้นจากแอพพลิเคชั่นเหล่านั้น ในตัวของพวกมันเองก็เป็นรูปแบบหนึ่งของการเสนอข่าวแบบพรรณนา ด้วยการวาดภาพข้อมูลที่เยี่ยมยอด ผู้อ่านสามารถค้นพบหนทางและซักไซ้ไล่เรียงข้อมูลดังกล่าวได้ด้วยตัวของพวก เขาเอง มากไปกว่านั้น ความแตกต่างระหว่าง “เรื่อง” ข่าว และ “แอพ” ข่าว ก็จะค่อย ๆ สลายไป เมื่อผู้อ่านรับข่าวสารมากขึ้น ๆ จากอุปกรณ์เคลื่อนที่และแท็บเล็ต

วิธีหนึ่งในการมอบบริบทที่เป็นประโยชน์แก่ผู้อ่าน ก็คือรูปแบบ “ไอออน” (ion) ที่เว็บไซต์ข่าว ProPublica.org ทำอยู่ โครงการอย่าง “Eye on the Stimulus” เป็นลูกผสมระหว่างบล็อกและแอพพลิเคชั่น ในด้านหนึ่งของหน้าเว็บดังกล่าว มันเป็นสายธารของข่าวที่ไหลอยู่ตลอดเวลา ในอีกด้านหนึ่ง มันมีจุดเข้าไปสู่ข้อมูลต่าง ๆ ความท้าทายของวิธีการนี้ก็คือ ช่องทางเสนอสื่อจะต้องมีการจัดขบวนระหว่างทีมงานและเรื่องราว นักข่าวจำเป็นต้องปรับข้อมูลทุกวัน สำหรับข่าวที่กำลังมีความเคลื่อนไหวอยู่ตลอดซึ่งอ่อนไหวต่อข้อมูล

อัปเกรด Data.gov

ช่วงการประชุมวารสารศาสตร์ข้อมูลในงาน News Foo มีองค์ประกอบที่เป็นแก่นอย่างหนึ่งคือ มันได้นำผู้ก่อตั้ง City Camp เควิน เคอร์รี่, ผู้เผยแพร่แนวคิด Data.gov จีน โฮล์ม, และผู้ได้รับทุนมูลนิธิเรย์โนลด์ส เดวิด แฮร์ซอก พร้อมกับผู้เข้าร่วมงาน News Foo ให้ได้พูดคุยเกี่ยวกับการให้คุณค่าของ ข้อมูลภาครัฐแบบเปิด และ วารสารศาสตร์ข้อมูล

ดังที่รายงานการศึกษาข้อมูลแบบเปิดฉบับ ล่าสุดได้แสดง นักพัฒนานั้นไม่พบข้อมูลภาครัฐที่ตัวเองจำเป็นต้องใช้หรือต้องการจะใช้ ถ้ามีผู้ประกอบการรายอื่น ๆ ต้องการเดินตามรอยของ BrightScope ชุดข้อมูลแบบเปิดของภาครัฐจะต้องเชื่อมโยงเกี่ยวข้องให้มากขึ้นกับธุรกิจ เสียงตอบรับสำหรับ Data.gov และคลังข้อมูลภาครัฐอื่น ๆ นั้นชัดเจน: ข้อมูลที่มากขึ้น ข้อมูลที่ดีขึ้น และข้อมูลที่สะอาดขึ้น กรุณาด้วย

การพัฒนาให้สื่อเข้าถึงข้อมูลได้ดีขึ้น ในระดับรัฐบาลเขตหรือรัฐบาลมลรัฐ นั้นมีอุปสรรคเชิงโครงสร้าง เนื่องจากวิกฤตงบประมาณที่ขยายตัวมากขึ้นในหน่วยงานรัฐทั่วสหรัฐอเมริกา ดังเช่นที่ จีน โฮล์ม ได้สังเกตเห็นระหว่างการประชุม News Foo โครงการริเริ่มด้านรัฐบาลเปิดนั้นมีแนวโน้มจะถูกดำเนินการในสภาพแวดล้อมที่ ใช้งบประมาณแบบผลรวมเป็นศูนย์ในปี 2554 เจ้าหน้าที่รัฐต่าง ๆ จำเป็นต้องทำให้โครงการของตัวเองยั่งยืนและเลี้ยงตัวเองได้

มันมีบางเรื่องที่รัฐบาลสหพันธ์สามารถจะช่วยได้ โฮล์มบอกว่า Data.gov ได้สร้างโฮสต์คอมพิวเตอร์แบบกลุ่มเมฆ (cloud) ซึ่งสามารถจะแบ่งใช้กับรัฐบาลมลรัฐ รัฐบาลท้องถิ่น และรัฐบาลชุมชน Data.gov ยังได้ออกชุดเครื่องมือที่จะช่วยในการแปลงข้อมูล แปลงภาพอักษรเป็นข้อความ (โอซีอาร์) และในอนาคตจะมีเครื่องมือที่ดีขึ้นสำหรับข้อมูลแบบมีโครงสร้าง

ทรัพยากรดังกล่าวเหล่านั้น จะสามารถทำให้ข้อมูลภาครัฐมีพร้อมใช้มากขึ้นและเข้าถึงได้มากขึ้นสำหรับสื่อ เควิน เคอร์รี่ กล่าวว่าบัญชีข้อมูลนั้นเกิดขึ้นใหม่ในทุกที่ [ของประเทศไทย] เขาชี้ไปที่ CivicApps ในพอร์ตแลนด์ โอเรกอน ที่ซึ่งงานที่ แมกซ์ อ็อกเดน ได้ทำกับการเขียนโค้ดซอฟต์แวร์มิดเดิลแวร์สำหรับรัฐบาลแบบเปิด ได้นำไปสู่การแปลงข้อมูลภาครัฐไปสู่รูปแบบที่เป็นประโยชน์มากกว่าสำหรับนักพัฒนา

นักวารสารข้อมูลยังประสบกับความท้าทายทางวัฒนธรรมของภาครัฐ มันเป็นเรื่องยากที่จะพบเจ้าหน้าที่สารสนเทศภาครัฐที่มีความปราถนาหรือมี ความสามารถที่จะถามคำถามสำคัญ ๆ เกี่ยวกับข้อมูล โฮล์มบอกว่า Data.gov อาจจะประกาศข้อมูลติดต่อให้มากขึ้นออนไลน์ และสร้างบทสนทนาให้มากขึ้นรอบ ๆ ชุดข้อมูลแต่ละชุด ข้อมูลลักษณะดังกล่าวเป็นจุดเริ่มต้นที่ดีสำหรับการค้นหาข้อกังวลเกี่ยวกับ ข้อมูลในระดับสหพันธ์ อย่างไรก็ตาม การสนับสนุนความสัมพันธ์ที่เป็นประโยชน์ระหว่างนักข่าวและข้อมูลยังต้องการ ความพยายามและการพัฒนาให้ดีขึ้นไปอีก

ที่มา: O’Reilly Radar: ความสำคัญที่เพิ่มมากขึ้นของวารสารศาสตร์ข้อมูล