(電子商務研究中心訊) 數(shù)據(jù)新聞與大數(shù)據(jù)思維的應用
【摘 要】數(shù)據(jù)新聞利用數(shù)據(jù)拓展新聞的時空范圍,深化對新聞事實的認知,發(fā)現(xiàn)常規(guī)新聞中不能體現(xiàn)的邏輯,從而豐富了單篇新聞報道的內涵,新聞樣態(tài)也從封閉式告知話語轉換為開放式工具,用戶可以使用這些工具獲取多元的信息。但是,數(shù)據(jù)新聞到底是什么?它與數(shù)字新聞、大數(shù)據(jù)運用有何關聯(lián)?在對數(shù)據(jù)新聞的認知中,還有相當多的認知誤區(qū)。將結合案例廓清相關概念,并分析大數(shù)據(jù)思維在新聞中的應用及其局限性。
【關鍵詞】大數(shù)據(jù);數(shù)據(jù)新聞;大數(shù)據(jù)思維
【中圖分類號】G20 【文獻標識碼】A
數(shù)據(jù)新聞如今已經(jīng)風靡世界,成了新聞業(yè)界創(chuàng)新的法寶。數(shù)據(jù)新聞利用數(shù)據(jù)挖掘可以延伸新聞中單一事件、現(xiàn)時信息的意義,拓展新聞的時空范圍,深化對新聞事實的認知,發(fā)現(xiàn)常規(guī)新聞中不能體現(xiàn)的邏輯,從而豐富了單篇新聞報道的內涵,新聞樣態(tài)也從封閉式告知話語轉換為開放式工具,用戶可以使用這些工具獲取多元的信息。
但是,數(shù)據(jù)新聞到底是什么?它與數(shù)字新聞、大數(shù)據(jù)運用有何關聯(lián)?“大數(shù)據(jù)新聞”為何不是一類新聞?程序員、統(tǒng)計師能取代記者嗎?在對數(shù)據(jù)新聞的認知中,還有相當多的認知誤區(qū);數(shù)據(jù)新聞也有被濫用之嫌,其實它不是萬能的;數(shù)據(jù)新聞也有其困境,它的內容和形態(tài)有著局限性。因此,本文將結合案例廓清相關概念,并分析大數(shù)據(jù)思維在新聞中的應用及其局限性。
數(shù)字圖表不等于數(shù)據(jù)新聞
近兩年大數(shù)據(jù)成為時髦,不少媒體就以簡單的數(shù)字統(tǒng)計,來充當“數(shù)據(jù)新聞”。但是,只列有數(shù)字,那還不是數(shù)據(jù)新聞。關于數(shù)字、數(shù)據(jù)、大數(shù)據(jù),數(shù)字化與數(shù)據(jù)化,數(shù)字新聞與數(shù)據(jù)新聞等概念,目前還存在一些混淆的情況。
“數(shù)據(jù)”不等于數(shù)字,也不一定是數(shù)字,它是對事件的一種描述,數(shù)據(jù)可以記錄、分析和重組事件。“大數(shù)據(jù)”不只表示數(shù)據(jù)量大一些,它是指無法在一定時間內用常規(guī)軟件工具對其內容進行抓取、管理和處理的數(shù)據(jù)集合。它的特點是:數(shù)據(jù)量大,數(shù)據(jù)類型多樣,處理速度快,價值密度低。
“數(shù)據(jù)化”簡單地說,是把現(xiàn)象轉變?yōu)榭芍票矸治龅牧炕问健?ldquo;數(shù)字化”是指把模擬數(shù)據(jù)轉換成0和1表示的二進制碼,從而使電腦可以處理那些數(shù)據(jù)。
①“數(shù)字新聞”是指對文本、圖片、視頻等進行數(shù)字化,從而通過互聯(lián)網(wǎng)技術能傳輸?shù)男侣剤蟮馈?ldquo;數(shù)據(jù)新聞”是指用數(shù)據(jù)驅動的新聞,是內容量化了的報道,是用數(shù)據(jù)作為表述形式的新聞。數(shù)據(jù)新聞很少是以大數(shù)據(jù)驅動的。
“大數(shù)據(jù)新聞”其實并不能成為一類新聞,而是以大數(shù)據(jù)的思維和工具做成的新聞,是將大數(shù)據(jù)思維內化到生產實踐及樣態(tài)創(chuàng)新之中。是基于互聯(lián)網(wǎng)及其衍伸技術平臺實現(xiàn)的以大量數(shù)據(jù)搜集與分析為主要工具而生產出來的新聞,主要是數(shù)據(jù)新聞,通常是以圖表等形式,通過對一系列的簡要事實的相關性的表達,揭示出事實背后的意義。
因此,目前一些媒體以數(shù)字、圖表羅列的新聞,并不是數(shù)據(jù)新聞。
為什么專業(yè)新聞工作者是必要的
隨著自媒體的出現(xiàn),專業(yè)記者將不再需要的議論甚囂塵上。如今數(shù)據(jù)新聞又催生了一些新的報道者,比如“程序員記者”,即計算機程序員因為其技術的使用,成為了報道者,比如美國芝加哥論壇報之“犯罪新聞”(Crime in Chicagoland)網(wǎng)頁的程序員;“統(tǒng)計師記者”,即懂得統(tǒng)計的工作人員當上了信息報道者,比如博客“FiveThirtyEight”博主內特·斯弗(Nate Silver)。
②那么專業(yè)記者還有存在的必要嗎?當然還是需要的,只是對專業(yè)新聞工作者的要求變得更高,他們不僅要理解統(tǒng)計、設計,而且要有新聞專業(yè)的敏銳性。
數(shù)據(jù)本身并不具備多大的新聞價值,有時數(shù)據(jù)帶有欺騙性,需要記者從紛繁復雜的數(shù)據(jù)、報道中尋找靈感,去發(fā)現(xiàn)其中的意義,發(fā)掘新聞的深層或新鮮的價值。舉例來說,股票行情天天向所有人公開,密密麻麻的名稱中,某一只股票的價格,在什么情況下會有比較大的新聞價值呢?彭博新聞社就從中找到了獨特的新聞價值。
彭博的記者通過對過去10年在上海證券交易所交易的股票進行分析,發(fā)現(xiàn)貴州茅臺酒業(yè)股票自2002年11月至2012年10月,10年間上漲達3451%,如今高達410億美元,成為世界第二大造酒公司。這算是一個很好的發(fā)現(xiàn),具備了新聞價值的“新鮮性”。其中還有什么意義呢?這些數(shù)字是中國經(jīng)濟發(fā)展速度的證據(jù)之一,它也表明中國的經(jīng)濟發(fā)展帶來的社會變遷:中國經(jīng)濟10年來的發(fā)展,已經(jīng)造就了一個富裕階層,他們對奢侈品類的需求,刺激了相關消費,因此出現(xiàn)了茅臺酒及其股票的大幅增長。
因此新聞又有了“重要性”價值。重要性還可以再擴大嗎?是的,時值中國十八大期間,通過數(shù)據(jù)挖掘報道的中國經(jīng)濟發(fā)展及其影響,“重要性”價值就更大了。其實我們也可以把上述新聞看作是一個獨到的對中國十八大的解讀,因為要報道十八大,所以才有了記者的各種想象和挖掘。一位單純的程序員、統(tǒng)計師,是很難發(fā)掘出這樣的新聞價值的。
與傳統(tǒng)的新聞形態(tài)相比,數(shù)據(jù)新聞為單一事實或信息提供更多的表述可能、更深的邏輯關系、更大的想象空間。用數(shù)據(jù)新聞的引領者彭博新聞社的負責人的話來說,是一種“簡單而優(yōu)雅的呈現(xiàn)觀點以及點燃想象力的”的方式。
③如何才能點燃用戶的想象力?
需要專業(yè)工作者具備更全面的知識和能力。運用大數(shù)據(jù)思維的新聞更科學更有效嗎?傳統(tǒng)的新聞是從哪兒來的?也就是新聞判斷是如何形成的?是依靠新聞記者的新聞直覺、新聞敏感——有一種叫news sense(新聞敏感)的意識,它是有賴記者的知識、水平、經(jīng)驗、視野而形成的一種意識,雖然是來自客觀世界,但是也不排除“先驗性”。在西方的新聞教材里,就有新聞鼻(news nose)、新聞眼(news eyes)之說,有些記者的五官更靈敏,從一些小細節(jié)能“嗅”到多少英里之外的新聞。
大數(shù)據(jù)思維主要包括三個方面,即:總體樣本取代隨機樣本;對不精確的容忍度增加;相關關系取代因果關系。
?、苣敲创髷?shù)據(jù)思維下的新聞判斷,是如何形成的呢?
這里僅以其第一方面——樣本的總體性思維來說。傳統(tǒng)的新聞是在記者的新聞敏感的基礎上判斷、采集發(fā)布的。記者認為這件事、那件事很有新聞價值,對社會的多數(shù)人會有吸引力和影響力。一般記者只會以個別人物或事件作為采訪對象,并通常認為這些事對多數(shù)人有意義。這是用的“隨機樣本”的方式,進行的新聞工作,其中包含了偶遇式新聞采訪(如“街采”)、先驗式的新聞敏感。而大數(shù)據(jù)思維則有能力獲取“總體樣本”,通過分析所有用戶的需求和興趣,從而得出新聞價值的判斷。
比如2014年春節(jié)前后,中央電視臺《新聞聯(lián)播》編輯部的“‘據(jù)’說春運”、“‘據(jù)’說春節(jié)”欄目,即是以百度的搜索大數(shù)據(jù)為基礎做的系列報道,它呈現(xiàn)的不只是炫目的可視化數(shù)據(jù)信息,不只是新聞形態(tài)的一種改變,而且還從大數(shù)據(jù)中找到做新聞的點,展開關于春運、春節(jié)的故事。
內容的選擇不再只是從傳者視角單方面揣測新聞敏感,而且融入了用戶的需求,基本上是點餐式的服務。設想一下,這樣的新聞不僅與信息接受者之間形成了內在的互動關系,而且?guī)Щ盍藘热?,真正是貼近了受眾,而且也對一些傳統(tǒng)媒體的年長化、老齡化的受眾形勢,有積極的干預效果,能夠吸引更廣大各年齡層面的受眾。
大數(shù)據(jù)思維帶來了新聞內容的創(chuàng)新,是一種融合媒體的形態(tài)驅動的新聞報道的創(chuàng)新。融合媒體的概念,在上世紀80年代是關于技術形態(tài)方面的,90年代進入了產業(yè)化層面,如今進入用戶層面的遷移或者遷徙,是更新的融合。用戶層面的遷徙,最終會引發(fā)內容的融合。通過大數(shù)據(jù)找到了特別貼近用戶的報道話題,這些話題實際上是網(wǎng)民們感興趣的。網(wǎng)民集中于45歲以下、甚至更多為18歲到35歲之間的人群,他們不是傳統(tǒng)意義上的報紙讀者、電視觀眾。他們帶動傳統(tǒng)媒體的話題年輕化了,實際上是網(wǎng)民參與了新聞報道,必然逼迫內容要進行改革,所以大數(shù)據(jù)思維帶來了從形態(tài)到內容上的新聞創(chuàng)新。
大數(shù)據(jù)在新聞中的應用及其困境
大數(shù)據(jù)時代,數(shù)據(jù)新聞不只給新聞工作者提出了更高要求,也給政府、社會、媒體機構帶來了挑戰(zhàn)。一些媒體已經(jīng)在不斷開發(fā)新的工具,來滿足數(shù)據(jù)新聞的需求,比如英國衛(wèi)報、美國紐約時報不僅在擴展自己的數(shù)據(jù)庫,而且在技術上也提供了許多可能性,尤其是開源的方式,給用戶提供了工具、也讓用戶帶來了豐富的數(shù)據(jù)。華爾街日報開發(fā)的“中國經(jīng)濟追蹤器”,就是一個中英雙語的數(shù)據(jù)新聞工具,它為中國的讀者和記者提供了便利,特別“為那些與中國經(jīng)濟數(shù)據(jù)斗爭多年焦頭爛額的外媒記者指了一條明路。”
⑤路透社香港分社曾推出“關系中國”(Connected China)平臺,他們從中國政府官方網(wǎng)站和出版物、中國及世界媒體報道、外國政府分析報告、學術論文等多渠道匯聚到上萬個權利實體(機構和個人)、3萬余條關系、150萬文檔(相當于20本非虛構類圖書)的數(shù)據(jù)量,將海量數(shù)據(jù)劃分為“職業(yè)比較——行政級別升降”等幾大主題,開發(fā)基于HTML五代技術制成的數(shù)據(jù)、圖片、文檔和視頻無縫鏈接的平臺。
傳媒機構可以從以下渠道獲取數(shù)據(jù):與政府、企業(yè)、科研機構等部門實行數(shù)據(jù)共享,并通過新聞監(jiān)督職能不斷推進“數(shù)據(jù)公開”運動;網(wǎng)絡數(shù)據(jù)(特別是社交媒體數(shù)據(jù))的篩選與使用,這類社交媒體信息過濾工具能夠幫助記者在突發(fā)性災難中通過現(xiàn)場勘探施救人員和志愿者的社交賬號,篩選并核實新聞事實;傳感器數(shù)據(jù)的捕捉及挖掘。傳感器裝置逐漸普及到人們日常生活中,形成的數(shù)據(jù)網(wǎng)絡,美國NPR記者就開始由此探索記者自己編織數(shù)據(jù)庫的潛能;將媒體既有的資料數(shù)據(jù)化;學術數(shù)據(jù)再利用;自行展開調查搜集數(shù)據(jù)。
值得一提的是,大數(shù)據(jù)的應用不是萬能的。
首先大數(shù)據(jù)是掌握在少數(shù)權威機構、信息服務商的手里,對于大多數(shù)媒體機構來說,是很難獲得的;
第二是新聞記者個體,不僅難以獲得數(shù)據(jù),而且如果沒有集團式的操作團隊,也難以充分分析、呈現(xiàn)大數(shù)據(jù);
第三是大數(shù)據(jù)思維本身的特質,在某些方面與新聞的特質是相悖的。大數(shù)據(jù)本身就是不精確的,這與新聞的精確性要求相悖;大數(shù)據(jù)是整體樣本的,這又與新聞的追求個性化、獨到相悖。
當然,媒體機構與新聞工作者也可以化不利為有利,比如從不精確的總體樣本中發(fā)現(xiàn)趨勢和規(guī)律,從中找到自己的個性化的新聞點,并且通過精確的信息衍生出自己的故事。
(陳昌鳳:清華大學新聞與傳播學院教授、副院長;烏日吉木斯:清華大學新聞與傳播學院博士生)
注釋:
①[英]維克托·邁爾·舍恩伯格、肯尼思·庫克耶著:《大數(shù)據(jù)時代》,盛楊燕、周濤譯,浙江人民出版社,第104頁。
?、陉惒P:《自主的媒體人與個人專營網(wǎng)站的崛起》,《新聞與寫作》,2013年第9期。
③陳昌鳳、劉少華:《大數(shù)據(jù)時代如何做新聞》,《新聞與寫作》,2013年第1期。
?、埽塾ⅲ菥S克托·邁爾·舍恩伯格、肯尼思·庫克耶著:《大數(shù)據(jù)時代》,盛楊燕、周濤譯,浙江人民出版社,第27-96頁。
?、?a >djchina.org/2014/02/12/viztool_econ1/(來源:新聞與寫作;編選:網(wǎng)經(jīng)社)