機器新聞寫作:一場正在發(fā)生的革命
發(fā)布時間:2020-10-14 18:00:41 點擊次數(shù):239
值得指出的是, StoryRank和PageRank類似,其對一篇報道的推薦和選擇,并不是僅僅通過分析報道本身的內(nèi)容,而是著重分析報道在網(wǎng)上的受關(guān)注程度:被哪些網(wǎng)站發(fā)布、轉(zhuǎn)發(fā)的多少和頻率、在網(wǎng)站的什么位置發(fā)布等,以此來“計算”有關(guān)新聞的價值或重要程度。二、機器新聞寫作:基于算法的新聞內(nèi)容生產(chǎn)編輯和寫作,就其所需要的人工智能程度而言,顯然寫作更具挑戰(zhàn)性。按照美聯(lián)社商業(yè)新聞主管Lou Ferrara的說法,采用基于算法的機器新聞寫作后,在無須增加新的人手的情況下,美聯(lián)社的商業(yè)新聞中關(guān)于企業(yè)季度經(jīng)營狀況的報道量,將增加10多倍,即從原先每季度300篇上升到4400篇,而與此同時將能把之前用于此類報道的記者“解放”出來。
關(guān)鍵詞:寫作;生產(chǎn);傳播;報道;推薦;算法;客戶;美聯(lián)社;地震;人工智能
作者簡介:
內(nèi)容提要:
聚焦于新聞內(nèi)容生產(chǎn)的自動化趨勢,即基于算法的新聞內(nèi)容生產(chǎn)和編輯、出版。通過追溯谷歌新聞開啟的機器自動選編和推薦新聞的做法,重點介紹了機器新聞目前的發(fā)展現(xiàn)狀、工作原理和應(yīng)用前景,并探討了新聞生產(chǎn)自動化對新聞業(yè)、新聞學(xué)科以及新聞從業(yè)人員的素養(yǎng)要求帶來的深遠影響。
關(guān)鍵詞:
機器新聞 算法 新聞生產(chǎn)自動化 內(nèi)容生產(chǎn) 新聞寫作 數(shù)據(jù)新聞
作者簡介:
金兼斌,清華大學(xué)新聞與傳播學(xué)院教授
對于不斷追求創(chuàng)新和效率的人類而言,內(nèi)容生產(chǎn)行業(yè)無論是出版、報業(yè),還是影視和新聞網(wǎng)站中的內(nèi)容提供的自動化,并不僅僅是夢想而已。雖然包括文字、音頻、視頻、動畫等多種媒體為載體的內(nèi)容的生產(chǎn),不同于衣物鞋帽和各類機電產(chǎn)品的生產(chǎn),但在后者早已實現(xiàn)大批量自動化生產(chǎn)的今天,在各類自動化手段,從設(shè)計、生產(chǎn)到質(zhì)量檢測的各個工藝環(huán)節(jié)普遍應(yīng)用的今天,內(nèi)容生產(chǎn)是否具有機器不可替代的獨特性,是值得存疑的。在傳統(tǒng)藍領(lǐng)工種所從事的工作大量被“自動化”后,傳統(tǒng)白領(lǐng)工種所從事的工作,很多方面也在逐漸被“自動化”。事實上,從“內(nèi)容創(chuàng)作”到“內(nèi)容生產(chǎn)”,這種措辭上的改變,已經(jīng)傳遞出某種讓“寫作”走下神壇的意味。
一、新聞的自動選編
就新聞行業(yè)的這種自動化浪潮而言,影響最大的早期實踐大概要算“Google News”了①。2001年,Google當(dāng)時的首席科學(xué)家克里希納-巴拉特開發(fā)出一個與Google搜索核心技術(shù)PageRank算法相關(guān)的算法StoryRank,可用于新聞的推薦排序,此即“Google News”的前身。“Google News”在不同的國家和地區(qū)提供不同的版本,其本質(zhì)上是一款Web新聞聚合器,其首頁更新和新聞推薦都不依賴于人工操作,而是由后臺的聚合算法實現(xiàn)。時至今日,在中文“Google新聞”頁面的下方,仍有“所有新聞的選擇、排序、分類和搜索均由電腦程序自動決定”的說明。而在其“關(guān)于Google新聞”說明中②,有以下3段意味深長的話:
Google新聞是一個由計算機生成的新聞網(wǎng)站。它匯集了來自中國大陸超過1000多個中文新聞源的新聞資源,并將相似的報道組合在一起,根據(jù)讀者的個人喜好進行顯示。