寫稿機(jī)器人: 我們的對(duì)手還是幫手?
表述明確,文筆犀淩!未來的某天,一早翻看新聞的你,不禁讚嘆起某位記者的高水準(zhǔn)。不過你心裏也清楚,即便當(dāng)面聽到,這位從不吃飯、睡覺的“作者”也不會(huì)説聲謝謝。因?yàn)椤八保菣C(jī)器人。
預(yù)言完畢,讓我們回到今天。奧運(yùn)會(huì)雖然結(jié)束了,但寫稿機(jī)器人在新聞界所引發(fā)的震動(dòng),乃至恐懼,依然餘音未消。有人預(yù)言,在不遠(yuǎn)的未來,寫稿機(jī)器人將徹底取代人力記者。
那麼,所有的媒體同行,以及看熱鬧的圍觀群眾,寫稿機(jī)器人到底是我們的對(duì)手還是幫手呢?
機(jī)器記者能拿普利策獎(jiǎng)
人工智慧註定將滲透到各個(gè)行業(yè),媒體業(yè)亦不能“倖免”。
奧運(yùn)會(huì)期間,寫稿機(jī)器人“張小明”通過直接對(duì)接奧組委的數(shù)據(jù)庫(kù)資訊,實(shí)時(shí)撰寫新聞稿件,以電視直播的速度發(fā)佈稿件,主要報(bào)道了乒乓球、網(wǎng)球、羽毛球和女足的比賽,在16天的時(shí)間內(nèi)共發(fā)佈456篇奧運(yùn)簡(jiǎn)訊和資訊,平均每條新聞生成到發(fā)佈時(shí)間不到2秒鐘,為103萬讀者提供了第一時(shí)間的賽事報(bào)道,單篇最高閱讀量超過11萬。
隨著自然語言處理、大數(shù)據(jù)計(jì)算等人工智慧技術(shù)的發(fā)展,國(guó)內(nèi)外許多媒體已經(jīng)開始了機(jī)器人報(bào)道的探索與實(shí)踐。以寫稿機(jī)器人為代表的人工智慧可讓大數(shù)據(jù)從負(fù)擔(dān)變成便利,重塑媒體的內(nèi)容生産和分散發(fā)佈。
美國(guó)《紐約時(shí)報(bào)》在財(cái)報(bào)季、運(yùn)動(dòng)比賽報(bào)道中用機(jī)器人寫稿已成慣例,其數(shù)字部門開發(fā)的機(jī)器人編輯Blossomblot每天推送300篇文章,受推薦文章的平均閱讀量是未推薦文章的38倍;美聯(lián)社在過去一年多時(shí)間裏均使用Wordsmith系統(tǒng)編發(fā)企業(yè)財(cái)報(bào);國(guó)際文傳電訊社計(jì)劃用雅虎的機(jī)器人演算法來發(fā)佈美式橄欖球回顧式報(bào)道;成立於2007年的Automated Insights是一家有美聯(lián)社融資背景的科技公司,2015年寫了150億篇文章,宣稱自己是世界上最大的內(nèi)容生産者;路透社也在嘗試發(fā)表機(jī)器撰寫的文章,其負(fù)責(zé)人稱在一次盲測(cè)中,機(jī)器的作品表現(xiàn)得比人類作品更具可讀性……有專家預(yù)言,機(jī)器人將在20年內(nèi)競(jìng)逐普利策獎(jiǎng)。
寫稿機(jī)器人在國(guó)內(nèi)的發(fā)展也十分迅速。2015年9月,騰訊財(cái)經(jīng)一篇名為《8月CPI漲2%創(chuàng)12個(gè)月新高》的文章刷爆各大媒體頭條,其作者就是騰訊開發(fā)的自動(dòng)化新聞寫作機(jī)器人“Dreamwriter”。今年5月29日,四川綿陽發(fā)生地震,一條題為《綿陽安州發(fā)生4.3級(jí)地震》的新聞開始流傳于網(wǎng)路,寫下這篇560字的新聞稿件並第一時(shí)間發(fā)佈在網(wǎng)路上的正是國(guó)家地震臺(tái)網(wǎng)研發(fā)的智慧機(jī)器人,且全程僅花了6秒鐘,可以説幾乎跑贏了地震波的速度。
人工智慧發(fā)展的必然結(jié)果
媒體領(lǐng)域遭遇機(jī)器人入侵,原因就在於自然識(shí)別和資訊數(shù)據(jù)庫(kù)技術(shù)已經(jīng)達(dá)到了相當(dāng)成熟度,且這種成熟度是和新聞媒體的要求很好地匹配了起來。
寫稿機(jī)器人的背後是一個(gè)高度結(jié)構(gòu)化的海量資訊網(wǎng),無論是文案、資訊圖表或其他表達(dá)形式,機(jī)器人編輯都可以像音樂家擺弄音符一樣去重構(gòu)組裝。無論是天氣預(yù)報(bào)還是地震預(yù)警再到賽事報(bào)道等各種資訊,都最終能夠放入到機(jī)器人數(shù)據(jù)庫(kù)中去,這樣的系統(tǒng)潛力巨大,可以構(gòu)建無限可能。
北大電腦研究院教授萬小軍告訴記者,寫稿機(jī)器人實(shí)際上是一種數(shù)字技術(shù)和智慧寫稿編程系統(tǒng)。它用機(jī)器代替人完成實(shí)時(shí)監(jiān)控資訊源,利用文本解析和資訊抽取技術(shù)實(shí)現(xiàn)自動(dòng)資訊抽取,採(cǎi)用機(jī)器學(xué)習(xí)演算法並融合編輯記者團(tuán)隊(duì)的經(jīng)驗(yàn)和智慧,以模板和規(guī)則知識(shí)庫(kù)的方式,根據(jù)實(shí)時(shí)抽取的資訊作出判斷,輸出相應(yīng)的模板及規(guī)則知識(shí)庫(kù)內(nèi)容,從而産生新聞,以此應(yīng)對(duì)海量、高速、多樣的大數(shù)據(jù)産生的資訊。
和傳統(tǒng)媒體人相比,寫稿機(jī)器人可以瞬間完成海量閱讀、海量分析,尤其是針對(duì)上市公司的公告、財(cái)務(wù)報(bào)表、官方發(fā)佈、社交平臺(tái)、證券行情等資訊源。與此同時(shí),又可以根據(jù)網(wǎng)際網(wǎng)路活躍點(diǎn)擊量數(shù)據(jù),暫態(tài)篩選出下一個(gè)熱點(diǎn)新聞,並通過後臺(tái)的演算法快速合成新聞。整體上看來,寫稿機(jī)器人在速度和數(shù)量上有著不可忽視的絕對(duì)優(yōu)勢(shì)。
依靠海量的大數(shù)據(jù)平臺(tái)和不斷演進(jìn)的演算法設(shè)計(jì),生成一篇深度報(bào)道的時(shí)間已經(jīng)由最初的30秒縮短到2秒以內(nèi),其精度和準(zhǔn)確率還在不斷提升,而且擬人化、情感化的技能也在持續(xù)加強(qiáng)。
“張小明”團(tuán)隊(duì)的技術(shù)總監(jiān)李磊説,近兩年的國(guó)際自然語言大會(huì)(ACL)給人感受最深的是,在自然語言處理和理解方面,機(jī)器深度學(xué)習(xí)的進(jìn)步非常之大,2016年幾乎超過2/3的論文在研究深度學(xué)習(xí)領(lǐng)域。雖然深度學(xué)習(xí)和自然語言處理在文本方面還沒有達(dá)到語音和圖像處理技術(shù)一樣的成熟度,但現(xiàn)在也已有了很大進(jìn)步。事實(shí)上,國(guó)外已經(jīng)出現(xiàn)了新一代智慧寫作軟體“Narrative”。
“活人”記者依然是師傅
當(dāng)然,純技術(shù)角度做新聞編輯報(bào)道還是存在一定局限性。萬年進(jìn)化而成的人腦,絕非幾十歲的機(jī)器人能輕易代替。
美國(guó)密蘇裏大學(xué)教授唐納德·裏諾茲曾表示,大多數(shù)自然語言系統(tǒng)都在簡(jiǎn)單描述一個(gè)事件,但大多數(shù)新聞都是描繪性的,甚至是事件驅(qū)動(dòng)型的。人工智慧系統(tǒng)在進(jìn)行新聞創(chuàng)作時(shí)需要解決海量技術(shù)難題,包括自然語言處理中的自動(dòng)摘要、文本分類等,還有知識(shí)庫(kù)和知識(shí)發(fā)現(xiàn)(KDD)等相關(guān)技術(shù),比如實(shí)體定義、關(guān)係抽取、問答系統(tǒng)等。簡(jiǎn)單來説,就是機(jī)器首先需要理解自然語言,然後通過知識(shí)管理弄明白新聞中各個(gè)要素之間的關(guān)係。
有問題,就有答案。谷歌開源了SyntaxNet,將神經(jīng)網(wǎng)路和搜索技術(shù)結(jié)合起來,在解決歧義問題上取得顯著進(jìn)展,該軟體能像訓(xùn)練有素的語言學(xué)家一樣分析簡(jiǎn)單句法;Facebook推出了文本理解引擎DeepText,每秒能理解幾千篇博文內(nèi)容,語言種類多達(dá)20多種,準(zhǔn)確度接近人類水準(zhǔn)。
今年6月,人工智慧創(chuàng)業(yè)公司Maluuba公司發(fā)表了一篇關(guān)於機(jī)器理解的論文,提出了目前最先進(jìn)的機(jī)器閱讀理解系統(tǒng)EpiReader,該模型在CNN和童書測(cè)試(CBT)兩個(gè)數(shù)據(jù)集上的成績(jī)都超過了谷歌DeepMind、Facebook和IBM。EpiReader採(cǎi)取兩個(gè)步驟來確定問題答案。第一步(Extractor),使用了一個(gè)雙向GPU逐字閱讀故事和問題,接著採(cǎi)用一種類似Pointer Network中的Attention機(jī)制在故事中挑選出可能作為答案?jìng)溥x的單詞。第二步(Reasoner),這些備選答案被插入(完型填空)式的問題中,構(gòu)成一些“假設(shè)”,接著卷積神經(jīng)網(wǎng)路會(huì)將每個(gè)假設(shè)與故事中的每個(gè)句子加以比較,尋找文本蘊(yùn)涵(Textual Entailment)關(guān)係。簡(jiǎn)單來説,蘊(yùn)涵是指,兩個(gè)陳述具有很強(qiáng)的相關(guān)性。因此,最近似故事假設(shè)的蘊(yùn)涵得分最高。最後,將蘊(yùn)涵得分與第一步得到的分?jǐn)?shù)相結(jié)合,給出每一個(gè)備選答案正確的概率。
萬小軍教授説,記者聯(lián)繫採(cǎi)訪對(duì)象,觀察對(duì)方,用心去感受人物,再對(duì)大量資料進(jìn)行整理,做出取捨,對(duì)這些複雜細(xì)緻的情感工作,目前人工智慧機(jī)器人用深度學(xué)習(xí)的演算法尚不能搞定。由於目前的技術(shù)制約,寫稿機(jī)器人還無法開展自行思考,智慧寫稿系統(tǒng)在稿件的深度以及稿件個(gè)性化上很難在短時(shí)間內(nèi)取得突破。從這個(gè)意義上講,寫稿機(jī)器人為傳統(tǒng)記者節(jié)省了大量查閱資料的檢索時(shí)間,有助於人力記者寫出更有深度和富含情感的新聞作品。新聞的字裏行間包含著記者的判斷、價(jià)值觀與人文關(guān)懷,未來新聞人應(yīng)該把精力重點(diǎn)放在機(jī)器人無法完成的調(diào)查性、深度解釋性報(bào)道上,這樣雙方才可以真正實(shí)現(xiàn)互相補(bǔ)充、相得益彰。
李磊説,新聞機(jī)器人並不會(huì)取代記者,相反會(huì)成為記者的好幫手。機(jī)器人寫稿將大大提高記者産出新聞的數(shù)量和速度,節(jié)省媒體的時(shí)間成本和運(yùn)營(yíng)成本,提升媒體運(yùn)營(yíng)的成本收益率。用戶的閱讀興趣呈長(zhǎng)尾分佈,單篇閱讀量高的新聞可以由人力記者來寫,但是更大量的單篇閱讀量稍低的新聞同樣很有價(jià)值,由人來寫則收益率並不高,而請(qǐng)機(jī)器人來寫既能彌補(bǔ)這部分閱讀需求,又能降低新聞采編的成本,可謂一舉多得。
——記者觀察——
有了“他”們會(huì)更好
撰寫這篇稿件時(shí),我始終無法不去想這樣一個(gè)問題:寫稿機(jī)器人來了,自己會(huì)不會(huì)失業(yè)呢?
當(dāng)然,目前還不至於。對(duì)於媒體,內(nèi)容是王道,沒有深度的媒體人可能會(huì)被寫稿機(jī)器人淘汰,而能做出好內(nèi)容的深度報(bào)道記者則不會(huì)。
人工智慧要想達(dá)到替代人類的水準(zhǔn),需要好幾個(gè)階段的演化。第一階段首先是在各個(gè)垂直領(lǐng)域誕生若干超級(jí)智慧,比如健康和知識(shí)問答領(lǐng)域的“沃森”、圍棋領(lǐng)域的“AlphaGo”等。這些垂直超級(jí)智慧可以在特定領(lǐng)域內(nèi)展現(xiàn)出遠(yuǎn)超人類的能力,但是在擅長(zhǎng)領(lǐng)域之外沒有任何作為。不過,他們將為誕生在所有領(lǐng)域內(nèi)具備超人能力的終極智慧打下初步基礎(chǔ)。
知識(shí)改變命運(yùn),技術(shù)改變世界。相信在以寫稿機(jī)器人為代表的人工智慧技術(shù)引領(lǐng)下,全球終將步入一個(gè)全新的資訊技術(shù)時(shí)代。憑藉不斷進(jìn)步的技術(shù)的力量和更多的試驗(yàn)、更早的調(diào)整及更好的準(zhǔn)備,人類將會(huì)建設(shè)出一個(gè)更加智慧化的美好世界。
文·本報(bào)記者 李 釗
[責(zé)任編輯:李帥]