北京快中彩连锁
logo
關于我們

智媒體實驗室由南都?智媒云圖和北京大學計算機科學技術研究所于2016年底聯合成立,對機器寫作、文本實體識別、智能摘要、立場分析、智能服務等方面進行研究和實踐,致力于搭建人工智能創新平臺,通過海量的數據和高效的算法,探索人工智能進行媒體內容理解與生產,最終實現多領域的自然語言智能理解和自動生成。

智媒體實驗室由北大計算機所語言計算與互聯網挖掘研究室負責人萬小軍和資深媒體人黃治軍擔任聯合主任,由智媒云圖首席架構師王新林擔任首席技術官,實驗室除了AI工程師、數據工程師、前端后端研發人員以外,還配備數據分析師、產品經理以及編輯人員。

一是文本深層語義分析,這是自然語言理解的核心技術,將自然語言文本解析成深層語義圖(甚至邏輯表達式),為上層應用服務;二是文本摘要與生成,基于文本自動摘要與文本自動生成技術,實現對包括新聞、綜述、學術文獻等在內的各類稿件的自動撰寫,研制機器寫稿系統;三是情感分析與社交媒體挖掘,通過跨語言情感分析技術,實現對世界范圍內多語言文本的情感與立場分析,并構建自有的社交媒體數據平臺;四是其他新型技術探索,例如深度學習技術、人機對話技術、針對復雜問題的智能問答技術等等。

2017年1月18日,智媒體實驗室第一個作品——寫稿機器人“小南”正式上崗,并推出第一篇共300余字的春運報道。小南最初定位為聚焦于民生報道的機器人,隨著自然語言處理技術的不斷進步,機器學習的不斷深入,語料素材的不斷累積以及知識庫的逐步建立,小南的寫作能力更強,領域更廣泛,文體更復雜。目前小南的寫作平臺開通了消費、路況、天氣、賽事、財經、春運和AI簡報等頻道。

機器人小南寫稿主要有兩種方式:原創和二次創作。 原創主要通過從數據生成稿件,抓取數據、分類和標注,然后通過模板進行寫作。例如路況播報、車票信息、天氣預報、空氣質量、股市行情報道、物價信息、賽事簡訊、辦事大廳客流播報、產品說明書、醫療檢測報告等都是基于這種寫稿模式。 二次創作即對已有的相關報道進行加工,改寫成為新的稿件。例如賽事綜述,是基于體育直播文字進行體育新聞自動撰寫,利用排序學習和點行列式過程對直播文字語句進行篩選與融合,組成成最終的體育賽事報道。再如新聞摘要或會議簡報,運用文本摘要技術自動分析給定的文檔或文檔集,摘取其中的要點信息,最終輸出一篇短小的摘要,該摘要中的句子可直接出自原文,也可重新撰寫所得。

目前日均寫稿量大約在500篇左右。為什么是“大約”?因為某些領域的寫作需要設定一個“閾值”來觸發機器人寫稿。比如股市動態,我們會設定如果某一只股票的漲跌幅或者換手率超過一定的數值,就會觸發機器人寫稿,當日股市波動很大的話寫稿量就會很大。

文本自動生成是自然語言處理領域的一個重要研究方向,實現文本自動生成也是人工智能走向成熟的一個重要標志。文本自動生成可包括文本到文本的生成、意義到文本的生成、數據到文本的生成以及圖像到文本的生成等。文本自動生成技術可以應用于智能問答與對話、機器翻譯等系統,實現更加智能和自然的人機交互;也可以通過文本自動生成系統替代編輯實現新聞的自動撰寫與發布,最終將有可能顛覆新聞出版行業;該項技術甚至可以用來幫助學者進行學術論文撰寫,進而改變科研創作模式。 (詳見萬小軍《文本自動生成研究進展與趨勢》

語言是文明的標志,是人類思維和情感的載體,自然語言處理(NLP)正是人工智能的最高境界,被譽為人工智能“皇冠上的明珠”。1997年,IBM的深藍超級計算機已經能夠打敗國際象棋世界冠軍卡斯帕羅夫,甚至連號稱“人類智力最后一道防線”的圍棋也被人工智能攻破。但機器寫作、機器翻譯、機器問答等自然語言領域,仍然沒有大的突破!最根本的原因是,圍棋的勝負機器很好判斷,所以學習目標很明確。但寫稿不一樣,寫一篇稿件,寫的好還是不好,滿意不滿意,沒有標準的判斷方式。 在某個比較窄的領域,經過大量的訓練的機器人,有可能寫出相當棒的文章,但讓機器擁有“自主意識”,具有思維與情感、學會推理和歸納,目前看來還只是一種幻想,或者說人類危機意識的體現。

一個是寫作領域還比較窄,寫稿機器人實際上是一款利用編程語言實現的智能寫稿軟件,多數專注于財經、體育等領域,因為這兩個領域具有一定規則和數據可循,實現起來相對容易。一個是語言表達的豐富性問題,以“小南”舉例,在小南寫稿過程中,遇到的一個難點就是可供學習的樣本不夠豐富,訓練語料較為缺乏。而且,因為缺乏情感表達和思維能力,它寫出的作品大多平鋪直敘,不夠生動。如果僅看幾篇沒有太大問題,看多了難免會感覺單調、枯燥。

美聯社自 2014 年 7 月開始已采用新聞寫作軟件自動撰寫新聞稿件來報道公司業績,這大大減少了記者的工作量。美國洛杉磯時報也有一種用來撰寫突發新聞的應用軟件。美國“自動洞察力”公司(Automated Insights)已采用“語言專家”軟件撰寫了 3 億篇報道,包括橄欖球、財經報道。這些進展標志著文本自動生成不再屬于紙上談兵的技術,而是已經對人類工作和生活產生了重大影響。路透社推出Lynx Insight的人工智能工具,將編輯工作中機器所擅長的領域分攤給機器(如機器可以對數據進行挖掘,以及識別數據規律),將編輯人員所擅長的工作內容交予人類(例如設置提問、賦予任務以權重,對上下文進行理解等等)。

目前寫稿機器人僅能做到將一個基本的新聞事實描述清楚,深度、調查類報道還必須依賴記者完成。創作型人工智能的優勢是執行一些簡單、重復性的創作輸出,人類可以集中精力聚焦一些更富創造性的智力勞動,構建一種和諧的分工協作關系。

introduction

智媒體實驗室大事記


2018年5月

機器人小南解鎖行業寫稿,推出AI行業簡報。


2018年4月

智媒體實驗室聯合珠海國家稅務局推出“智稅助手”產品。


2017年6月

機器人小南開通寫稿平臺,陸續開通交通、天氣、體育、消費、財經領域寫稿。


2017年1月

寫稿機器人“小南”正式上崗,并推出第一篇共300余字的春運報道。


2016年12月

南都?智媒云圖和北大計算機所簽訂戰略合作,智媒體實驗室在廣州成立。


【聯系我們】[email protected]


北京快中彩连锁 1000李逵劈鱼游戏下载 排列三怎么最容易中奖 甘肃麻将中的金是什么 迅雷赚钱宝是挖水晶吗 动物狂欢怎么押 老重庆时时开奖号码360 重庆时时计划免费 老时时彩走势图 美式橄榄球比分直播 山西快乐十分网上买 全民麻将网站 成都麻将技巧 三公扑克游戏免费下载 2019开奖记录开奖结果 湖北11选五开奖时间 捕鱼大师千炮版