在7月3日的“Baidu Create 2019”百度 AI開發(fā)者大會上,百度首席技術官王海峰博士正式發(fā)布了百度大腦5.0。這可以說是百度大腦史上最具跨越性的一次重磅升級,在算法創(chuàng)新、AI計算架構層面均實現(xiàn)重大突破。當天下午,百度大腦分論壇如期舉行。眾多百度技術大佬們在兩個半小時內悉數(shù)登場,解密十余項AI前沿技術的最新進展。
其中,百度AI技術平臺體系執(zhí)行總監(jiān)吳甜圍繞百度語言與知識技術的整體布局,做了詳細介紹。語言方面,百度大腦推出知識增強語義理解框架ERNIE,以及兼具高準確、低時延的機器同傳技術;知識方面,全面解析基于百度知識圖譜技術的視頻語義理解能力。同時,重磅推出行業(yè)知識圖譜平臺和智能創(chuàng)作平臺2.0兩大應用級平臺。
核心算法全面升級 保持業(yè)界領先水平
在語言與知識技術中,語義理解是重要的基礎之一。吳甜介紹了近期百度大腦在語義理解上的重要突破,推出基于知識增強的語義理解框架ERNIE。“不僅在學術界的公開數(shù)據(jù)集上,ERNIE也一直在百度實際的應用中展現(xiàn)實力,比如智能問答、CPR預估、文本潤色、對話理解等等,”吳甜說到。截至目前,ERNIE已經(jīng)學習了超10億知識。由此,ERNIE全面刷新中文NLP任務的效果,成為業(yè)界效果最好的語義理解框架,幫助AI更深度地理解真實世界。

機器同傳方面也有最新進展,在翻譯過程中對語音識別結果進行糾錯的聯(lián)合詞向量編碼技術,可解決翻譯一致性和連貫性問題的語篇翻譯模型等,結合先進的語音技術,百度大腦實現(xiàn)了高準確、低時延的端到端機器同傳技術。在本次大會上,現(xiàn)場聽眾掃描二維碼,即可通過手機同步收聽機器同傳流暢、自然播報的聲音,獲得沉浸式體驗。
知識,能幫助AI更深度地理解真實世界。在主論壇中,王海峰用近期熱映的音樂紀錄片《大河唱》,形象展示了融合百度知識圖譜技術的視頻語義理解能力。該技術通過對視頻的多模態(tài)知識解析,在多元異構知識圖譜上建立關聯(lián),并通過計算推理,建立對視頻的深度語義理解。
解密百度語言與知識技術平臺全貌
百度在語言與知識技術方面的重大更新,依靠的是在該領域的長期積累。現(xiàn)場,吳甜展示了百度語言與知識技術開放平臺的全景圖,其中不僅有豐富的基礎技術,還有包括翻譯開放平臺、UNIT平臺、行業(yè)知識圖譜平臺和智能創(chuàng)作平臺在內的4個應用級平臺。
“從使用規(guī)模、便捷性和價值來看,這是NLP和知識技術大生產(chǎn)平臺。”吳甜這樣介紹百度語言與知識技術開放平臺。30多項技術供給,多樣、靈活、可定制的服務方式,多套場景技術方案以及全面領先的多語言與知識技術,包括最好的中文語義理解框架ERNIE以及最大的多元語義知識圖譜等,使得平臺具有很好的便捷性價值。目前,平臺日均調用量達千億級,吸引了20萬開發(fā)者,綜合規(guī)模巨大。今年,百度基于飛槳(PaddlePaddle)平臺正式開源了百度多年積累的中文NLP工具和數(shù)據(jù)集Paddle NLP,吳甜表示,Paddle NLP的發(fā)布是開源、開放、大生產(chǎn)平臺階段一個重要的里程碑。
應用級平臺再升級:行業(yè)知識圖譜、智能創(chuàng)作2.0
在吳甜的發(fā)言中,兩大應用級平臺的重磅新發(fā)布作為壓軸戲登場,一是行業(yè)知識圖譜平臺,二是智能創(chuàng)作平臺2.0。
行業(yè)知識圖譜平臺基于領先的知識圖譜核心技術,提供智能高效的知識生產(chǎn)流程、低成本啟動和跨行業(yè)遷移的能力,幫助產(chǎn)業(yè)開發(fā)者定制行業(yè)知識圖譜并應用。
行業(yè)智能化的大量需求,對行業(yè)知識的積累和應用帶來了巨大的挑戰(zhàn)。后者的知識構建通常需要領域專家參與,而傳統(tǒng)知識圖譜耗時、耗力、成本高。吳甜進一步解釋道,百度打造了行業(yè)知識圖譜平臺,旨在能通過百度自身積累的知識圖譜技術,實現(xiàn)行業(yè)知識自動獲取和應用,助力企業(yè)實現(xiàn)智能化升級。百度行業(yè)知識圖譜具有深入復雜和專業(yè)兩大特點,且具備遷移學習能力,低成本啟動,能幫助產(chǎn)業(yè)開發(fā)者定制行業(yè)知識圖譜并應用。
同時,吳甜還向現(xiàn)場觀眾介紹了升級后的百度大腦智能創(chuàng)作平臺2.0。如果說去年百度世界大會上發(fā)布且在今年4月完成能力全面開放的智能創(chuàng)作平臺1.0,是讓創(chuàng)作者從枯燥和繁忙的“趕稿”日常中解放出來,那么2.0版本塑造的是更智能、更貼心的自動創(chuàng)作服務。據(jù)吳甜所說,智能創(chuàng)作平臺2.0具有三大特點。
一是實時熱點關聯(lián)豐富素材,以知識圖譜為基礎,提供熱點事件、熱詞關聯(lián)和事件脈絡等不同角度的素材,包含文本、圖片、視頻等多種模態(tài),為創(chuàng)作者提供新鮮、實用的創(chuàng)作靈感和素材支持,讓撰稿者不再談“熱點”色變。二是全面的創(chuàng)作輔助能力,該平臺提供了全面的創(chuàng)作輔助能力,例如快速創(chuàng)作時效性內容的自動創(chuàng)作功能、幫助創(chuàng)作者優(yōu)化文字細節(jié)的糾錯和潤色功能、在發(fā)布內容前補充信息的自動標簽和摘要功能等。三是領先的多模生成技術,以短視頻為例,多模態(tài)是內容創(chuàng)作的重要趨勢。綜合利用百度視覺、語音、文本的多模態(tài)理解能力,百度研發(fā)了自動根據(jù)圖文創(chuàng)作視頻,以及根據(jù)視頻創(chuàng)作圖文的先進技術。這些技術可以幫助創(chuàng)作者高效完成多種模態(tài)的內容生產(chǎn)。
語言與知識技術是機器與人交流、理解真實世界的重要基礎,百度大腦在此方面的系列創(chuàng)新,拉近了人與機器的距離。在最后,吳甜在大屏幕上用了“突破創(chuàng)新、開源開放、智見未來”十二個大字,結束了她的演講。這也是百度在語言與知識技術領域的長期發(fā)展目標,將持續(xù)為開發(fā)者和相關領域提供更好的技術支持。
從該場論壇來看,百度大腦5.0已經(jīng)打通了從基礎層的深度學習技術到通用AI能力、應用技術方案,再到定制化模型,以及最終的部署和集成,整個人工智能產(chǎn)業(yè)化應用落地的全部流程,實現(xiàn)了AI技術的標準化、自動化和模塊化。而這股打通“任督二脈”的“神功”,百度正在開放給更多開發(fā)者,希望大家都能平等便捷地獲取AI能力,加速產(chǎn)業(yè)智能化進程。