3月22日,微軟(亞洲)互聯(lián)網工程院宣布率先推出新一代的語音交互技術:全雙工語音交互感官(Full-duplex Voice Sense),并已完成產品化落地。與既有的單輪或多輪連續(xù)語音識別不同,這項新技術可實時預測人類即將說出的內容,實時生成回應并控制對話節(jié)奏,從而使長程語音交互成為可能。此外,采用該技術的智能硬件設備,將不再需要用戶在每輪交互時都說出喚醒詞,僅需一次喚醒,就可以輕松實現(xiàn)連續(xù)對話,將語音交互的自然度推進到一個新的層次。
目前,該技術已首先在微軟小冰全球產品線中落地。其中在中國市場,除落戶中國科技館的小冰電話亭外,微軟還與小米公司緊密合作,米家生態(tài)鏈Yeelight語音助手的市售硬件產品已開始進入千家萬戶。這是全球首個搭載全雙工語音交互感官的智能設備,也是內置微軟小冰的首個“雙AI”智能設備。在日本市場,小冰凜菜(りんな)已通過該技術實現(xiàn)在直播平臺中的落地,首個車載智能項目也已開始路試。微軟計劃于未來六個月內,完成該技術在更多產品線中的覆蓋。
語音交互是對話式人工智能及智能硬件設備的基礎之一。全雙工語音交互技術的應用,有望實現(xiàn)用戶體驗的下一次飛躍,并成為人工智能語音交互的新“標準配置”。對此,微軟小冰全球研發(fā)負責人周力博士表示:“從已落地的產品數(shù)據(jù)和用戶反饋中,我們觀察到一個普遍現(xiàn)象:用戶一旦使用過微軟小冰的全雙工語音交互感官之后,再與其他語音助手交互時,他們普遍會開始感到不習慣,甚至會頻繁忘記要對其他語音助手說喚醒詞——新技術促進擬人自然度的顯著提升,使人們對過去單輪或多輪連續(xù)語音交互體驗的滿意度迅速下降。這種新老交替的現(xiàn)象,符合我們的研發(fā)預期。”
微軟全球資深副總裁、微軟(亞洲)互聯(lián)網工程院院長王永東博士表示:“我們預測,未來一年中,人工智能應用將越來越多地從某些單一技術領域,進入到發(fā)揮綜合能力的階段。微軟已在這方面深入布局。此次全雙工語音交互技術的推出,不僅涉及到計算機語音技術,還包括自然語言處理、人工智能內容創(chuàng)造等多個領域。這正是微軟在這些領域長期儲備、綜合運用的成果之一。”

特別提醒:本網內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯(lián)系我們,本站將會在24小時內處理完畢。