你可能不知道Nuance是做什么的,但你一定知道iphone4S帶來的一項革命性的人機交互產品——“Siri”。事實上,事實上,Nuance正是Siri的技術提供商。作為全球領先的語音和語言解決方案提供商,Nuance因為是T9輸入法的擁有者被業界所熟知,目前全球90%以上的手機都采用T9輸入法,這個輸入法原本是一家名為“Tegic Communications”所開發,后來被Nuance買了下來。Nuance同時也在近期收購了滑動輸入法的公司Swype。
關鍵的數據收集
5月12日,Nuance在深圳舉行了“2012年Nuance移動論壇”,這家以往“隱身”于各大國際公司背后的企業出現在了國內,吸引了深圳諸多廠商的興趣。Nuance在會上展示了三段不同的Video,這三段Video其中就有大家所熟知的Siri的廣告片,另外一段則是Nuance自己的“聲龍”系列產品,最后一段則是將語音技術結合手勢控制應用到智能電視的場景。通過短片,Nuance不但展示了目前語音技術發展的最新動態和趨勢,同時也展示了諸多國際企業所重視的關鍵點——用戶體驗,這將是在未來企業競爭中取勝的殺手锏。而Nuance的目標,也就是幫助這些企業提高用戶體驗。
語音技術的出現顯著改變了人機互動的方式,但如果你對Siri有一定的研究,你會發現其實語音識別技術(ASR)只占到其中的20%,真正重要的則是語義識別技術。語義識別能幫助用戶更準確地能否搜索出想要的結果。這種技術基于Statistic Language model(語言模型統計),需要大量的數據來完善搜索的結果。同時對于自然語言的理解(NLU技術),也需要數據庫的數據,來進行語法的收集。“越多的數據,越容易幫助我們配對用戶所需要的內容,了解用戶的意圖,將意圖翻譯成行動,效果最終也是取決于本身數據的質量。”Nuance大中華區總經理鄭裕慶表示。

鄭裕慶,Nuance大中華區總經理
Nuance的Dragon Go憑借在美國的Apple App Store和Android Market兩大移動應用平臺巨大的下載量而被用戶熟知。Dragon Go將Nuance的聲龍語音識別和自然語言理解技術與人工智能技術相結合,從而顯著簡化了搜索移動內容的體驗。因此,用戶僅憑借語音便能得到他們想要的內容,并能將更多的時間用于瀏覽而非查找在線內容。也就是說,Dragon Go能聽懂用戶說的話并能理解用戶意圖。用戶僅需說出一個簡單的短語,他們所喜愛和最相關的內容提供商便會顯示在眼前,用戶能輕松地獲取餐廳評述、購買電影票、觀看流媒體電影和電視節目、在線購物、查找方向、聽喜愛的音樂、還可以通過Expedia預定酒店。
如何提供更好的用戶體驗?
據了解,目前Nuance主要采用兩種商業模式。一種是直接向OEM廠商和制造廠商提供語音技術和解決方案,同時收取授權費用。這里不僅包括了手機、TV、PC等消費電子產品,還包括大量的企業級行業應用。另一方面,Nuance提供了自主研發的產品“如Dragon go”,供智能手機用戶方便的在AppStore以及Android Market免費下載。通過向消費者提供免費下載使用,Nuance得以收集龐大的語音數據,從而對語音引擎進行訓練,從而提高引擎的準確度。
事實上,早在Siri出現之前,Nuance 的自然語言應用DragonDictation(聲龍聽寫)和DragonSearch(聲龍搜索)就已經推向市場了。鄭裕慶表示,數據庫的豐富程度會直接影響到語音和語義的辨識度。所以Nuance早在1999年就已經開始在PC上應用語音引擎,到目前為止已經更新了11個版本,可以說是一個非常成熟的引擎。

從左到右依次為:JasonStirling,Nuance亞太區高級副總裁、鄭裕慶,Nuance大中華區總經理、StuartSharpe,Nuance亞太區銷售工程部高級總監
“除了成熟的引擎,我們最大的優勢,其實是如何能把用戶體驗做得更好的經驗。事實上語音識別率已經不是目前最重要的因素了,因為大家可能差距都不太大。但是用戶體驗就不一樣了。”鄭裕慶表示,包括如何解決噪音問題、如何優化語音控制界面,這些提高用戶體驗的東西,Nuance有著豐富的經驗以及完善的解決方案。
據統計,2011年通過云端訪問Nuance的語音數據庫便有20億的訪問量。而據鄭裕慶介紹,Nuance目前已經跟不少國際知名的品牌進行了合作。其中就包括三星智能電視,以及BMW汽車。而在今天年年初,Nuance也發布了跟Intel的合作,未來Nuance將為Urtrabook提供語音服務,包括開啟軟件、寫email、更新社群網站、控制音樂播放等操作都可通過語音完成。
Dragon TV讓電視真正智能
在論壇現場,鄭裕慶還特別強調了Nuance在數字客廳領域的創新。作為智能語音技術在數字客廳應用的創新應用方案,Dragon TV是一款專門針對電視原始設備制造商和運營商開發的一種獨特的語音和自然語言平臺,它可以讓消費者在數字起居室內利用語音、自然語言理解和觸摸輸入等移動創新技術,獲得無縫、直觀的互動體驗,使電視也成為與他們的手機、平板電腦、計算機和汽車一樣最常用的設備。消費者不僅能使用自然語指令切換頻道、搜索在線內容、訪問三星SmartHub,還可以通過Skype與朋友和家人交流。用戶僅需說一聲“HiTV(你好,電視),開機”,便能打開電視。
借助該平臺,消費者將不再受困于傳統電視遙控器繁瑣的操控方式,Dragon TV使電視從單純的接收設備變身為了一個互動系統。同時通過攝像頭鎖定技術以及手勢控制技術,Dragon TV可以在一定范圍內鎖定用戶,這樣在語音控制的過程中,不會出現噪音干擾的問題。

現場展示的采用Dragon TV的智能電視,可通過手勢進行控制
Dragon TV還可以使數字家庭設備所集成的電子郵件、社交網絡和互動通信等應用的操作變得更加直接簡單。憑借Nuance強大的語音和自然語言技術,用戶獲取內容時只需要說出頻道名稱、電視臺名稱、節目和電影的名稱等,便可完成直達目標,開始一場愉悅的互動視覺旅程。而隨著Dragon TV的發布,包括服務提供商、消費電子廠商和通過互聯網傳輸(OTT)的內容提供商等角色將共同構成一個更具競爭力的互聯網電生態系統,在為用戶提供更佳應用體驗的基礎上,贏得更廣闊的市場先機。
語音技術的門檻
盡管有消息稱,蘋果IOS下一個版本將會出現中文版本,但是在這個市場空白期,足以給“中國版siri”以成長空間。雖然中國有類似于安徽科大訊飛這樣的專注中文語音識別的本土廠商,但對Nuance并未造成威脅。鄭裕慶認為Nuance在中文領域并不存在劣勢,“我們現在主要支持普通話和廣東話,還有臺灣 國語。對于中文最難解決的口音問題嗎,我們從1999年開始就在采集各種口音來訓練我們的引擎。”
作為全球最大的手機制造中心以及市場,對于中國的手機廠商來說,在從功能機轉型智能機的過程中,他們急切的希望能夠添加完善的語音解決方案,而不僅僅是簡單的下載一個“語音識別”輸入法或應用這么簡單。
鄭裕慶表示,其實語音解決方案對于技術和投入的要求還是很高的,需要投入大量的人力物力,一些小公司很難有這個決心去做。“比如語音的話,就是你要知道怎么去設計這個語音界面,需要有語音設計背景的專業人員。技術和硬件都有要求。硬件如耳麥等,要求用比較好的產品,但是會提高成本。出于技術成熟度來考慮,需要對產品有一定時間的磨合,比如Siri從蘋果收購到最終出產品就用了兩年,這些對于中小客戶來說都不太可能接受。” |