












最新內容
http://www.86xian.com 發布日期:2016-03-29 中關村多媒體創意產業園 關注度:
http://www.bjmmedia.com.cn
據英國東英吉利大學消息,該校科學家開發出一種新的唇語閱讀技術,不僅有助于解決犯罪調查問題,也給那些在聽力和講話方面有困難的人帶來幫助。研究人員在近日于上海召開的“國際聲學、語音和信號處理大會”(ICASSP)上介紹了這一成果。
新的視覺語音識別技術由東英吉利大學計算科學學院海倫·L.拜爾博士和理查德·哈維教授開發,可以用在“任何憑聲音難以確定人們在說什么的地方”。拜爾說,當無法獲得聲音時,如何確定人們的講話內容是個獨特的問題,比如閉路電視的腳注,或者聲音不足又沒有對話語境的線索。但現在,通過機器唇讀分類技術,能更精確地區分這些聲音。
拜爾說,一種穩定的唇讀系統能用于從犯罪調查到娛樂用途等多種情況。唇讀還可以用在運動場上,比如足球運動員在比賽激烈時大喊大叫的單詞是什么,但最可能的實際用途還是在那些噪音較大的地方,比如汽車中或飛機駕駛艙內。
研究人員使用了一種新的訓練方法,使這種分類系統對以往的唇讀方法進行了改進。雖然目前這一系統還有需要改善的地方,但最重要的是,它可以通過調整來用于多種目的,比如給那些有聽力障礙或講話困難的人帶來幫助。此外,一個好的唇讀機可以作為整體視聽識別系統的一部分。
哈維也指出,在人工智能領域,唇讀是最具挑戰性的難題之一,訓練機器如何識別人類嘴唇的形狀和變化并非易事,所以這方面取得的進步非常重要。
相關論文將發表在電氣與電子工程師協會(IEEE)《2016年國際聲學、語音和信號處理大會會刊》上。
(來源:科技日報)