伊人久久国产免费观看视频_总裁紫黑色硕大挤进去_亚洲成人第一页_日本中文字幕在线观看视频 - 亚洲成AV人不卡无码国产

最新通知 園區新聞
媒體報道

專訪微軟AI首席科學家:AlphaGo激發全球人工智能進入一個新時代

http://www.86xian.com      發布日期:2016-03-22      中關村多媒體創意產業園      關注度:
http://www.bjmmedia.com.cn

AlphaGo戰勝李世石已經演變成火熱的社會性事件。數據顯示,僅網易新聞客戶端就有1916萬人觀看了第一場直播,五場直播的觀眾超過6000萬;在這場人機大戰的第四場,李世石扳回一局時,央視中斷正常的兩會直播,臨時插入比賽直播,上億觀眾直接見證了人機世紀大戰。

在此之前,IBM的超級電腦“深藍”曾在1997年戰勝當時的世界象棋冠軍卡斯帕羅夫。接近20年后,谷歌的人工智能項目AlphaGo戰勝世界排名第四的專業九段圍棋頂級高手李世石,再次掀起了全社會對于人工智能的關注。

微軟人工智能首席科學家、美國IEEE電氣和電子工程師協會院士鄧力認為,這一次人機大戰有可能引發人工智能的新一輪熱潮。

兩場「人機大戰」

兩次人機大戰時隔20年,這其中最重要的差別在于象棋與圍棋的復雜度差異巨大。人工智能之所以能夠首先戰勝國際象棋冠軍,在于國際象棋可以窮盡接近所有可能的招式,也就是說國際象棋的棋譜是有上限的,而圍棋就不一樣了。

圍棋到底有多少種變化?通常有兩種說法:一種是圍棋棋盤上共有19*19=361個點,每一點都有黑、白、空三種情況,可能產生的局數為3的361次方;另一種是361的階乘,即占完一個點位后,剩下還有n-1種可能。通常傾向于第二種算法,如果忽略一些圍棋細則,按第二種算法計算,答案約為10的768次方。此外,普林斯頓的研究人員給出19x19格圍棋的合法棋局數為10的171次方。無論哪一種,都接近無窮大。

鄧力介紹說,他深入研究過AlphaGo的學術論文。AlphaGo的現有算法難點在于一方面要學習已有的圍棋棋譜,另一方面還要探求非常大的、與取勝有關的未知棋譜。之后的算法有可能拋棄依靠已有棋譜進行有監督的學習(Supervised  Learning),而直接僅僅依靠增強學習(Reinforcing Learning)。

換句話說,AlphaGo要通過自己與自己下棋,盡可能多的創造出有價值的未知棋譜。所以,圍棋對于人工智能來說,相當于是求解一個開放式的問題;而國際象棋對于人工智能來說,則針對一個相對封閉式的問題。

人工智能告別上一個時代

當AlphaGo戰勝李世石的消息傳來,深藍之父Murray Campbell就此評價說:“這是人工智能一個時代的結束,棋類游戲已經基本結束,新的時代要開始了”。

AlphaGo所采用的主要人工智能算法之一叫做增強學習算法,把增強學習算法用于優化深度神經網絡 (deep neural nets),并且與之前主流的有監督學習相結合。機器學習算法大致可以分為三種:監督學習(如回歸、分類)、非監督學習(如聚類、降維,也可用于分類和回歸但尚未獲得成功)和增強學習。增強學習算法已經有20多年的歷史了,最初是受行為心理學影響而產生的機器學習算法。增強學習主要關注的是智能體(agent)如何在環境中通過采取一系列行動,獲得最大累積回報的自學習策略。

增強學習算法主要從任意初始狀態開始,通過與外部環境的持續交互,以自己不斷試錯和累積回報來獲得最佳學習策略,在這個過程中外界不給予直接指導(監督),外部環境的反饋只局限于間接的、通常是遠距離的回報(reward)。舉例來說,訓練室內機器人完成某個任務,在這個過程中人類并不干涉,只有當機器人接近完成任務時才給予正回報。所以,增強學習算法更接近生物學習的行為特征,具有探索未知問題的能力,可以獲得更高的智能。

根據美國Wired網站長期跟蹤谷歌的記者Cade Metz的報道,AlphaGo前期通過一個已知職業棋手的3000萬步數據庫進行訓練,在獲得相當的熟練度后,AlphaGo開始用增強學習算法與另一個AlphaGo程序相互博弈,探索未知的但與取勝有關的棋局,用以培養自己的“智能”。

新一輪人工智能呈現什么特點?

作為機器學習,人工智能和語音語言信號處理專家,鄧力長期投身于語音識別研究。他在自動語音與說話者識別、口語識別與理解、語音-語音翻譯、機器翻譯,圖像和多模態信息處理,大數據深度分析等領域做出過重大貢獻,并憑借在深度學習與自動語音識別方向做出的杰出貢獻榮獲2015年度IEEE信號處理技術成就獎。

鄧力向鈦媒體介紹說,過去以語音識別和圖像識別為主的人工智能研究,有一個高度成功的主流方法,即“有監督的深度神經網絡”,這是因為,語音和圖像識別問題都可以用深度學習的高度泛化能力去窮盡所有可能。有監督的深度神經網絡已歷經了好幾年的研究與確認,被認為是能夠解決語音和圖像識別的最有效的工具。

基本上到2012年的時候,把有監督深度神經網絡用于語音識別就已經成功獲得突破。當時,微軟研究院全球院長Rick Rashid在天津成功演示了一個全自動同聲翻譯系統,實時把英文演講翻譯成中文并以中文語音輸出。這個演示中語音識別部分采用了有監督學習的深度神經網絡工具,最先由鄧力和他在微軟的同事于2009~2010間與多倫多大學的Geoffrey Hinton 教授合作開發。

在這之后,研究語音識別就穩步進入了有監督的深度學習時代。而當2014年1月谷歌4億歐元收購DeepMind以后,鄧力開始注意到DeepMind的增強學習算法路線。

DeepMind通過一個巧妙的思路實現了增強學習算法,因為增強學習算法是為了探索未知的問題,這里就涉及到計算資源、計算機技術、可用數據等多方面的限制。當谷歌收購了DeepMind后,對其進行了大量的投入。基于整合的有監督和增強性深度學習以及Monte Carlo 樹搜,谷歌DeepMind成功開發了AlphaGo。

從2014年開始,鄧力和他領導的團隊開始了對增強學習算法的研究,特別是把增強學習算法用于深度循環神經網絡的優化以及微軟內部一系列的應用。當AlphaGo打敗了李世石后,鄧力認為這很可能將激發國際巨頭對于人工智能的進一步的投資。盡管如此,鄧力認為大公司不會形成對人工智能的壟斷,特別是Elon Must等近期投入10億美元成立非盈利性組織OpenAI,專門研究人工智能技術并答應無償公開。

所以,未來全球不僅將掀起新一波人工智能熱,而且也有望涌現一批人工智能創業公司。這些創業公司將受益于谷歌、Facebook、微軟、百度與IBM等公開的開源機器學習算法,以及OpenAI將不斷放出的各種人工智能技術,還可以拿到只有小公司才能掌握的特殊數據,從而開發全新的人工智能應用。

“人工智能未來兩三年又是一波!”2016年3月26日,長期居住在美國西雅圖的鄧力將來到北京,參加由阿爾法公社、鈦媒體、ITValue、PMCAFF聯合主辦的人工智能創業研討活動,屆時您將有機會親自聆聽微軟人工智能首席科學家對于人工智能未來的觀點以及探討可能的創業機會。

(來源:鈦媒體網)



上一篇:營改增細則
下一篇:中國是國際專利申請增長主要推動力

 
 
 
中關村多媒體創意產業園 320㎡寫字樓出租
核心區5A級寫字樓招商
320㎡,精裝修
([2017-10-18]) [查看全文]
中關村多媒體創意產業園 230㎡寫字樓出租
核心區5A級寫字樓招商
230㎡,精裝修
([2017-10-18]) [查看全文]
中關村多媒體創意產業園 190㎡寫字樓出租
核心區5A級寫字樓招商
190㎡,精裝修
([2017-10-18]) [查看全文]
中關村多媒體創意產業園 160㎡寫字樓出租
核心區5A級寫字樓招商
160㎡,精裝修
([2017-10-18]) [查看全文]