伊人久久国产免费观看视频_总裁紫黑色硕大挤进去_亚洲成人第一页_日本中文字幕在线观看视频 - 亚洲成AV人不卡无码国产

最新通知 園區(qū)新聞

最新內(nèi)容

媒體報(bào)道

不止圖像識(shí)別,F(xiàn)acebook谷歌正教機(jī)器人成為抽象畫家

http://www.86xian.com      發(fā)布日期:2015-06-23      中關(guān)村多媒體創(chuàng)意產(chǎn)業(yè)園      關(guān)注度:
http://www.bjmmedia.com.cn

2014年11月,谷歌研究院發(fā)表的一篇博文稱,未來谷歌的圖形識(shí)別引擎不僅僅能夠識(shí)別出照片的對(duì)象,還能夠?qū)φ麄(gè)物理場景進(jìn)行簡短而準(zhǔn)確的描述,也就是“圖像識(shí)別神經(jīng)網(wǎng)絡(luò)”(簡稱“神經(jīng)元網(wǎng)絡(luò)”)。對(duì)該技術(shù)進(jìn)行研究的還有Facebook。近日,兩家公司各自對(duì)透露了該項(xiàng)目的最新研究進(jìn)展。本文綜合了網(wǎng)易科技、騰訊科技的相關(guān)編譯報(bào)道。

神經(jīng)元網(wǎng)絡(luò)——人工大腦,其可以立即識(shí)別照片中人的面部、車輛、建筑物以及其他對(duì)象。但是,該系統(tǒng)局限性仍存。

該網(wǎng)絡(luò)基于機(jī)器語言翻譯方面的研究成果:通過一種遞歸神經(jīng)網(wǎng)絡(luò)(RNN)將一種語言的 語句轉(zhuǎn)換成向量表達(dá),并采用第二個(gè)RNN將向量表達(dá)轉(zhuǎn)換成目標(biāo)語言的語句。

該網(wǎng)絡(luò)可以識(shí)別語音、將一種語言翻譯成另一種、定向投放廣告或者教會(huì)機(jī)器人開啟瓶蓋。如果將整個(gè)過程逆轉(zhuǎn),人們可以讓該系統(tǒng)具備全新能力,不僅可以識(shí)別圖像,而且可以創(chuàng)造圖像。

Facebook表示,其正在教授自家的神經(jīng)元網(wǎng)絡(luò)完成創(chuàng)建包括飛機(jī)、汽車及動(dòng)物在內(nèi)的圖像的任務(wù),在40%的情況下,這些圖像足以讓我們相信自己看到的是真實(shí)照片。

而來自谷歌的研究人員則正在進(jìn)行截然相反的工作,他們通過神經(jīng)元網(wǎng)絡(luò)將真實(shí)的照片轉(zhuǎn)換成某種超現(xiàn)實(shí)主義的風(fēng)格。他們讓機(jī)器識(shí)別照片中熟悉的模式,然后對(duì)這些模式進(jìn)一步增強(qiáng),然后在同一張照片中重復(fù)這一步驟。如果照片中的云朵有點(diǎn)像鳥,網(wǎng)絡(luò)就會(huì)使其變得更像鳥一點(diǎn),周而復(fù)始,直至完全體現(xiàn)出一只鳥的樣子,其結(jié)果就是某種由神經(jīng)元網(wǎng)絡(luò)生成的抽象藝術(shù)畫作。

研究人員將圖片輸入圖像識(shí)別神經(jīng)網(wǎng)絡(luò),并讓它識(shí)別該圖片中的一個(gè)特征,并修改圖片以強(qiáng)調(diào)這項(xiàng)特征。修改后的圖象然后被反饋到神經(jīng)網(wǎng)絡(luò),并讓神經(jīng)網(wǎng)絡(luò)再次識(shí)別其他特征并強(qiáng)調(diào)它們。最終,這幅圖片被修改得面目全非。

在一個(gè)低水平上,這種神經(jīng)元網(wǎng)絡(luò)可以被用來檢測圖像的邊界。在這種情況下,這些圖像就像繪畫作品,使用過Photoshop濾鏡的人應(yīng)該對(duì)此感到不陌生:

但是,如果神經(jīng)元網(wǎng)絡(luò)被要求識(shí)別更復(fù)雜的圖像,——例如識(shí)別一頭動(dòng)物,它會(huì)產(chǎn)生令人不安的奇幻圖景。

最終,這個(gè)軟件可以對(duì)隨機(jī)噪聲進(jìn)行識(shí)別,但生成的結(jié)果完全屬于自身的想象。

如果你讓一個(gè)用來識(shí)別建筑物的神經(jīng)元網(wǎng)絡(luò)去識(shí)別一幅毫無特征的圖像,它將產(chǎn)生這樣的結(jié)果。

這些照片是驚人的,但他們不僅僅是用來展示的。神經(jīng)網(wǎng)絡(luò)具有機(jī)器學(xué)習(xí)的一個(gè)共同特征:它不是向計(jì)算機(jī)輸入程序以讓它能夠識(shí)別特定的圖像,而是向它輸入許多圖像,并讓它自己整合這些圖像的關(guān)鍵特征。

但是,這可能會(huì)導(dǎo)致軟件更加出人意料。我們很難知道軟件正在審查哪些特征,以及它忽略了哪些特征。例如,研究人員要神經(jīng)元網(wǎng)絡(luò)在一幅隨機(jī)噪聲圖像中識(shí)別啞鈴,發(fā)現(xiàn)它認(rèn)為啞鈴一定是有手臂握住的。

解決方案可能是向它輸入更多放在地上的啞鈴圖像,直到它明白手臂并非啞鈴的內(nèi)在組成部分。

谷歌表示,通過將神經(jīng)元網(wǎng)絡(luò)的運(yùn)行過程逆轉(zhuǎn),傳授它們生成圖像的技巧,能夠讓人們更好的理解它們的運(yùn)作機(jī)理。谷歌讓網(wǎng)絡(luò)對(duì)自己在圖像中發(fā)現(xiàn)了什么進(jìn)行描述。有時(shí),它們只是發(fā)現(xiàn)了某個(gè)形狀的邊界;有時(shí),它們發(fā)現(xiàn)了更加復(fù)雜的事物,例如位于水平線上一座塔的輪廓或者一棵樹中隱藏的建筑物。每一次,研究人員都能夠更好地理解該網(wǎng)絡(luò)。

雖然Facebook和谷歌在神經(jīng)元網(wǎng)絡(luò)呈像效果上有所差異,但跨越了“多層”人工神經(jīng)元還是能夠一致地完成特定任務(wù)。

通過該網(wǎng)絡(luò),就特定層面的神經(jīng)元是如何理解一副圖像的問題,人們可以獲得一個(gè)量化的答案,這幫助研究人員通過可視化方式來理解神經(jīng)元網(wǎng)絡(luò)如何處理分類任務(wù),進(jìn)而改進(jìn)網(wǎng)絡(luò)架構(gòu)以及判斷是否網(wǎng)絡(luò)通過訓(xùn)練完成了自我學(xué)習(xí)。

(來源:虎嗅網(wǎng))



上一篇:政府營造生態(tài)環(huán)境市場引導(dǎo)創(chuàng)業(yè)創(chuàng)新
下一篇:“中國大學(xué)生IT高技能人才培養(yǎng)計(jì)劃”發(fā)布

 
 
 
中關(guān)村多媒體創(chuàng)意產(chǎn)業(yè)園 320㎡寫字樓出租
核心區(qū)5A級(jí)寫字樓招商
320㎡,精裝修
([2017-10-18]) [查看全文]
中關(guān)村多媒體創(chuàng)意產(chǎn)業(yè)園 230㎡寫字樓出租
核心區(qū)5A級(jí)寫字樓招商
230㎡,精裝修
([2017-10-18]) [查看全文]
中關(guān)村多媒體創(chuàng)意產(chǎn)業(yè)園 190㎡寫字樓出租
核心區(qū)5A級(jí)寫字樓招商
190㎡,精裝修
([2017-10-18]) [查看全文]
中關(guān)村多媒體創(chuàng)意產(chǎn)業(yè)園 160㎡寫字樓出租
核心區(qū)5A級(jí)寫字樓招商
160㎡,精裝修
([2017-10-18]) [查看全文]