日本一区二区三区有限公司,波东野结衣,激情综合五月婷婷

不止圖像識(shí)別，F(xiàn)acebook谷歌正教機(jī)器人成為抽象畫家

http://www.86xian.com 發(fā)布日期：2015-06-23 中關(guān)村多媒體創(chuàng)意產(chǎn)業(yè)園關(guān)注度：
http://www.bjmmedia.com.cn

2014年11月，谷歌研究院發(fā)表的一篇博文稱，未來谷歌的圖形識(shí)別引擎不僅僅能夠識(shí)別出照片的對(duì)象，還能夠?qū)φ麄€(gè)物理場景進(jìn)行簡短而準(zhǔn)確的描述，也就是“圖像識(shí)別神經(jīng)網(wǎng)絡(luò)”（簡稱“神經(jīng)元網(wǎng)絡(luò)”）。對(duì)該技術(shù)進(jìn)行研究的還有Facebook。近日，兩家公司各自對(duì)透露了該項(xiàng)目的最新研究進(jìn)展。本文綜合了網(wǎng)易科技、騰訊科技的相關(guān)編譯報(bào)道。

神經(jīng)元網(wǎng)絡(luò)——人工大腦，其可以立即識(shí)別照片中人的面部、車輛、建筑物以及其他對(duì)象。但是，該系統(tǒng)局限性仍存。

該網(wǎng)絡(luò)基于機(jī)器語言翻譯方面的研究成果：通過一種遞歸神經(jīng)網(wǎng)絡(luò)（RNN）將一種語言的語句轉(zhuǎn)換成向量表達(dá)，并采用第二個(gè)RNN將向量表達(dá)轉(zhuǎn)換成目標(biāo)語言的語句。

該網(wǎng)絡(luò)可以識(shí)別語音、將一種語言翻譯成另一種、定向投放廣告或者教會(huì)機(jī)器人開啟瓶蓋。如果將整個(gè)過程逆轉(zhuǎn)，人們可以讓該系統(tǒng)具備全新能力，不僅可以識(shí)別圖像，而且可以創(chuàng)造圖像。

Facebook表示，其正在教授自家的神經(jīng)元網(wǎng)絡(luò)完成創(chuàng)建包括飛機(jī)、汽車及動(dòng)物在內(nèi)的圖像的任務(wù)，在40%的情況下，這些圖像足以讓我們相信自己看到的是真實(shí)照片。

而來自谷歌的研究人員則正在進(jìn)行截然相反的工作，他們通過神經(jīng)元網(wǎng)絡(luò)將真實(shí)的照片轉(zhuǎn)換成某種超現(xiàn)實(shí)主義的風(fēng)格。他們讓機(jī)器識(shí)別照片中熟悉的模式，然后對(duì)這些模式進(jìn)一步增強(qiáng)，然后在同一張照片中重復(fù)這一步驟。如果照片中的云朵有點(diǎn)像鳥，網(wǎng)絡(luò)就會(huì)使其變得更像鳥一點(diǎn)，周而復(fù)始，直至完全體現(xiàn)出一只鳥的樣子，其結(jié)果就是某種由神經(jīng)元網(wǎng)絡(luò)生成的抽象藝術(shù)畫作。

研究人員將圖片輸入圖像識(shí)別神經(jīng)網(wǎng)絡(luò)，并讓它識(shí)別該圖片中的一個(gè)特征，并修改圖片以強(qiáng)調(diào)這項(xiàng)特征。修改后的圖象然后被反饋到神經(jīng)網(wǎng)絡(luò)，并讓神經(jīng)網(wǎng)絡(luò)再次識(shí)別其他特征并強(qiáng)調(diào)它們。最終，這幅圖片被修改得面目全非。

在一個(gè)低水平上，這種神經(jīng)元網(wǎng)絡(luò)可以被用來檢測圖像的邊界。在這種情況下，這些圖像就像繪畫作品，使用過Photoshop濾鏡的人應(yīng)該對(duì)此感到不陌生：

但是，如果神經(jīng)元網(wǎng)絡(luò)被要求識(shí)別更復(fù)雜的圖像，——例如識(shí)別一頭動(dòng)物，它會(huì)產(chǎn)生令人不安的奇幻圖景。

最終，這個(gè)軟件可以對(duì)隨機(jī)噪聲進(jìn)行識(shí)別，但生成的結(jié)果完全屬于自身的想象。

如果你讓一個(gè)用來識(shí)別建筑物的神經(jīng)元網(wǎng)絡(luò)去識(shí)別一幅毫無特征的圖像，它將產(chǎn)生這樣的結(jié)果。

這些照片是驚人的，但他們不僅僅是用來展示的。神經(jīng)網(wǎng)絡(luò)具有機(jī)器學(xué)習(xí)的一個(gè)共同特征：它不是向計(jì)算機(jī)輸入程序以讓它能夠識(shí)別特定的圖像，而是向它輸入許多圖像，并讓它自己整合這些圖像的關(guān)鍵特征。

但是，這可能會(huì)導(dǎo)致軟件更加出人意料。我們很難知道軟件正在審查哪些特征，以及它忽略了哪些特征。例如，研究人員要神經(jīng)元網(wǎng)絡(luò)在一幅隨機(jī)噪聲圖像中識(shí)別啞鈴，發(fā)現(xiàn)它認(rèn)為啞鈴一定是有手臂握住的。

解決方案可能是向它輸入更多放在地上的啞鈴圖像，直到它明白手臂并非啞鈴的內(nèi)在組成部分。

谷歌表示，通過將神經(jīng)元網(wǎng)絡(luò)的運(yùn)行過程逆轉(zhuǎn)，傳授它們生成圖像的技巧，能夠讓人們更好的理解它們的運(yùn)作機(jī)理。谷歌讓網(wǎng)絡(luò)對(duì)自己在圖像中發(fā)現(xiàn)了什么進(jìn)行描述。有時(shí)，它們只是發(fā)現(xiàn)了某個(gè)形狀的邊界；有時(shí)，它們發(fā)現(xiàn)了更加復(fù)雜的事物，例如位于水平線上一座塔的輪廓或者一棵樹中隱藏的建筑物。每一次，研究人員都能夠更好地理解該網(wǎng)絡(luò)。

雖然Facebook和谷歌在神經(jīng)元網(wǎng)絡(luò)呈像效果上有所差異，但跨越了“多層”人工神經(jīng)元還是能夠一致地完成特定任務(wù)。

通過該網(wǎng)絡(luò)，就特定層面的神經(jīng)元是如何理解一副圖像的問題，人們可以獲得一個(gè)量化的答案，這幫助研究人員通過可視化方式來理解神經(jīng)元網(wǎng)絡(luò)如何處理分類任務(wù)，進(jìn)而改進(jìn)網(wǎng)絡(luò)架構(gòu)以及判斷是否網(wǎng)絡(luò)通過訓(xùn)練完成了自我學(xué)習(xí)。

(來源：虎嗅網(wǎng)）

上一篇：政府營造生態(tài)環(huán)境市場引導(dǎo)創(chuàng)業(yè)創(chuàng)新
下一篇：“中國大學(xué)生IT高技能人才培養(yǎng)計(jì)劃”發(fā)布