伊人久久国产免费观看视频_总裁紫黑色硕大挤进去_亚洲成人第一页_日本中文字幕在线观看视频 - 亚洲成AV人不卡无码国产

最新通知 園區新聞
媒體報道

警惕“大數據傲慢”

http://www.86xian.com      發布日期:2015-07-01      中關村多媒體創意產業園      關注度:
http://www.bjmmedia.com.cn

我們每天聽到“數據”一詞的頻率突然高起來,如“大數據”、“數據經濟”和“政府數據公開”等,“數據”與現代社會、與大家的日常生活越來越息息相關。

從“數字”、“數值”到“數據”

沒有計算機和信息技術的年代里,“數據”更多的是“數字”或“數值”,至多也就是用于統計的“數字”或“數值”。計算機問世初期,信息技術有了“數值計算”和“數據處理”的差別,只不過,“數值”通常指連續變化的物理量;而“數據處理”處理的是離散的一組組“數字”而已,“數據”仍然停留在統計應用的水平。

隨著計算機和信息技術的普及和發展,互聯網的普及特別是移動互聯網的普及,“數據”有了更多的內涵和更廣外延,“數據”不再限于“數字”或“數值”,只要是計算機可以處理,“數據”可以是文本、語音、圖形、圖片、視頻和更多其他的形式!敖鹑跀祿卑ǖ幌抻阢y行交易、證券交易、外匯牌價和交易、信貸、資信、金融趨勢等!搬t療數據”包括但不限于病人癥狀、檢查結論、診斷、用藥、流行病、專家就診時間、醫療資源分布等!敖逃龜祿卑ǖ幌抻谶m齡學生數、課程計劃、成績、教育質量、升學、就業等等。各種數據,林林總總,不一而足。

曾記得,“數字化”風靡一時。科學家香農在上個世紀40年代就提出了采樣定理,即對一個連續函數,按給定間隔提取其值,就可以用一組離散的數字序列代表這個連續函數,這就是數字化的重要基礎。“數字化”的另一個意思是“數字化標示”,用一串數字來標示一個客體!皵底只蹦繕耸菙底钟嬎銠C可以處理模擬信號,也可以紀錄處理各種客體的“數字化標示”,我們不能不說這是一場技術革命,只不過這個革命是一種工具(計算機)或過程(計算機處理)的革命!皵祿本筒煌,“數據”是現在信息社會的一個新生兒,它像石油和礦石,是一種新的原材料,可以用來加工、產生價值;它像農具和機器,是一種新的生產資料,可以提高生產的效率;它像高速路和機場,是一種新的基礎設施,投資和利用它可以改善經濟和民生。

有創新企業的生產原材料就是“數據”,他們對這樣的原材料加工,生產去形形色色的“數據產品”,獲得受益,比如:加工過的病案數據對于醫藥企業,加工過的點評數據對于餐飲企業,加工過的人口流動數據對于規劃部門。有些企業很好的利用了“數據”這種生產資料,通過收集分析用戶習慣“數據”,可以設計生產出更有人緣的產品,比如:世界知名的互聯網公司和手機公司都不斷在收集分析用戶使用習慣的“數據”,進而改進自己的產品,搜索服務提供商不停收集用戶的搜索關鍵詞,借以分析各種有價值的趨勢。也有不少地方開始關注對于“數據”基礎設施的投入,提高本地區的競爭力,

有企業家說,鼠標嫁給水泥,誕生的寶寶叫數據經濟。

“大數據”并不僅僅是因為“數據”量大

“大數據”極大的提升了“數據”一詞的使用頻率。多大是“大”?

其實歷史上“海量數據”被用過很長時間,“海量數據”也是在說“數據”的規模,“大數據”也包含“數據”的規模,不同的是:“大數據”不僅關乎規模,同時還涉及數據的多樣性和復雜性,最關鍵的是用傳統的理論和方法都無法高效處理。

曾幾何時,人民熟知的數據大小的單位,從位、K(千、10的3次方)、M(百萬、10的6次方)、G(十億、10的9次方)、到了T(兆、10的12次方)、P(千兆、10的15次方)、甚至E(百京、10的18次方)!督洕鷮W人》期刊2010年2月出版的專輯“The data deluge(數據洪流)”中提到數據大小的單位E時,不少專業人士也得上網查查,E到底是多大?

“大數據”與“數據”或“傳統數據”有規模上的不同,同時在收集方式上,特別是分析方法上有著根本的差別。搜索服務提供商不停收集用戶搜索關鍵字,用于分析各種趨勢;社交網絡不停收集聊天主體,分析其中關鍵字和語義,判斷社會大眾心情;電商則通過售買數據解讀熱銷產品,這些和“傳統數據”或“小數據”的收集方式有明顯的差異!皞鹘y數據”的分析方法主要是統計和數據挖掘!按髷祿钡募庸づc“傳統數據完全不同”:高度并發的數據采集、數據全集(而非抽樣)的處理、數據清洗等預處理,非結構化數據的處理、語義分析、深度學習。正是由于采用了各種新的數據處理方法,“數據”才能成為“大數據”,“數據”才有價值,“數據”才能成為原材料、生產資料、基礎設施。

數據的社會價值

當“數據”不再只是“數字”和“數值”,當“數據”成為了原材料、成了生產資料、成了基礎設施,我們顯然可以得出結論:現代社會“數據”無處不在。正是無處不在的計算、無處不在的網絡和無處不在的數據構筑了信息社會的三個維度。

現在信息社會是信息技術的發展和普及帶來的,而信息技術的發展史,是信息技術核心不斷轉換的歷史,計算機剛剛問世時,信息技術的核心是計算機;隨著計算機越來越多,核心轉移到計算機的網絡;有了網絡,核心就轉移成為搜索,在互聯網和移動互聯網普及的今天,數據成為了信息技術的核心。

《自然》期刊2015年2月發表查爾斯 賽費的文章說,“大數據”不僅帶來了商業和科學的革命,同時帶來了社會的變化,在過去的十年里,我們讓機器在我們生存的方方面面扮演者中間角色,我們和朋友交流、娛樂、駕駛、健身、看醫生、讀書,總有計算設備在那接收、發送數據,是我們留下了朵朵巨大的數據云。

從司空見慣的日常生活到最尖端的科學研究,人類不斷在創造數據,也不停地利用和享受著數據帶來的便利。

一個人早上起床通過智能手機上網看看天氣預報,利用了數據、計算、和網絡,通過電視節目來看天氣預報也是一樣,有專業人員收集天氣數據、分析天氣數據、得出數據預報結論,通過電視節目播出來。通過電商采購日常用品越來越普及,一目了然的多種選擇,可供參考的用戶評價,優惠的價格,快速的物流和配送,方方面面都在利用數據、計算和網絡詮釋著便捷和高效,通過改變人們的消費習慣來改變著人的生活方式。

電子郵件、短信、博客、微信和朋友圈是全新的人與人的交互方式,讓幾年前還常用的郵遞信件、電報、傳真變成歷史。

傳統的不同語言之間的互譯,多少年來都是語言學家編出字典,語言專家借助字典互譯,然而,數據改變了這樣的傳統,谷歌公司利用“大數據”和統計的方法,通過對大量雙語文獻的收集和處理,為社會提供了71種語言的即時互譯,去年一年為大眾提供了達2億次的翻譯服務。這種翻譯可能還沒有達到語言學家的文學譯著那么優雅,但是已經服務于聯合國不同語種的文件翻譯。

歐洲核子研究組織(CERN)是全球最大的粒子物理學實驗室和高能物理研究中心,取得了令人矚目的科學成就,它同時也是世界上第一個網站,第一個網絡服務器,第一個瀏覽器的誕生地。它的科學發現的基礎是其各種設備每天不停歇的接收和處理不可想象規模的數據,每秒鐘要處理幾十TB的數據。

如果說工業1.0是蒸汽機帶來的機械化、工業2.0是電力帶來的電動化、工業3.0是計算機帶來的自動化,那工業4.0就是數據帶來的智能化。其最基本的理念是CPS(信息物理系統),簡單說,就是用數據讓所有相關因素連接為一個系統,包括訂單、原材料、生產設施、生產過程、倉儲、物流、全球化等等,仔細分析工業4.0的核心特征,都與數據有密不可分的聯系。

數據素養

“素養”可以看作是素質和修養,是人的思維方式、能力和價值觀,F在社會人與物、人與人的交互愈加密切,人的素養就成為現在社會一個非常重要的關注點,信息技術和“數據”的社會價值越來越高,當然對現代社會的人的“數據”素養提到一個新的高度。

“數據素養”包括對數據的敏感性,數據收集、處理、分析、判斷和利用的能力,尊重數據倫理、保證數據準確、安全和隱私的修養。

“數據素養”不再限于對信息從業人員的要求,而變成了一種對全民、尤其是年輕一代的要求,顯然沒有人可以游離在信息社會之外。非常有意思的觀察是:給幼兒智能手機類似的物品,多數幼兒都會模仿大人,用手指在屏幕上劃來劃去,好像他們的家長小時候更多是拿筆會畫一樣,這是認知規律使然,從一個側面證明了數據素養是從很小年齡就可以開始訓練和培養的。仍然存在的城鄉差異、地區差異、職業差異、教育程度差異等并沒有影響大眾一起接受智能手機、網絡電視、電商或“微信”,幾乎每個公民都有提高自身“數據素養”的需求。當然這并不是要求非專業人員具備和專業人員同樣的技能,不同人群的“數據”技能是不同層次的,但是價值觀、倫理規范是同樣的,要判斷數據的真偽、要保證數據的準確、要關注數據的安全、要尊重他人的數據隱私等。

《科學》期刊2014年11月刊發費雷德 凱特的文章,其中一個重要觀點是:隨著現代社會越來越“數據化”,如果我們依然完全依靠現在保護隱私的工具軟件,我們的隱私只會處于前所未有的危險中。各種信息泄露。

《福布斯》期刊2015年1月5日報道,摩根士丹利發現其大約900名財富管理客戶的賬戶名稱和賬戶號碼被泄露在公開網站上,盡管客戶賬戶密碼和社會安全號碼未被泄露,當時也還沒有證據顯示任何客戶因此遭受經濟損失,但是足以引起社會的高度關注。《路透社》2015年5月13日報道,“Uber(優步打車)”大約5萬名司機的信息被未知第三方獲取,是一次大規模的信息泄露,該公司2014年9月在自身系統中發現一個漏洞,可讓外人在未經授權情況下獲取部分司機的姓名和駕照號碼。雖然優步未收到任何有關這些數據“已遭濫用的報告”,但是對于這樣敏感數據的大規模泄露還是暴露出快速發展的互聯網公司數據安全方面的風險。

《科學》期刊2014年3月14日發表大衛 拉澤的文章,作者認為:大數據集的分析是很復雜的,但是由于大數據的收集不一定有傳統小數據的收集過程那樣的縝密,難免出現失準的情況,作者用谷歌流感趨勢(GFT)失準作例子,指出了“大數據傲慢”是問題的根源,是大家應該思考的問題。

谷歌認為用戶搜索關鍵詞可以用來預測流感疫情的現狀,據此開發了谷歌流感趨勢(GFT),不過其結果與美國疾病預防控制中心的監測報告相比對,2013年2月,GFT預測的流感樣病例門診數超過了CDC根據全美各實驗室監測報告得出的預測結果的兩倍,顯然失準。

在數據公開、數據交換、數據共享和數據利用成為大勢所趨時,不論是政府機構、企業還是個人,都在創造數據、管理數據和使用數據,每個公民在這樣的過程中遵守法律和尊重倫理是最必不可少的素養。

(來源:新華網)



上一篇:正視網絡銀行時代的挑戰
下一篇:創新工程:讓科學家安心搞科研

 
 
 
中關村多媒體創意產業園 320㎡寫字樓出租
核心區5A級寫字樓招商
320㎡,精裝修
([2017-10-18]) [查看全文]
中關村多媒體創意產業園 230㎡寫字樓出租
核心區5A級寫字樓招商
230㎡,精裝修
([2017-10-18]) [查看全文]
中關村多媒體創意產業園 190㎡寫字樓出租
核心區5A級寫字樓招商
190㎡,精裝修
([2017-10-18]) [查看全文]
中關村多媒體創意產業園 160㎡寫字樓出租
核心區5A級寫字樓招商
160㎡,精裝修
([2017-10-18]) [查看全文]