












最新內容
http://www.86xian.com 發布日期:2013-12-06 中關村多媒體創意產業園 關注度:
http://www.bjmmedia.com.cn
摘要:工信部電信研究院政經所互聯網部主任馬志剛發表了題為《數據開放共享問題研究》的演講,分享了數據開放利用的形勢和意義、美國數據開放利用戰略的發展歷程和實踐經驗及推動我國數據開放共享和開發利用的意見和建議。
【CSDN現場報道】中國最具影響、規模最大的大數據領域盛會—— 2013中國大數據技術大會(Big Data Technology Conference,BDTC)于2013年12月5-6日在北京舉行。數十家領軍企業,近七十場主題演講,不僅覆蓋Hadoop生態系統與流式計算,實時計算與NoSQL、NewSQL等技術方向,還對互聯網、金融、電信、交通、醫療等創新案例,大數據資源的法律法規、大數據商業利用的政策管制等有深入討論。
BDTC 2013中國大數據技術大會首日全體大會上,工信部電信研究院政經所互聯網部主任馬志剛發表了題為《數據開放共享問題研究》的演講,分享了數據開放利用的形勢和意義、美國數據開放利用戰略的發展歷程和實踐經驗及推動我國數據開放共享和開發利用的意見和建議。在第二個部分馬志剛提到,以國家成文立法,規定政府部門法定必須開放的數據范圍,才能為政府數據開放戰略提供法律保障。同時還需要制定相關政策,大力實行“開放透明”
以下為演講實錄:
馬志剛:在座的各位從行們大家好,我叫馬志剛,我是來自于工信部電信研究院政經所,今天非常榮幸在這里跟大家就大數據這個話題下探討一下我們看法。我給大家演講題目是《數據開放共享問題研究》。大家都知道大數據時代現在已經到來了,數據開放和共享問題也是和大數據問題息息相關的。與這個問題幾乎同一時期產生并隨著這個問題的發展而越來越尖銳,現在變得幾乎可以說是我們行業里面臨最重要的問題。數據開放與共享問題是大數據問題解決的一個前提條件。為什么這么講?我們現在大數據產業的發展或者行業的發展,技術的發展,面臨一個嚴峻的形勢,那就是整個的數據現在開放的部分,也就是在數據量級里面已經能夠開放的部分是非常有限的。大量的數據沒有開放,這些數據是存儲起來的,還有在專網存儲沒有被公網抓取利用。數據被掌控者越來越私有化,這是商業時代必不可少的一種趨勢,但是我們說這種趨勢的存在對大數據的發展構成一種挑戰。數據滾雪球效應和馬太效應越來越大,占有數據的一方量級越來越大,未占有的數據一方越來越小,導致兩極分化。所以數據開放與共享這個問題解決顯得尤為急迫,我探討一下數據共享與開放是什么問題,這個問題通過什么途徑解決?這個問題是非常復雜,結構體系非常龐雜的一個命題,對這個命題本身進行解剖相當困難。這里面存在一個數據種類劃分的問題,比如說公共數據,政府數據,行業數據,企業數據最終還有個人數據。這些數據里面存在保護問題,這些數據都要獲得保護,這里面還存在開放問題、公開問題及共享問題,最后還有一個使用和管理的問題,所有的這些命題糾纏在一起,就使得我們在大數據從事從業人員,在所有線索里面理清一些思路出來是相當不容易。
我們試圖在這些命題里面進行一番梳理,之后回答現在面臨比較尖銳問題共享。根據聯合國和美國西方發達國家定義數據開放僅僅停留在這些層面上,哪些數據可以開放共享?不被權利所保護進入公眾領域,能夠給公眾帶來公共福利,必不可少的這些數據應當獲得開放和共享。這樣的話就獲得權利保護的數據排除在開放與共享之外,這是在大私有制背景下做的界定,與中國環境而言還有不貼我們中國實情地方,我們希望從這個角度對這個問題進行一番梳理。我演講分幾部分,數據開放與利用形勢利益,第二談談美國的數據開放發展歷程和實戰經驗。最后推動我國數據開放共享的若干建議。
根據我們研究數據開放利用的戰略意義,根據我們研究我們認為數據開放與共享是提高社會生產力的重要前提。我們研究認為數據開放利用程度越高,信息知識作為生產要素就會越高。數據開放利用是推動社會全面發展的力量。數據開發共享是建立數據驅動式增長模式的必要途徑,基于這些元嬰考慮哪些數據可以共享。
第二方面我們談談美國開放發展歷程和實戰經驗。美國通過立法賦予社會公眾數據獲有權,這是公民的基本權利,是受美國憲法保護的權利,公民對于政府數據有獲取權,美國通過立法戰略等等一些工具,設計政府數據的開放原則,比方說政府數據必須以公開為原則,以不公開為例外,政府數據面前人人平等,政府拒絕提供信息的時候必須有舉證責任,司法有重新審定政府數據開放實事的權利。沒有政府對一些數據不開放,公民有異議的時候,公民可以把政府告到法院,司法對有審查的權利。
美國采取了類似于負面清單的方式,它規定了數據開放的一個范圍。它列舉就是說除下面這些數據之外其他數據都必須開放的在美國。國防、外交、內部人士等等,九類信息美國負面清點九類信息不允許開放其他信息都要開放。美國還以立法政策推進政府型資源的綜合開發利用。美國1985年制定聯邦信息資源管理政策的戰略,它推進政府信息資源要在全美范圍內進行綜合開發和綜合利用,這樣一個原則是最早在這樣一個管理政策,這個文本框架里面確定好的。
第二開放實施透明政府計劃。美國開放實施透明政府計劃,奧巴馬上臺以后經歷了三個階段,對推動政府數據開放做出不可磨滅的貢獻,美國依然實施奧巴馬總統提出來的開放實施透明政府計劃。2009年到2010年結束,這個時期美國建立透明政府計劃的原則,制定2009年開放政府計劃的備忘錄,這些戰略行動確定開放透明政府計劃的一些原則。第二階段2010年開始到2012年結束,這時候美國推廣開放透明政府的整體計劃藍圖。這個戰略行動包括美國2012年發布的數字政府建設21世紀更好服務美國人民的信息平臺,在數字政府提出美國三大政務目標,一個戰略模型,三大戰略舉措。美國政府號召美國聯邦政府機關必須以開放政府數據作為己任,把美國開放透明政府計劃落到實處,美國政府應當通過電子政務計劃建設信息層,展現層,開發層,整體上通過技術手段把聯邦現有的數據量以無限體量的方式面向社會進行開放和共享。
第三階段2013年一年的時間是美國開放透明政府計劃第三個階段,今年這個階段美國政府制定和發布了兩個戰略文本。第一,文本開放數據政策將信息作為資產管理。第二,政策文本實現政府信息公開化和機器可讀取化政府令。所有這些歸結為一點奧巴馬政府配合它大數據的倡議戰略,他同步進行了一項重要戰略就是推進美國政府公開透明計劃,兩步走的戰略,把美國確定為發展為治理自由的國家,確保美國在信息、資源、知識結構這方面具有超前的戰略能力和優勢,不被其他國家所超越,這是它的總體戰略目標。
第三方面推動我們國家數據開放共享,開發利用的一些思考。首先就是說基本制度設計這方面,我們經過梳理以后就是在國外廣泛推行的數據開發共享的這些制度,包括信息公開,公共獲取,自由流動,信息寄存,信息存儲、出版、國家許可證,這些制度都供我們國家借鑒的制度資源,我們可以在這些制度資源基礎上,想辦法設計我們國家的數據資源開發和共享所依賴的制度環境。另外像歐盟設計一些其他的原則,這個數據開放共享設定一些條件,對于數據開放與共享是不是收費,可以制定一些禁止原則,數據開放與共享禁止以商業利益為利用,這些我們都可以借鑒。
我們在開放與共享的范圍上,什么數據什么資源可以開放?這是很難的問題。剛才我講我們國家和美國制度不一樣,我們是公有制為主體國家,美國是私有制為主體的國家,美國保有私有制產權是神圣不可侵犯的權利,是憲法原則。我們中國是公有制國家,兩種制度相比較,我們在大數據開放與共享比美國更加有優勢。美國數據開放與共享,今天僅僅停留在政府數據,政府信息資源上,我們以后可以把范圍擴大到非政府組織,我們說在理論和實際上我們可以把哪些數據開發共享,最后,公共物品屬性的數據我們都可以定義為開放和共享。公共物品屬性一個公共數據具有非競爭性,就是說一個人使用這個數據資源同時其他人也可以使用,你無法利用你自己力量排除別人使用信息公共資源,或者你排除這個人使用信息公共資源成本將是巨大的是你無法承擔的,這時候我們定義為公共資源或者公共數據。通過市場機制提供,非排他性,非私有性,我們通過三個原則界定。大家可以得出結論,我們國家設定這樣一些基本的制度理念,就是說直接間接利用政府財政撥款來完成的這些信息資源或者這些數據,或者說直接間接利用財政轉移支付資金實現的這些數據或者科研項目,或者直接間接利用國有資產收益完成的這些數據,只要跟公共財政跟國有資產有關,依賴這些資源基礎完成實現的數據資源我們覺得都應當面向社會進行開放和共享。為什么這樣設計?主要理由這樣設計能夠確保我們國家大數據的產業真正依據量級的速度和模式發展,確保大數據產業能夠在我們國家成為一個戰略性新興產業,確保我們這個產業為我們國家經濟發展貢獻巨大的力量。
另外,我們可以設計出一些原則,數據開放與共享的原則,比如說公共數據面前人人平等的原則,所有人對于公共數據都有權利,無論年齡、身份、地位都可以面向公共數據,都可以提出開放共享的要求。另外技術手段和技術措施必須具有開放性、兼容性和互操作性的原則,這是互聯網廣泛通行的原則,就是說我們盡量不要對公共數據開放與共享設定一些技術限制,或者設定一些技術障礙。
第三,設定一些公共數據開發共享的數量質量原則,確保數據是非結構化的、結構化的,確保數據是積極可讀肉眼可讀的數量和質量原則,這樣的話設計這些原則初衷也是考慮讓我們數據開放整個的初衷和目標落到實處。
我們試圖設定一些重要的內容,對于公共數據的概念,我們可以界定為是公共數據通常包括公共利益主要為內部使用不排除為公共利益收集存儲加工等等這些數據。對公共數據的所有人我們可以在我們國家界定下面這些單位,比如說行政機關、公務員管理的單位,他們單位有的依靠行政撥款,財政撥款從事一些科研工作,科研開發等等,他們所完成的成果應當納入我們整個數據開發共享的范疇。還有受托行使政府職能的其他組織,還有教育科研,教育科研是國家民族知識經濟發展一個最主要的一個基礎或者最主要的決定性因素,對于這些開放與共享是決定大數據發展真正的要點或者說是要件,所以我們應當參考美國的一些制度設計,把教育科研產生的教育項目和科研成果讓它最大化進行公開和共享,這對大數據產業發生作用最大,最能夠契合大數據戰略的初衷。行業組織其他社會團隊這些單位掌控的數據是不是應該開放與共享,在自然壟斷排他的國有企業他們從事經營型非經營型活動依靠國有資產收益完成的數據資源,是不是依據一定條件進行開放共享,這樣盡量把我們大數據的體量做到最大,只有做到最大我們才能具有優勢,才能和其他國家進行競爭,我們考量主要是這樣一個初衷一個基本的出發點。主要的制度設計制度內容,我們把數據范圍界定為如下品類,這是參照十二五電子政務規劃的一些分類。對公共數據要進行分類,我們可以基本上分為立法信息、基礎信息、宏觀調控信息、社會管理信息、公共管理信息、市政公共信息、對公共數據分類是公共數據開放與共享的挑戰點,在我們國家各行各業數據都要開放這個工作本身非常艱巨,開放數據開放共享行業所掌握的數據,對數據進行分類做一個目錄一個清單是這項工作開展的前提或者第一步。
另外就是說對于開放、共享、使用等等這些概念我們有初步的界定。比如說公開我們可以界定為許可特定或者不特定的人知悉一些公共的數據,就是要讓這些人知道這個數據這叫公開,就是確保公民或者企業它的知情權。開放只許可不特定的公眾獲取這個數據資源,確保公民這些企業被開放主體獲取權,公共數據的獲取權在我們國家不是作為基本權利被提出現在沒有確認,以后我們希望把公共數據獲取權配合大數據產業發展一塊確定是我們國家公民一項基本權利。還有一個共享,指特定不特定社會公眾擁有數據,共同擁有這個數據,共同要占有,這個在口徑上在開放的口徑上,或者說整個大數據產業相對公共數據利用而言開發利用口徑上要比開放公開更大,所以說能夠做到共享這是一項非常不容易的事情。我們需要指出美國政府開始做共享工作,美國政府從2012年5月份上線了一個公共數據政府數據共享網站,這個網站就是一個共享網站,這個網站是美國聯邦政府把各聯邦機關數據收集在一起,以數據集的形式通過一個網站面向美國公民開放共享的主要信息平臺,我們國家是不是走共享的這條道路,參照美國的模式,現在上海、廣州有一些地方政府考慮把地方政府數據通過共享網站的方式,向社會提供共享和開放。
另外就是使用,使用我們應該給出一個定義,基于開放共享,許可特定不特定開發利用使用。管理是凌駕開放、公開、共享、使用凌駕四者之上一項綜合的基礎工程。管理指公共數據資源占有人,為了實現公共數據的價值,圍繞開放共享、開發、利用展開的組織協調活動。基于管理我們尤其需要提出來數據信息不管是基于什么平臺,基于什么占有人而言都是有價值的資產。美國最早提出來要把數據當成資產進行管理,我們國家和在座企業代表咱們以后對數據資源是不是參照資產管理模式來進行管理。比如說建立清單,進行清單化的登記,做目錄,逐級進行申報,把它當做跟企業其他無形資產一樣保護和管理,這項工作也是非常重要。
我們設計一些適用于數據開放與共享的基本原則,大體上以不得收費為原則,應當說以收費為例外,考慮到公眾接受能力、承受能力一般情況下數據開放與共享盡量不要針對公眾進行收費。特殊情況下比如說線下方面進行共享開放可以考慮收費,但是以成本為原則,以產生的數據開放與共享為基礎收費。我們設計一些原則可能很多地方不適用,但是這是一種探索,探索目的配合我們產業發展,一起探討一些基本的制度出來,主要的目的就是配合大數據這個產業發展好,成長好,把它真正做成我們國家戰略性新興產業。
最后還需要指出來有一個矛盾,開放與共享可能與保護有矛盾,那么哪些應該保護?哪些應該開放與共享?涉及國家秘密不能開放共享,涉及個人信息不應當開放共享,開放共享應當以本人同意為原則,處理開放保護共享的關系也是我們將來面臨的比較艱巨的問題。這些我們產業需要考量,政府需要考量,行業自律組織,行業企業一塊考量共同面對的問題,我們把這些問題提出來主要是為了大家在一個平臺上把問題研究好,面向政府我們把建議提供好。我們主要內容就是這些,可能有很多錯誤,請大家批評指正。
(來源:CSDN)