












最新內容
http://www.86xian.com 發布日期:2013-12-09 中關村多媒體創意產業園 關注度:
http://www.bjmmedia.com.cn
“大數據”自誕生之日起,業界對它的概念、技術和應用就存在一定爭議。究竟什么是大數據?有哪些大數據技術?大數據的未來是怎樣的?每個人都有自己的理解。在2013大數據產品評選活動舉辦之際,筆者采訪了此次擔任評委的幾位專家學者,看看專家眼中的“大數據”是什么樣的?
何春濤,Inetsoft研發總監,從事商業智能產品的研發和應用工作十幾年,在高性能及大數據商業智能的相關領域工作了五年。其負責的研發團隊多次獲得國際獎項,包括JavaOne、JDJ Readers' Choice Awards等。他也參與了一些機構的商業智能系統的建設工作,包括麥考瑞銀行、世界衛生組織、AT&T等,在商業智能、高性能商業智能、大數據商業智能等領域具備豐富的實戰經驗。
大數據將演變成重要的企業資產
在何春濤看來,大數據的概念可以從以下兩個方面解釋:
1. 從技術的角度看,大數據是指數據量大且復雜到無法通過傳統數據庫技術進行治理和價值發掘。在這種需求下,各種NoSQL、NewSQL、開源技術或者商業平臺不斷出現并進化。
2. 從商業的角度來看,大數據將衍生出很多新的商業模式。其一、只要技術足夠,企業可以整合內部和外部大數據(例如社交數據、App數據),更好地優化自身業務,實現對傳統商業模式的超越。其二、只要技術足夠,企業將收集并治理那些不曾有能力收集并治理的大數據,再發掘出巨大的商業價值。大數據,將演變成重要的企業資產。
何春濤:大數據將成為重要的企業資產
最看好實時大數據技術
何春濤認為當前熱門的大數據技術主要包括以下內容:
1. 用于大數據存儲的Hadoop HDFS,以及衍生的數據庫HBase;
2. 批處理大數據項目有Hadoop MR,它最新版本是YARN.衍生項目有數據倉庫Hive和機器學習Mahout;
3. 實時處理大數據的項目有:Spark以及衍生的數據倉庫Shark,Cloudera Impala;
4. 用于流計算的項目有Apache Storm.
5. 商業大數據產品有一體機例如PureData、Exadata、Hana;MPP DW例如Vertica、Aster Data、GP;MPP DM例如 Yonghong DM.
他表示,未來比較看好實時大數據技術。因為,實時大數據技術能夠讓企業對大數據進行探索式和交互式分析,相比于之前沒有靈活性和動態性的批處理大數據技術而言,它將大大提升發掘大數據價值的效率和可能性。
商業大數據應與開源產品平分秋色
談到對大數據未來的擔憂,何春濤表示,國內大數據發展勢頭不錯,但以下三個方面仍需改進:
1. 商業大數據產品或者技術至少應該占1/2,而不應該逢大數據就聊開源。我們看到在美國很多大數據的商業公司越來越強大,例如Cloudera、Hortonworks、MapR、1010Data.但國內企業要么大數據搞不起來,要么技術比較強的就自己搗騰開源,這不利于資源整合,優勢互補。
2. 兩個極端。國內大數據項目是啞鈴型,要么上超貴的一體機,要么上開源的大數據項目。實際上,在上大數據項目的時候,可以選取性價比比較好的商業產品或者商業服務,而不要走兩個極端。
3. 目前的主流大數據產品和技術都在美國。作為21世紀最重要的國家之一,中國應該有自己的主流大數據產品和技術,而不僅僅是搬磚頭或者盲目跟從。希望能與各位同仁一起努力,在實時大數據領域做點工作。
(來源:IT168)