在這個大數(shù)據(jù)已經(jīng)成為市場一個美味的“大蛋糕”的今日,大多數(shù)企業(yè)都很想要分得一塊。大多數(shù)企業(yè)正做好了布局大數(shù)據(jù)的準(zhǔn)備,那么,該怎么做才能成功去布局?
最近,電子科技大學(xué)教授,云基地大數(shù)據(jù)實驗室合伙人周濤在接受采訪時提出,對于普通企業(yè)要通過修煉成為大數(shù)據(jù)企業(yè),關(guān)鍵要做好7個步驟:
1.要實現(xiàn)數(shù)據(jù)化。企業(yè)要為此做好計劃,到底需要保存什么樣的數(shù)據(jù),以人為中心的數(shù)據(jù)還是以產(chǎn)品為中心,還是更關(guān)注企業(yè)運營,需要做好這樣的計劃,然后再將企業(yè)生產(chǎn)經(jīng)營中的數(shù)據(jù)保存下來,即便是現(xiàn)在看來沒什么用的數(shù)據(jù),未來也可能產(chǎn)生巨大的價值。比如說像售樓處、體驗店客戶的來訪數(shù)據(jù),就有必要完整的記錄下來。包括怎么過來的,一個人來還是幾個人,有老人和小孩嗎,穿什么樣的衣服等等,還有客戶的情緒,看了什么,問了什么問題,最后買了什么東西,都是非常重要的數(shù)據(jù)。
另外,企業(yè)內(nèi)部人力資源的各個方面也都可以記錄下來,這些可以進(jìn)行挖掘和分析的數(shù)據(jù)。他舉例說,長虹公司在自己的生產(chǎn)線設(shè)置了很多傳感器,監(jiān)測溫度、濕度、震動、噪音、顆粒等等因素,希望了解到生產(chǎn)過程中哪些因素會對員工產(chǎn)生明顯影響。他們此前都認(rèn)為溫度和顆??赡軐τ趩T工操作和產(chǎn)品質(zhì)量影響最大,但是事實上最終數(shù)據(jù)分析的結(jié)果,溫度是沒有什么影響的,恒溫的控制對于生產(chǎn)效率和合格率的貢獻(xiàn)并不像想象中那么大,反而是噪音對于員工情緒以及生產(chǎn)的影響非常重要。要成為大數(shù)據(jù)企業(yè),第一步企必須要實現(xiàn)數(shù)據(jù)化。
2.企業(yè)要自己培養(yǎng)一些大數(shù)據(jù)理念,或者是小數(shù)據(jù)挖掘的團(tuán)隊。做大數(shù)據(jù),企業(yè)的規(guī)模不一樣,要求也不一樣。如果企業(yè)規(guī)模足夠大,比如說是電信運營商或者電力、銀行這樣的行業(yè),可能會形成一個大數(shù)據(jù)的團(tuán)隊。如果不是,比如說就是簡單的服務(wù)企業(yè),那么形成理念就可以了。現(xiàn)在我們認(rèn)為比較好的數(shù)據(jù)科學(xué)家,也不是說就是特別擅長或適應(yīng)網(wǎng)絡(luò),這樣的人不重要了,重要的是要有武器,什么樣的問題來了知道怎么解決。
關(guān)鍵我們認(rèn)識是要培養(yǎng)四種理念:
(1)除了結(jié)構(gòu)化數(shù)據(jù)以外還有文本、音頻、圖像、遙感、網(wǎng)絡(luò)、行為軌跡、時間數(shù)據(jù),這些數(shù)據(jù)怎么處理,它存在的大挑戰(zhàn)是什么。 (2)一定要懂預(yù)測,因為絕大部分的大數(shù)據(jù)應(yīng)用回到預(yù)測中,預(yù)測里面很多方法都是基準(zhǔn)學(xué)習(xí)的,而基準(zhǔn)學(xué)習(xí)目前最火的方向是集群學(xué)習(xí)。 (3)要走分布式存儲計算,這絕對不是說我知道給Hadoop 、Mapreduce、Hbase就夠了,關(guān)鍵問題是首先要知道怎么樣去搭一個混合式的,你的數(shù)據(jù)來了,我到底是應(yīng)該犧牲我的一致性還是犧牲操作性,大概的成本多少,哪些數(shù)據(jù)挖掘的重要算法我要把他Hadoop、Mapreduce實現(xiàn),哪些算法要通過SPTA,可變邏輯治理是在硬件里面,從而替代CPU、GPU。 (4)需要整個數(shù)據(jù)向外的發(fā)展,知道哪些數(shù)據(jù)可能在外部產(chǎn)生什么樣的重要價值,或者外部的數(shù)據(jù)能夠在你的企業(yè)產(chǎn)生什么樣的重要價值。企業(yè)應(yīng)該培養(yǎng)出這四個能力,建立起企業(yè)數(shù)據(jù)挖掘的人才團(tuán)隊。
3.企業(yè)一定要做好自己的外部數(shù)據(jù)儲備。我們都說“書到用時方恨少”,很多的企業(yè),比如說像服裝銷售這樣的傳統(tǒng)行業(yè),我要進(jìn)的貨在淘寶、天貓上賣的怎么樣?在淘寶、天貓哪一個店鋪怎么樣?它的競爭品牌是什么樣售價,怎么樣銷售的?對于這樣一些數(shù)據(jù),如果到需要的時候才去找,往往都來不及了。同樣的道理。比如銀行給中小企業(yè)發(fā)放貸款的時候,站群服務(wù)器,希望了解到它的用水、用電、生產(chǎn)、交通數(shù)據(jù),例如通過攝像頭就能知道這個企業(yè)到底有多少車運行,這些數(shù)據(jù)可能對于中小企業(yè)發(fā)放貸款決策都很重要。但是當(dāng)你要發(fā)貸款的時候,再去問已經(jīng)沒有機會了,或者說成本太高了。我們建議,企業(yè)應(yīng)該學(xué)會通過公共渠道或者數(shù)據(jù)交換的方法,根據(jù)自己的業(yè)務(wù)需求來量身定做自己的外部數(shù)據(jù)和戰(zhàn)略數(shù)據(jù)。
4.企業(yè)要建設(shè)自己的大數(shù)據(jù)管理與應(yīng)用平臺。對于很多企業(yè),做大數(shù)據(jù)并不是意味著要自己去建設(shè)數(shù)據(jù)中心。隨著云計算和云數(shù)據(jù)中心出現(xiàn),使用外部數(shù)據(jù)中心的成本已經(jīng)非常低了,數(shù)據(jù)存儲的費用也是在成倍的下降。但是,美國服務(wù)器租用,企業(yè)要做大數(shù)據(jù),必須要在IT基礎(chǔ)設(shè)施方面具有比較好的數(shù)據(jù)處架構(gòu),要用大一些工具比如數(shù)據(jù)分布式存儲、Hadoop等等。很關(guān)鍵的企業(yè)不僅要具備一個數(shù)據(jù)中心的硬件,還要考慮和企業(yè)業(yè)務(wù)方向結(jié)合,不僅就是包括了數(shù)據(jù)的采集、數(shù)據(jù)庫架構(gòu),向上的分析模塊,再往上的API數(shù)據(jù)出口,以及橫向的一些業(yè)務(wù)模塊和出口這些東西。要做成企業(yè)的大數(shù)據(jù)管理應(yīng)用平臺,我們強調(diào)一定要從企業(yè)的業(yè)務(wù)出發(fā),量體裁衣,企業(yè)首先必須要搞清楚自己的業(yè)務(wù)形態(tài)是什么。








