在容易獲取海量數據的時代,大(dà)數據分(fēn)析是幫助企業決策的重要工(gōng)具,但管理者的商(shāng)業洞察力和智慧仍是不可缺少的重要因素。
在對今年美國總統大(dà)選結果的各種預測中(zhōng),“義烏做旗子的預測美國大(dà)選結果”異軍突起,讓人們見識到了大(dà)數據的神奇力量。眼下(xià),在我(wǒ)(wǒ)們生(shēng)活周圍環繞着各種大(dà)數據,但很多人對大(dà)數據還是一(yī)知(zhī)半解。有人甚至覺得,大(dà)數據分(fēn)析是計算機系、統計系學生(shēng)才學的技術課程,商(shāng)學院的學生(shēng)如果學習大(dà)數據分(fēn)析,肯定不如他們做得好。事實真是這樣的嗎(ma)?
數據本身是中(zhōng)性的
如果手頭有海量的信用卡消費(fèi)數據,可以用來做什麽?通常的想法是,這些數據可以給消費(fèi)者的信用打分(fēn),判斷是否提高其信用額度。但你有沒有想過,可以用這些數據來炒股賺錢呢?
美國第一(yī)資(zī)本投資(zī)國際集團曾經發生(shēng)過這樣的事情:2名分(fēn)析師利用公司掌握的信用卡消費(fèi)數據分(fēn)析了至少170家上市零售公司的銷售情況,據此預測這些公司的銷售額。然後,他們在這些上市公司公布季度财務報表之前購入看漲期權或者看跌期權,進而獲取巨額利益。3年内,他們在股市上的投資(zī)收益率達到驚人的1800%。當然,這一(yī)做法是違法的,屬于利用内部信息進行交易,最終被美國證券交易委員(yuán)會逮住了。
有意思的是,美國證券交易委員(yuán)會識别違法交易也借助于此。他們用到的分(fēn)析方法有:超常收益識别,看投資(zī)人的投資(zī)收益率是否遠比采用類似投資(zī)策略的投資(zī)人的收益率高。鏈接分(fēn)析,從手機通話(huà)記錄中(zhōng)找一(yī)個個社交圈,看異常投資(zī)收益是否和社交圈裏的信息流動有關;還可以從交易記錄中(zhōng)找小(xiǎo)圈子,如買賣是不是在一(yī)個小(xiǎo)團夥裏面進行,合謀炒高股價。關聯分(fēn)析,通過交易行爲的相關性找出内幕交易合謀者或者人頭賬戶。行爲分(fēn)析,看投資(zī)人的交易行爲是否發生(shēng)異常變化,或者是否和投資(zī)經驗不符,如明明是菜鳥注冊的賬戶,操作行爲卻十分(fēn)老到,止盈止損風險控制什麽都懂,等等。
這些例子表明,大(dà)數據本身是中(zhōng)性的,關鍵在于如何使用。如果缺乏商(shāng)業洞察力,大(dà)數據可能就隻是一(yī)堆數字。
商(shāng)業洞察力是“藝”
如果說大(dà)數據分(fēn)析是藝術的話(huà),那麽數據分(fēn)析技術是“術”、商(shāng)業洞察力才是“藝”。好的商(shāng)業洞察力,能夠幫助企業超越大(dà)數據分(fēn)析的技術局限。
保險業是重度使用大(dà)數據的行業。但如果有人僞造信息并且故意制造車(chē)禍來騙保怎麽辦?可以通過增加數據并構建一(yī)個欺詐識别模型來應付,也可以采取人工(gōng)調查來識别,但都需要付出巨大(dà)成本。
德國有家初創企業通過商(shāng)業模式創新的方式,解決了這個大(dà)數據分(fēn)析難以解決的問題。在這個名爲P2P保險的商(shāng)業模式中(zhōng),投保人向親朋好友發出建立保險互助關系的邀請,一(yī)起交保費(fèi)并參與到保險互助網絡中(zhōng)。若保險産品到期時沒有出險,消費(fèi)者可以獲得最高40%的保費(fèi)返還。若出現小(xiǎo)額賠付,則由親友所繳保費(fèi)的資(zī)金池進行賠付。超出這個資(zī)金池的賠付,由企業承擔。
這個商(shāng)業模式解決了大(dà)數據分(fēn)析難以解決的防欺詐問題,原因在于親友之間互相了解,都不願意把自己和騙子綁在一(yī)起,所以騙子找不到親友和他一(yī)起投保。同時,保險欺詐不容易被保險公司發現,卻很容易被親友識破,且欺騙親友比欺騙保險公司的道德壓力更大(dà)。另外(wài),自己的小(xiǎo)額損失讓親友代爲承擔,通常比讓保險公司來服務更加令人感到尴尬,所以人們不會随便報損。
兩個常犯的錯誤
在應用數據挖掘結果過程中(zhōng),有兩個常犯的錯誤需要引起注意。
第一(yī),誤以爲相關性代表因果關系,實際上兩者不能等同。管理者應該根據數據挖掘結果繼續深挖因果關系,才能找到更有價值的商(shāng)業洞見。例如,發現來自移動端的用戶轉換率明顯比來自電腦端的高,就加大(dà)對移動端廣告投放(fàng),也許并不是唯一(yī)途徑。繼續深挖這個現象的因果關系,可能會發現來自移動端的用戶其實早就是公司的老客戶,本來就喜歡公司的産品,所以轉換率高。而來自電腦端的用戶基本是新客戶,因而在電腦端投放(fàng)廣告可能效果更好。因此,利用相關性來幫助商(shāng)業決策需要不時檢查。
第二,誤以爲基于數據的預測是平穩的。商(shāng)業發展往往不是連續的,尤其是在有颠覆性創新的情況下(xià)。例如,傳統出租車(chē)公司可以在一(yī)些平穩趨勢假設下(xià)預測客流量,從而決定應該購買多少新車(chē)。但當滴滴等網絡專車(chē)進場,以往的這些模型和預測就會通通失效。因此,不可過分(fēn)依賴曆史數據的分(fēn)析結果,尤其在戰略決策時,商(shāng)業洞察力起的作用更大(dà)。
總之,在容易獲取海量數據的時代,大(dà)數據分(fēn)析是幫助企業決策的重要工(gōng)具,但管理者的商(shāng)業洞察力和智慧仍是不可缺少的重要因素。 |