天天看點

袋鼠雲資料中台專欄2.0 | 企業資料化認知:資料就是生産力!

袋鼠雲資料中台專欄2.0 | 企業資料化認知:資料就是生産力!

關于袋鼠雲資料中台專欄V2.0

資料中台如何定義?企業資料化與資料中台的關系是什麼?資料中台如何支撐企業戰略轉型?

袋鼠雲近兩年來,先後為國内數十家大型龍頭企業提供資料中台咨詢與實施落地服務,積累了大量的實戰經驗,同時也在為客戶服務的過程中,不斷完善和升華自身的資料中台理論體系和實踐方法論。希望通過後續文章的分享,與諸位讀者交流,共同加快企業全面資料化程序。

本專欄每周更新1-2篇,敬請期待~

正文

一、

資料就是生産力。筆者兩年前在袋鼠雲做的國内某省一個交警項目上,面對着海量的車輛軌迹資料時,第一次感受到什麼是資料的力量。

該項目是一個非常典型的資料中台項目,主要資料資源有:省内機動車輛資料、駕駛員資料、交通違章資料、公安系統等相關資料。核心資料是通過攝像頭識别到的車輛軌迹資料,包含:車輛牌照資料、采集時間和采集地點資料,以及部分公路上擷取到的移動電子裝置資料。

袋鼠雲的團隊利用這些資料做了以下應用:

車碼合一算法

利用已掌握的移動裝置軌迹資料和車輛軌迹資料,來計算移動裝置和車輛的比對關系(由于這兩種資料由兩套裝置分别采集,資料擷取存在一個不确定的時間差,且每個采集點都是多車輛同時通過,是以無法直接判斷哪個移動裝置是在哪個具體車上)。

為了解決這個問題,該項目起初的算法采用「機率計算模式」,比對時間長,比對準确率低。袋鼠雲選擇采用了另一個邏輯比對方式,實作了一輛汽車經過兩三個檢測點,就能夠知道該車中的乘客所持移動裝置與車輛的比對關系,而且一旦比對成功,即為确定關系。

該算法目前已申請專利,詳情還可檢視專利

專利名:一種交通監控資料比對方法、系統及儲存設備

申請人:杭州玳數科技有限公司 

申請日:2017-09-22 

主分類号:G08G1/01(2006.01)I

通過該算法,最終我們可以清晰地了解到手機與車輛對應的實時詳細資訊,最後對手機與車輛的關聯關系進行彙總統計,為案件偵破提供資料支援。

黑車标簽

以前,非常有經驗的交警才可以很明顯地根據車輛軌迹資料,發現疑似黑車的車輛。如何将經驗轉化為通過統計學的方式進行黑車标記,我們團隊成功探索出了以下三種方式:

一種是「專家經驗算法」,預制專家模型,篩選黑車。

另一種是标定所有計程車,然後用計程車軌迹模型來建構「黑車軌迹模型」。

第三種是在第二種方法的基礎上,「利用确認的黑車結果,反向對模型進行再次優化」。幾種算法使用後,我們可以拿出該城市的詳細黑車名單。

運毒車輛模型

我們利用「專家模型」,在海量車輛軌迹中尋找和标定可疑車輛,并對車輛目前軌迹進行實時分析和判斷,将以往在高速上某一時間段内的逢車必查模式,變成了逢車必查和重點車輛預警結合模式,進而使得黑車篩選效率大幅提升。

當我們的團隊,在計算機螢幕和交警監控大屏後輔助公安幹警抓獲一個一個犯罪嫌疑人的時候,筆者感覺自己的團隊正在觸碰一個傳統業務中從未觸碰到的領域。全知和全能是用來描繪造物主的,雖然我們還離這個定位有着遙遠的距離,但已然真實地朝這個方面邁出了堅實的一步。

二、

資料是生産力。

筆者要講的另一個例子是「國内某知名電商平台」對顧客所做的「标簽體系」。這個也算是一個業内半公開的例子了吧,據說該企業對顧客的标簽在3000個以上,也有一個講法是該平台比你更了解你的老婆。

曾經有人認為電子商務是一個零和遊戲,隻是把傳統管道中的一部分錢搶奪了過來而已。

其實,電商充分地利用了其所掌握的大量客戶行為資料,精準描繪使用者畫像,然後通過精準的營銷方式極大激發了使用者的購物欲望(買買買),進而創造出更多的消費需求。據筆者不準确估算,該企業每年在資料上所投入的成本應當是以百億計(幾萬個節點的存儲, 15%以上的員工為資料相關人員)。商人是逐利的,可以想象這些投入所帶來的商業産出又有幾何。

資料是每個人最原始的一種欲望。如果資料真的極大豐富了,筆者也許會希望知道天空中某隻鳥兒何時發出過一聲鳴叫,遙遠的海邊是否又有一朵濺起的浪花,深邃的宇宙中某個不知名的星球上是不是在發生過一場空前的風暴。然而這些最原始的渴望在種種現實條件的限制之下被深深的隐藏了起來。

目前的時代,随着資訊化和網際網路化程序的完善,人們各種行為的上線讓我們有機會積累大量的資料,這給了我們一次小小的契機,可以利用大資料處理技術将這些源資料變成一種新的生産力,誰能夠優先地掌握和使用好這種力量,就必定會對企業整體能力帶來又一次的提升。

三、

資料是生産力,可以作用于企業的方方面面:

描繪事實

無論是描述“事”,還是描述“物”,用資料說話永遠都顯得更準确一些。即使遠隔千裡之外,隻要把主要經營名額顯示出來,那麼一個企業大體上的業務情況就能夠了解到,正所謂運籌帷幄之中,決勝千裡之外。

資料便是對客觀業務關鍵要素的一種提煉和抽象。好比醫生看患者,先不管高矮胖瘦,看病之前,做上一系列檢查,然後得到各項身體體征資料,對病人的整體情況也就有了一個基本的了解。

又好比筆者的團隊,目前有多少個項目,哪些賺錢,哪些不賺錢,每個項目都進展到了什麼程度,投入了多少人,花了多少錢,收了多少錢,還有多長時間做完,有沒有什麼風險等等,都是筆者要花很多時間每周都去梳理的。

然而:

在很多企業中即使是最基本的用資料描繪清楚業務,并在第一時間擷取到這些資料這個需求都往往得不到滿足。

洞悉細節

資料會比人更加精準和敏感,通過資料可以相對容易地發現事物之間的隐秘關系。筆者上面所提到的車碼合一算法就屬于這個範疇。

最簡單的關聯商品分析也可以在實際應用中取得巨大成果。拿筆者在袋鼠雲負責實施的一個項目舉例:在該客戶的線下零售門店中,我們在顧客完成商品購買時,利用管理「商品關聯分析」和「顧客消費偏好分析」的「綜合推薦結果」,在顧客購物發票下方列印一個實時的促銷發票,推薦一款或者幾款關聯商品并給予一定折扣。根據最後的統計,這個動作為平均為每個門店提升了八到十個點的營業額。

資料智能

相對基礎的算法就能夠解決企業中的很多問題,尤其是面對大規模生産和營運場景的時候,往往依靠人的經驗就會變得非常被動。基本的統籌算法還有最優效益的求解分析,會為日常工作很多的指導。線上資料的豐富和機器學習算法一方面讓以往很多場景形成完整的「資料閉環」,另一方面也可以借助衆多的資料進一步優化算法模型。當豐富的資料量和資料計算引擎都具備時,算法工程師會為企業創造很多意想不到的收獲和驚喜。

四、

資料是生産力,但有時候也會是一種桀骜的力,用得不好,不但浪費了企業投入的大量資本,更讓業務上的一系列配合動作無果而終,甚至傷到企業元氣,表現在以下幾個方面:

隻重視「資料應用」,不注重「資料擷取」和「資料品質治理」。

不能夠清晰地知道一個資料應用所對應的「資料供應鍊」,進而無法評估擷取最終資料的整體成本、過程與時間周期,很多應用對這個過程估計不足,最後無果而終。

過于關注大資料的故事,而忽視了很多基礎的業務統計工作。

資料化本身比較複雜,而且也非常綜合,不是一種力量就能夠解決的(是企業級戰略,而不是部門級工作)。

資料化缺乏整體架構和規劃,小需求難以驅動基礎平台建設(要集中力量辦大事,基礎平台問題要在企業整體層面統一解決)。

是以大部分的企業在這種力量面前,都顯得猶豫不定和裹步不前,很多“理智”的企業則是駐足觀望等待結果,隻有少數頭部客戶有勇氣和擔當做一個探索者和先行者,嘗試啟動企業全面資料化的轉型工作。

袋鼠雲從成立之初便伴随着數十個行業頭部客戶,一起進行企業全面資料化轉型建設。這個過程無疑是艱辛的,但也是收獲豐富的。後續的文章中,筆者會成體系的分享出來,與廣大讀者交流探讨。

下期預告

企業資料化的建設,更多的要依靠規劃和設計來驅動。

我們期望把這種規劃和設計變成一個可見的,可以使用的引擎用以驅動整個企業資料化建設。

筆者用一個比喻來形容整個過程。我們把資料比作最原始的食材,業務方比作食客,資料團隊是廚子,資料中台是廚房。

如何烹饪好“企業資料化建設”這盤菜,且看

袋鼠雲資料中台專欄V2.0第三期:企業資料化認知 — 資料化建設三範式

敬請期待!

本文作者

張旭 (花名:老虎)   

袋鼠雲解決方案與傳遞副總裁

原用友股份應用內建業務部總經理,主資料管理專家、業務創新帶頭人

曾主導數十家國内500強企業的數字化建設原型項目的規劃與落地

擁有十多年企業服務和項目管理實施經驗

關于袋鼠雲