天天看點

資料中台如何建設,如何選型?

如果是資料中台或者大資料從0到1的組織,或者沒有太多落地經驗的組織,首先要考慮如何避免如下的坑:

資料中台如何建設,如何選型?

1.目标不明确、期望值過高、成本收益不清晰

家裡到底有多少資料?大資料能實作什麼樣的目标?投入大概有多少?

是不是上了大資料就可以看到财務名額的提升?

我見過總共幾個G的資料,買套BI就能解決還要花費幾百萬上大資料平台的案例,

也見過花費了幾百萬打造大資料平台隻産出了一張大屏的案例。

2.缺乏戰略規劃和持續投入

對大部分企業型組織來說,大資料往往是伴随數字化經營戰略進行規劃的,要跟企業戰略保持一緻。

資料團隊的建設包含團隊搭建、裝置采購、平台建設、預期百萬級至千萬級啟動資金,每年數百萬的持續投入,如果沒有長遠的規劃和持續的投入很容易就會陷入半途而廢的境地。

關于資料中台, 這個概念本身可能目前還有争論,我個人認為資料中台最核心的價值是把資料真正的納入到業務閉環當中,實作業務資料化+資料業務化,而不僅僅停留在資料看闆、分析報告上。

關于如何選型,建議參考下面的步驟:

先對自身的資訊系統、資料資源進行調研,對資料量、資料類型、資料價值進行分析。

從組織各個層面挖掘潛在的資料需求(營銷、預測、查詢、資料交換等),對經營名額體系和業務流程進行分析,考慮如何利用資料中台将資料融入到業務閉環當中。

案例分析,尋找同行業資料中台的實施案例,但是需要仔細鑒别宣傳中給出的各種數字,結合自身的業務判斷是否符合自身的要求。

路徑選擇,自研還是采購,開源還是商用産品,私有部署還是公有雲,如果考慮最低成本的,可以全部采用開源解決方案進行組合,比如

資料中台架構裡面包括資料采集、資料存儲、資料計算、資料治理、資料服務五大部分,前三個大家都差不多,更多的是技術名額,最值得關注的是資料治理和資料服務兩部分:

1)資料治理主要包括資料标準、資料品質和資料安全三部分,這三部分功能各家廠商的産品設計各有差異。也有一些針對行業特殊的設計,特别是資料标準,有些行業經驗比較豐富的廠商通常會提供相應的經過實踐檢驗的模闆。

2)資料服務主要包括資料目錄、标簽工廠、資料分析、資料服務接口、算法模型等,各家廠商的支援程度以及設計差異也較大,有一些産品會内置一些針對行業的一些功能。

産品實施,一般采購産品的話會配套一個實施的項目,會把一些基礎的數倉規劃設計、資料采集、資料标準實作出來,并結合産品完成一套符合客戶的資料開發流程、資料開發規範、資料運維規範。