天天看點

中繼資料是什麼?怎麼管?

中繼資料是什麼?怎麼管?

編 輯:彭文華

彭友萌好,今天老彭友小羊羊找到我,想要中繼資料管理相關的内容,說找遍了所有文章,都沒找到詳解中繼資料管理的内容。

中繼資料是什麼?怎麼管?

啊這...小羊羊彭友肯定是沒找全,因為我以前就專門寫過一篇“​​什麼是資料、中繼資料、主資料和參考資料?​​”,裡面對于中繼資料解釋得很詳細。

當時還留了一個自動回複,可以下載下傳很多相關資料,不過現在已經失效了。

中繼資料是什麼?怎麼管?

中繼資料怎麼管?

我敢打包票,小羊羊也沒加入到我的知識星球裡,否則的話也不會來問我,因為星球裡的内容。足夠解釋她所有的問題!

不過小羊羊來問了,我還是得一本正經地回答好,不能辜負了她的期望,也正好給大家分享分享。

中繼資料怎麼管?對于一個沒接觸過的人來說,簡直是一個噩夢。因為了解中繼資料已經很艱難了,更别說管理中繼資料。而且身在大廠的小羊羊,很有可能在做中繼資料管理系統。

在這個時候,最先要做的,其實要做三件事情:

1、徹底弄清楚什麼是中繼資料,什麼是中繼資料管理;

2、查清楚是否有相關标準,用專家的智慧當做指導,防止自己跑偏了;

3、找到業内樣例,作為對(chao)标(zuo)參(ye)考(de)

中繼資料是什麼?怎麼管?

我們今天就按照這個邏輯一一說清楚。

中繼資料是什麼?怎麼管?

什麼是中繼資料?什麼是中繼資料管理?​

鑒于我在之前用人話解釋過什麼是中繼資料,中繼資料的種類有哪些,這裡就不再贅述了,​​人話版點我​​。是以這次就引用一下權威:

中繼資料,就是“關于資料的資料”。

它描述了資料本身(例如,資料庫,資料元素,資料模型),資料表示的概念(例如,業務流程,應用程式系統,軟體代碼,技術基礎結構)以及資料和概念之間的連接配接(關系)。

中繼資料可幫助我們了解資料、系統和業務流程,有助于處理、維護、內建、保護、稽核和管理其他資料。

                                                                         --來自于:DMBOK-中繼資料管理

那中繼資料怎麼管理呢?管理肯定要先分類。中繼資料可以分為業務中繼資料、技術中繼資料和操作中繼資料。當然,還有一個有争議的管理中繼資料。權威說明在這裡哈:

中繼資料是什麼?怎麼管?

分類之後呢?那就簡單了,梳理目錄、ID、命名、屬性等内容,設計注冊、啟停用、版本等基礎功能,剩下的就是做增删改查了。

中繼資料是什麼?怎麼管?
中繼資料是什麼?怎麼管?

中繼資料管理标準

 不過,為了防止我們剛才想的不夠全面,還是得找一個标準參考一下。這邊都準備好了:

《GB_T 18391.1-2009 資訊技術 中繼資料注冊系統(MDR)》​

這裡面還給出了中繼資料注冊系統的總體模型,分為概念層和表示層,具體如下:

中繼資料是什麼?怎麼管?

簡單了解,就是我們需要在概念層(這個中繼資料是什麼?)闡述清楚,然後再寫清楚這個概念的具體值(這個中繼資料有什麼?),這才構成了一個完整的中繼資料。

舉個例子:

概念:長度計量機關

值域:千米、米、分米、厘米、毫米、微米、納米。

另外,一個中繼資料實體肯定還有其他的各種屬性,比如名稱、類型、精度、含義、版本、歸口機關、分類、狀态等等。

中繼資料是什麼?怎麼管?

在标準裡,中繼資料屬性都羅列了幾十個,我們在實際工作中用不到這麼多。

單是中繼資料生命周期的狀态,标準中就定義了首選、标準、合格、已記錄、候選、未完成、失效、被替代、曆史、應用這麼多。

在做系統的時候,我們隻需根據實際情況進行選擇即可。

中繼資料是什麼?怎麼管?

業内案例-快手中繼資料管理​

概念弄清楚了,标準也有了,接下來的任務就是參(chao)考(ta)一(zuo)下(ye)了。

我手上正好有一個行業案例《快手中繼資料平台化建設及應用場景》,你看看這寫的:多麼誘人啊?

中繼資料是什麼?怎麼管?

不要太爽了!我給你截圖自己看:

中繼資料是什麼?怎麼管?

從上圖可以看出,他們主要抽象出了實體、屬性和關系以及唯一ID四部分内容。

中繼資料是什麼?怎麼管?

快手把主資料分為四類:基礎、安全、資産和衍生中繼資料。

中繼資料是什麼?怎麼管?

他們直接從大資料元件、各個管理系統和資料平台中自動接入中繼資料,然後進行解析、同步,并轉換成标準定義,把基礎資訊存入關系型資料庫,把關系存到圖資料庫,并提供查詢和分析服務。

最後,還基于這些中繼資料做了一系列的資料應用,什麼資料地圖、名額模型管理、資産管理等。

中繼資料是什麼?怎麼管?

這裡還給出了幾個中繼資料應用的例子:

中繼資料是什麼?怎麼管?