![](https://img.laitimes.com/img/_0nNw4CM6IyYiwiM6ICdiwiI0gTMx81dsQWZ4lmZf1GLlpXazVmcvwFciV2dsQXYtJ3bm9CX9s2RkBnVHFmb1clWvB3MaVnRtp1XlBXe0xCMy81dvRWYoNHLwEzX5xCMx8FesU2cfdGLwMzX0xiRGZkRGZ0Xy9GbvNGLpZTY1EmMZVDUSFTU4VFRR9Fd4VGdsYTMfVmepNHLrJXYtJXZ0F2dvwVZnFWbp1zczV2YvJHctM3cv1Ce-cGcq5CO4cTM3ATN2cDOzMmYyUzYyYzXzITOyQTM2AzLcdDMyIDMy8CXn9Gbi9CXzV2Zh1WavwVbvNmLvR3YxUjLyM3Lc9CX6MHc0RHaiojIsJye.jpg)
編 輯:彭文華
彭友萌好,今天老彭友小羊羊找到我,想要中繼資料管理相關的内容,說找遍了所有文章,都沒找到詳解中繼資料管理的内容。
啊這...小羊羊彭友肯定是沒找全,因為我以前就專門寫過一篇“什麼是資料、中繼資料、主資料和參考資料?”,裡面對于中繼資料解釋得很詳細。
當時還留了一個自動回複,可以下載下傳很多相關資料,不過現在已經失效了。
中繼資料怎麼管?
我敢打包票,小羊羊也沒加入到我的知識星球裡,否則的話也不會來問我,因為星球裡的内容。足夠解釋她所有的問題!
不過小羊羊來問了,我還是得一本正經地回答好,不能辜負了她的期望,也正好給大家分享分享。
中繼資料怎麼管?對于一個沒接觸過的人來說,簡直是一個噩夢。因為了解中繼資料已經很艱難了,更别說管理中繼資料。而且身在大廠的小羊羊,很有可能在做中繼資料管理系統。
在這個時候,最先要做的,其實要做三件事情:
1、徹底弄清楚什麼是中繼資料,什麼是中繼資料管理;
2、查清楚是否有相關标準,用專家的智慧當做指導,防止自己跑偏了;
3、找到業内樣例,作為對(chao)标(zuo)參(ye)考(de)
我們今天就按照這個邏輯一一說清楚。
什麼是中繼資料?什麼是中繼資料管理?
鑒于我在之前用人話解釋過什麼是中繼資料,中繼資料的種類有哪些,這裡就不再贅述了,人話版點我。是以這次就引用一下權威:
中繼資料,就是“關于資料的資料”。
它描述了資料本身(例如,資料庫,資料元素,資料模型),資料表示的概念(例如,業務流程,應用程式系統,軟體代碼,技術基礎結構)以及資料和概念之間的連接配接(關系)。
中繼資料可幫助我們了解資料、系統和業務流程,有助于處理、維護、內建、保護、稽核和管理其他資料。
--來自于:DMBOK-中繼資料管理
那中繼資料怎麼管理呢?管理肯定要先分類。中繼資料可以分為業務中繼資料、技術中繼資料和操作中繼資料。當然,還有一個有争議的管理中繼資料。權威說明在這裡哈:
分類之後呢?那就簡單了,梳理目錄、ID、命名、屬性等内容,設計注冊、啟停用、版本等基礎功能,剩下的就是做增删改查了。
中繼資料管理标準
不過,為了防止我們剛才想的不夠全面,還是得找一個标準參考一下。這邊都準備好了:
《GB_T 18391.1-2009 資訊技術 中繼資料注冊系統(MDR)》
這裡面還給出了中繼資料注冊系統的總體模型,分為概念層和表示層,具體如下:
簡單了解,就是我們需要在概念層(這個中繼資料是什麼?)闡述清楚,然後再寫清楚這個概念的具體值(這個中繼資料有什麼?),這才構成了一個完整的中繼資料。
舉個例子:
概念:長度計量機關
值域:千米、米、分米、厘米、毫米、微米、納米。
另外,一個中繼資料實體肯定還有其他的各種屬性,比如名稱、類型、精度、含義、版本、歸口機關、分類、狀态等等。
在标準裡,中繼資料屬性都羅列了幾十個,我們在實際工作中用不到這麼多。
單是中繼資料生命周期的狀态,标準中就定義了首選、标準、合格、已記錄、候選、未完成、失效、被替代、曆史、應用這麼多。
在做系統的時候,我們隻需根據實際情況進行選擇即可。
業内案例-快手中繼資料管理
概念弄清楚了,标準也有了,接下來的任務就是參(chao)考(ta)一(zuo)下(ye)了。
我手上正好有一個行業案例《快手中繼資料平台化建設及應用場景》,你看看這寫的:多麼誘人啊?
不要太爽了!我給你截圖自己看:
從上圖可以看出,他們主要抽象出了實體、屬性和關系以及唯一ID四部分内容。
快手把主資料分為四類:基礎、安全、資産和衍生中繼資料。
他們直接從大資料元件、各個管理系統和資料平台中自動接入中繼資料,然後進行解析、同步,并轉換成标準定義,把基礎資訊存入關系型資料庫,把關系存到圖資料庫,并提供查詢和分析服務。
最後,還基于這些中繼資料做了一系列的資料應用,什麼資料地圖、名額模型管理、資産管理等。
這裡還給出了幾個中繼資料應用的例子: