天天看點

國産資料庫 | 拿到TiDB和OceanBase兩個認證後的一些思考

7月初,經過前期的持續的關注 + 一段集中時間學習,分别拿到了國産資料庫TiDB和OceanBase的兩個認證(如下),對國産資料庫的兩個拳頭産品有了進一步的了解。

TiDB的PCTA認證

國産資料庫 | 拿到TiDB和OceanBase兩個認證後的一些思考
國産資料庫 | 拿到TiDB和OceanBase兩個認證後的一些思考

OB的OBCA認證

國産資料庫 | 拿到TiDB和OceanBase兩個認證後的一些思考

至于為啥要了解和考試這款資料庫,原因很簡單:

  1. 為了公司數字化轉型,“降本增效”;
  2. 更深入的了解國産資料庫,做選型準備;
  3. TiDB和OB作為衆多國産資料庫中的拳頭産品,自然要了解一番;

今年在墨天輪上發了2篇有關國産資料庫發展現狀、趨勢和對比分析的推文,如下:

  1. 《2021年5月國産資料庫排行榜:“百舸争流”的各家國産資料庫,你應該如何選?》
  2. 《2020年國産資料庫“元年”,争做一隻迎風起飛的“飛豬”》

再之前寫的幾篇推文,連結如下,大家可點選如下連結參閱:

3. 【幹貨篇】在國内外資料庫百家争鳴的時代,DBA們該何去何從?

4. 年末總結_聊一聊資料庫行業的“繼往開來”

5. 認知篇】_認知國産資料庫大咖級新秀GaussDB

今天,還是想再聊一聊拿到TiDB和OceanBase兩個認證後,對國産資料庫的一些思考。

目前具有權威的國産資料庫排名榜是由墨天輪社群發起,該社群資料庫排行榜緻力于為大家呈現最新的國産資料庫排名、各家資料庫産品的動态發展趨勢和綜合競争力。

國内資料庫排名的兩個目的:

一是為了彌補DB_ENGINES中國産庫較少的尴尬處境;
二是為了供大家在國産資料庫選型中有所側重點。
           

今年初1月份寫文章時《2020年國産資料庫“元年”,争做一隻迎風起飛的“飛豬”》,墨天輪社群當時收錄了106種國産資料庫,類型涵蓋了關系型、寬列存儲性、鍵值性、時序性、雲原生性、分布式性共計6大類的資料庫類型。

到了2021年的5月份,墨天輪社群更新了 2021年5月國産資料庫排行榜,收錄共計131個國産資料庫參與排名,類型涵蓋了關系型、寬列存儲性、鍵值性、時序性、雲原生性、分布式性共計6大類的資料庫類型。對各家國産資料庫的介紹,大家可詳見文章《2021 :國産資料庫名錄和産品資訊一覽》。

國産資料庫 | 拿到TiDB和OceanBase兩個認證後的一些思考

在7月份的開頭,墨天輪已經更新了7月國産資料庫流行度排行榜(https://www.modb.pro/dbRank)。

截止目前,收錄參與國産資料庫排名的資料庫産品已達136個。類型涵蓋也有5月份的6種擴增為7月份的8種,覆寫了關系型、文檔、寬列存儲、鍵值、圖形、時序、雲原生、分布式性共計8大類的資料庫類型(見下圖)。關系型資料庫和非關系型資料庫占比分别是 64%  和 36%;關系型資料庫仍然占據主導地位。

國産資料庫 | 拿到TiDB和OceanBase兩個認證後的一些思考

由此可見,國産資料庫廠家開始注重自己的社群排名,更為用心的打造自己的産品品牌;

也反映了墨天輪社群的國産資料庫排名榜越來越受到國内企業的借鑒和認可。

這是好事。

依據各家資料庫的研發背景,簡單歸納下國産資料庫的種類。

國産資料庫可被分為4大派系:

1.學院派:基于學術研究,很早就涉及國産資料庫的技術研發,趕上時代紅利,這兩年也是開始重點發力,搶奪市場佔有率,代表有南大通用Gbase、武漢達夢DM、人大金倉kingbase
2.網際網路派:技術基本都是基于自身的業務壓力主動或者被動的研究/改進資料庫,特點很明顯:錢多,技術能力強,經過自身業務的驗證;在滿足自身業務需求的背景下,也想開疆擴土,争奪資料庫市場,加入到企業資料化轉型隊伍中,代表有騰訊雲TDSQL、阿裡OceanBase和polarDB;
3.創業派:創業派是一群技術大牛們,把握住了時代脈搏,從技術層面探究計算機三大基礎研究(作業系統、中間件、資料庫)中最難啃的資料庫技術,據說每個技術人員心中都有一個改變世界的夢想,都想對這個時間make a difference,是以技術人的情懷,代表有TiDB、SequoiaDB、HotDB、ArkDB、星環 KunDB、青雲 RadonDB;
4.企業派:個人看來,企業派的出發點和創業派類似,經曆和網際網路派類似;有錢+有情懷,實力和發展前景同樣不容小觑,代表有華為GaussDB和OpenGaussDB、中興通訊GoldenDB、亞信AntDB。
           

面對百舸争流的這麼多的國産資料庫,我們會很自然的提出兩個問題:

1.資料庫産品如何選型?

2.作為一枚DBA應該怎麼學?

第一個問題,之前的文章《2021年5月國産資料庫排行榜:“百舸争流”的各家國産資料庫,你應該如何選?》一文中已寫過,這裡再贅述下:

個人認為:

  1. 采用“增益思維”,以實用為主,化繁為簡(剃刀原則)、展望未來;
  2. 真正能滿足業務需求的資料庫産品和架構設計是一個最重要的選型指導原則。

    一句話:适合業務需求和發展的才是最好選擇。

    把問題再拆解下,如果把資料庫當成一個産品來看(make a company as a product)。

希望資料庫具有什麼樣的特性/标簽?

我們來給“鐘意”的資料庫産品标畫個像,先想象一下自己心中的資料庫應該是個什麼樣子,具有什麼特點:

1.開源、國産、雲原生
2.高可用性、強一緻性
3.MPP、HTAP、線性擴充
4.相容性高(主流sql标準92,2003)
5.技術和架構能夠持續疊代升
6.市場成熟度高
7.産品生态活躍
           

根據如上原則,再結合實際業務需求,相信大家在進行資料庫選型時心中就有了方向感。

接着回答第二個問題:作為一枚DBA應該怎麼辦?

如下的一些産品特性需要滿足,畢竟要先清晰知曉自己想要一個什麼樣的資料庫産品及周邊衍生。

1.資料庫産品是否穩定;					
2.支援高可用性;
3.支援強一緻性;                                				
4.支援水準擴充;
5.支援跨資料中心多活;											
6.充分的市場驗證;
7. 資料庫生态工具完善(備份恢複、遷移、更新、監控、報表);
8. 技術能力和團隊的培養(是否可以幫助企業成長),學習途徑友善、多樣性(社群、論壇、metaLink);
           

心中有了一杆秤,接下來就是發揮大家的動手能力了,多練手。正如前文所述的“增益思維”(行不行,先走兩步;考慮太多,則畏首畏尾)。

至于選哪個産品入手,怎麼練?

這裡有一些建議:

  1. 一通則萬通

    如果你時間充足,資料庫理論紮實,尤其精通Oracle,那麼你會很容易的上手國内的任何一款資料庫産品和架構;畢竟老大哥的市場占有率、産品穩定性、成熟的衍生生态在那裡;且國内的很多資料庫産品都在或多或少的參薦Oracle的架構設計和最新産品特性。

    這裡吹一下Oracle的彩虹屁(特性),你會發現很多國産資料庫也是有其特性影子。

    看一下Oracle新推出的自治資料庫版本19c提供了更多的自治能力和新功能。Oracle Database 19c新特性摘要如下:

    1. 自動索引(Auto-Indexing)自動化索引功能在幫助使用者簡化開發、運維的同時,資料庫性能最高可提升60%;

    2. 實時自動統計資訊收集在資料庫發生變化時,可自動收集統計資料供SQL優化器使用,極大減輕人工SQL調優壓力;

    3. Active Data Guard備庫DML重定向備端可做DML操作, 實作資料中心應用級雙活,簡化應用部署難度,同時最大化架構可用性和硬體使用率;

    4. 自動SQL隔離可将開發人員性能不好的SQL進行資源隔離,保障系統正常運作,提升資料庫可用性;

    5. 物聯網(IoT)流處理功能專為插入快速激增的IoT資料打造,讓IoT更易用、更好用。

    6. Oracle區塊鍊本地解決方案,幫助企業輕松搭建區塊鍊網絡。

    7. 20c提供了更多的自治能力,包括原生持久記憶體(PMEM)資料庫、自動機器學習、為安全交易而打造的原生區塊連結清單,以及性能更加強大的二進制JSON資料類型。

俗話說:欲得其中,先求其上;Oracle就是那個值得先行掌握的“上”。

Oracle的原理和操作熟練後,你會發現MySQL、PG、國産關系型資料庫等衆多關系型資料庫變得很容易掌握。

2. 重點突破某一單品

有些同學說,我剛開始入手學習國産資料庫,該怎麼搞?

建議重點突破,先深入了解某款國産資料庫産品。選型哪款國産資料庫産品,可以參考墨天輪社群國産資料庫排名(https://www.modb.pro/dbRank),不知道如何選時就選top10中的某一款:TiDB、OB、PolarDB、TDSQL、openGaussDB等任一款均可。

針對其設計原理、架構設計、解決了哪些問題、有什麼優缺點、動手搭建一遍、跑一跑性能測試、功能點測一測後,基本算是完成第一階段;即先深入了解一款國産資料庫産品後,據此再學習其他國産資料庫産品和衍生生态會容易很多,會發現一些通用的設計思路,隻是實作底層不同而已。

個人在之前的文章中分享過在技術分享中幾乎每次都會講到toB和toC的兩個觀點,簡述如下:

  1. toB 市場的認同成為國内資料庫成敗的關鍵

    産品隻有被市場所認可,得到各行業的驗證,尤其是金融、電信、交通運輸行業的認可和考驗;才能有更多的案例來幫助完善産品功能和性能,馬太效應才會出現良性導向。

  2. toC 注重極緻的使用者體驗才能讓國内資料庫升天更趨完善

    國産資料庫的真正使用者是具體到每一個的DBA,這些人對産品的使用體驗、學習途徑、發聲方式、使用者回報,直接映射了一個産品的熱點和讨論度。持續不斷的發聲、完善、提升學習者的使用體驗,才能把産品逐漸打磨完善;正如Oracle産品,雖然去O的聲音一直有,但官方的MOS、技術論壇确是各大國産資料在建構自己的生态鍊時應該學習和借鑒的。

欣慰的是:

toC的使用者體驗已經被國産資料庫供應商重視,從産品本身開源、官方文檔、到版本下載下傳、到技術教育訓練,都在重點發力,營造各自的産品生态圈,開始關注使用者粘性,這是很值得肯定和推薦的行為,屬于共赢範疇,互為得益。

這也是文章開頭,個人通過國産資料庫TiDB和OceanBase的兩個認證的原因,也促使開始研究兩個國産資料庫拳頭産品。

最後,祝願國内的各大資料庫産品供應商把握住時代脈搏,“善于在危機中育先機、于變局中開新局”。

文章結束。

以下是個人微信公衆号,歡迎關注:

國産資料庫 | 拿到TiDB和OceanBase兩個認證後的一些思考

繼續閱讀