天天看點

如何了解SaaS多租戶的設計?

作者:人人都是産品經理
多租戶技術簡稱SaaS,是一種軟體架構技術,是實作如何在多使用者環境下共用相同的系統或程式元件,并且可確定各使用者間資料的隔離性。本文對SaaS的多租戶設計進行了分析闡述,一起來看一下吧。
如何了解SaaS多租戶的設計?

多租戶定義:多租戶技術或稱多重租賃技術,簡稱SaaS,是一種軟體架構技術,是實作如何在多使用者環境下(此處的多使用者一般是面向企業使用者)共用相同的系統或程式元件,并且可確定各使用者間資料的隔離性。

簡單講:在一台伺服器上運作單個應用執行個體,它為多個租戶(客戶)提供服務。

從定義中我們可以了解:多租戶是一種架構,目的是為了讓多使用者環境下使用同一套程式,且保證使用者間資料隔離。那麼重點就很淺顯易懂了,多租戶的重點就是同一套程式下實作多使用者資料的隔離。對于實作方式,我們下面會讨論到。

在了解詳細一點:在一個多租戶的結構下,應用都是運作在同樣的或者是一組伺服器下,這種結構被稱為“單執行個體”架構(Single Instance),單執行個體多租戶。

多個租戶的資料是儲存在相同位置,依靠對資料庫分區來實作隔離操作。既然使用者都在運作相同的應用執行個體,服務運作在服務供應商的伺服器上,使用者無法去進行定制化的操作,是以這對于對該産品有特殊需要定制化的客戶就無法适用,是以多租戶适合通用類需求的客戶。那麼缺點來了,多租戶下無法實作使用者的定制化操作。

在翻閱多租戶的資料時,還有一個名詞與之相對應,那就是單租戶SaaS架構(也被稱作多執行個體架構(Multiple Instance))。單租戶架構與多租戶的差別在于,單租戶是為每個客戶單獨建立各自的軟體應用和支撐環境。單租戶SaaS被廣泛引用在客戶需要支援定制化的應用場合,而這種定制或者是因為地域,抑或是他們需要更高的安全控制。

通過單租戶的模式,每個客戶都有一份分别放在獨立的伺服器上的資料庫和作業系統,或者使用強的安全措施進行隔離的虛拟網絡環境中。因為本篇主要是讨論多租戶,是以單租戶的相關知識就簡單了解一下,不做過多的闡述了。

一、多租戶資料隔離的三種方案

在當下雲計算時代,多租戶技術在共用的資料中心以單一系統架構與服務提供多數用戶端相同甚至可定制化的服務,并且仍可以保障客戶的資料隔離。目前各種各樣的雲計算服務就是這類技術範疇,例如阿裡雲資料庫服務(RDS)、阿裡雲伺服器等等。

多租戶在資料存儲上存在三種主要的方案,分别是:

1. 獨立資料庫

這是第一種方案,即一個租戶一個資料庫,這種方案的使用者資料隔離級别最高,安全性最好,但成本較高。

  • 優點:為不同的租戶提供獨立的資料庫,有助于簡化資料模型的擴充設計,滿足不同租戶的獨特需求;如果出現故障,恢複資料比較簡單。
  • 缺點: 增多了資料庫的安裝數量,随之帶來維護成本和購置成本的增加。

這種方案與傳統的一個客戶、一套資料、一套部署類似,差别隻在于軟體統一部署在營運商那裡。如果面對的是銀行、醫院等需要非常高資料隔離級别的租戶,可以選擇這種模式,提高租用的定價。如果定價較低,産品走低價路線,這種方案一般對營運商來說是無法承受的。

2. 共享資料庫,獨立 Schema

這是第二種方案,即多個或所有租戶共享Database,但是每個租戶一個Schema(也可叫做一個user)。底層庫比如是:DB2、ORACLE等,一個資料庫下可以有多個SCHEMA。

  • 優點: 為安全性要求較高的租戶提供了一定程度的邏輯資料隔離,并不是完全隔離;每個資料庫可支援更多的租戶數量。
  • 缺點: 如果出現故障,資料恢複比較困難,因為恢複資料庫将牽涉到其他租戶的資料; 如果需要跨租戶統計資料,存在一定困難。

3. 共享資料庫,共享 Schema,共享資料表

這是第三種方案,即租戶共享同一個Database、同一個Schema,但在表中增加TenantID多租戶的資料字段。這是共享程度最高、隔離級别最低的模式。

即每插入一條資料時都需要有一個客戶的辨別。這樣才能在同一張表中區分出不同客戶的資料。

  • 優點:三種方案比較,第三種方案的維護和購置成本最低,允許每個資料庫支援的租戶數量最多。
  • 缺點: 隔離級别最低,安全性最低,需要在設計開發時加大對安全的開發量; 資料備份和恢複最困難,需要逐表逐條備份和還原。如果希望以最少的伺服器為最多的租戶提供服務,并且租戶接受犧牲隔離級别換取降低成本,這種方案最适合。

在SaaS實施過程中,有一個顯著的考量點,就是如何對應用資料進行設計,以支援多租戶,而這種設計的思路,是要在資料的共享、安全隔離和性能間取得平衡。

二、選擇合理的實作模式

衡量三種模式主要考慮的因素是隔離還是共享。

1)成本角度因素

隔離性越好,設計和實作的難度和成本越高,初始成本越高。共享性越好,同一營運成本下支援的使用者越多,營運成本越低。

2)安全因素

要考慮業務和客戶的安全方面的要求。安全性要求越高,越要傾向于隔離。

3)從租戶數量上考慮

主要考慮下面一些因素:

系統要支援多少租戶?上百?上千還是上萬?可能的租戶越多,越傾向于共享。

平均每個租戶要存儲資料需要的空間大小。存貯的資料越多,越傾向于隔離。

每個租戶的同時通路系統的最終使用者數量。需要支援的越多,越傾向于隔離。

是否想針對每一租戶提供附加的服務,例如資料的備份和恢複等。這方面的需求越多, 越傾向于隔離。

4)技術儲備

共享性越高,對技術的要求越高。

三、團隊開發架構實戰—多租戶支援

多租戶技術的實作重點,在于不同租戶間應用程式環境的隔離(application context isolation)以及資料的隔離(data isolation),以維持不同租戶間應用程式不會互相幹擾,同時資料的保密性也夠強。

多租戶資料庫構架方式主要分為:獨立資料庫(私有表)、共享資料庫隔離資料架構(擴充表)、共享資料庫共享資料架構(通用表)。

以上架構模式中,資料隔離程度相對較差,資料共享程度越高,越能夠支援較多的租戶,同時裝置成本越低,但同時資料維護難度越大。如敏感資料較多,則選擇共享資料庫隔離資料架構,否則可選擇共享資料庫共享資料架構的方式進行資料存儲構架。

本項目系統可能出現數量較多的租戶,同時裝置有限,是以選取共享資料庫共享資料架構(通用表)的資料存儲結構。

資料表結構采用名稱值對的方式進行設計:将擴充資料的儲存和原資料表分離,另外用一個統一的擴充資料表來儲存。擴充資料表将資料表的橫向擴充列轉換為縱向的資料集,将每一條原始資料記錄的一個擴充字段,都儲存成一條擴充資料行。将資料表中的資料記錄與配置中繼資料表中的配置記錄關聯,構成擴充資料記錄。可以提供無限數量的自定義擴充字段。但是其增加資料操作的複雜性,查詢時也要多次通路資料庫才能得到完整的業務資料。

多通用表與鍵值對的資料存儲架構存儲工作過程,上層應用通過标準多租戶資料定義、存儲API 進行互動,通過标準的API 接口将多租戶資料存儲到資料空中;也可以通過查詢的方式來從統一存儲的資料庫中還原租戶的資料。

在圖中,多租戶資料管理系統主要進行的資料操作是開發視圖下進行的,主要操作有對租戶資料模型的定義和擴充、租戶資料的持久化存儲和查詢讀取。

在對租戶資料模型的定義和擴充過程中,需要将租戶的資訊提取出來單獨存儲;對租戶所定義的資料表包含的資料表名稱、資料表中列名稱、列值的類型、列值的資料長度、資料表與其他表中的關系等中繼資料提取出來進行管理。租戶資料的持久化存儲和查詢讀取操作,先對租戶的身份進行驗證,防止租戶對其他租戶資料進行操作。

通過實體SQL 語句生成子產品将租戶資料查詢操作的邏輯SQL 與轉化成能夠直接在邏輯存儲層執行的SQL 語句。

  • 租戶資料模型定義部件描述了租戶的定制資訊。這種定制資訊描述了租戶定制的資料表的名稱、資料類型、限制關系等。
  • 邏輯SQL,是由租戶發起的資料查詢查詢請求。在資料管理分層模型中,開發視圖下,屏蔽了租戶無關的資料特性。租戶可以通過相關的接口進行資料查詢,是以邏輯SQL 與标準SQL 沒有差別。
  • 實體SQL是用于實際查詢資料的SQL語句,它工作在邏輯存儲視圖層。實體SQL 是将邏輯SQL 語句邏輯資料表結構轉換成底層資料的實體資料表結構所形成的能夠在底層資料庫中執行的SQL 語句。
  • 查詢重寫器的功能是将邏輯SQL 語句進行重新構造将其轉換為能夠在通用表上執行的實體SQL 語句。查詢重寫器擷取租戶發出的查詢請求,從資料庫中擷取租戶資訊,根據租戶查詢的資料表對應的中繼資料資訊,将租戶的查詢請求,轉換成為邏輯存儲層面上,資料庫系統能夠執行的查詢語句。
  • 租戶管理子產品的功能是将租戶的資訊、租戶所擁有的資料表資訊進行存儲和查詢,提供給資料管理系統中其他子產品擷取租戶資料的能力。
  • 租戶身份驗證主要是針對某一租戶的資料進行正确的存儲,正确地映射到資料庫系統中;當租戶對資料進行查詢時,能夠根據租戶資訊正确地查找到租戶所需的資料,并在查詢過程中不對其他租戶資料産生影響。

當租戶進行資料模式定制時,租戶資料模式定制器擷取租戶所需定制的資料模式,并定制請求中分析出租戶對資料模型定制資訊,并将這些資訊寫入到中繼資料表中中繼資料表和,完成租戶資料模式的定制。

當租戶中使用者發起資料查詢請求時,查詢重寫部件查找使用者資料庫,擷取該使用者所對應的租戶身份辨別,根據查詢請求中的資料表模式資訊,從中繼資料表中查詢出相應的中繼資料資訊,将租戶中使用者發起的資料查詢請求進行重寫。

重寫過程如下,根據邏輯SQL 語句,從中提取出查詢關鍵字,需要查詢的邏輯資料表、資料列等資訊,根據這些資訊從中繼資料表中查找出相應的邏輯存儲表資訊,将實際存儲的資訊替換邏輯SQL 語句中的資訊,完成重寫。

通用表存儲模式下,當租戶發起業務資料模式建立時,邏輯資料管理提出租戶資訊,其中包含了租戶建立的資料表的列數及各列的描述,根據建立的指令,生成邏輯SQL 語句,送出到SQL 重寫器,SQL 重寫從邏輯SQL 語句中抽取出中繼資料,資料表中繼資料,字段表中繼資料,關系表中繼資料,并根據SQL 重寫算法,逐一生成實體SQL 語句,交予資料庫執行,序列圖如下所示。

當租戶查詢資料時,SQL 查詢重寫器捕捉到租戶查詢的邏輯SQL 語句,通路控制管理從邏輯SQL 語句中感覺租戶身份,并根據租戶的權限,驗證資料查詢是否超出租戶權限,若超出則傳回,并給出超出權限提示。

通過驗證則将邏輯查詢請求發送給SQL 重寫器,重寫器從邏輯SQL 語句中抽取出查詢字段,租戶虛拟表,查詢條件。根據租戶虛拟表從中繼資料中查詢出對應的中繼資料,查詢重寫器根據中繼資料,将邏輯SQL 語句轉化為實體SQL 語句,并在資料庫中查詢執行。

本文由@劉同學 原創釋出于人人都是産品經理,未經許可,禁止轉載

題圖來自Unsplash,基于CC0協定

該文觀點僅代表作者本人,人人都是産品經理平台僅提供資訊存儲空間服務。

繼續閱讀