天天看點

架構設計:分布式服務,庫表拆分模式詳解一、服務間隔離二、資料庫設計三、架構體系難點四、源代碼位址

一、服務間隔離

1、分布式結構

分布式系統架構的明顯特點,就是按照業務系統的功能,拆分成各種服務,每個服務下面都有自己獨立的資料庫,以此降低業務間的耦合度,隔離不同的資料庫保證系統最大的穩定性等。

架構設計:分布式服務,庫表拆分模式詳解一、服務間隔離二、資料庫設計三、架構體系難點四、源代碼位址

例如上圖是電商系統中經典的業務場景,訂單-倉儲-物流的服務模式,不同服務提供不同的應用場景,服務間存在通信機制,以此實作服務的高可用。

2、隔離思想

分布式的架構體系中,涉及一個根本思想邏輯:隔離;

服務和資料庫根據業務拆分,進而隔離開來,整個架構中某個服務挂掉,不會影響其他的服務繼續執行。例如上述1中:如果物流服務挂掉,影響的是使用者無法實時追蹤物流狀态,但是不會影響訂單的持續産生。

隔離的政策也是各有不同,常見的電商系統是典型的按照業務特點進行拆分,這種就是不同的業務場景下,使用不同的服務和資料庫;還有一種業務場景,多租戶平台,針對大客戶提供獨立的服務和資料庫,對小客戶提供公服務和資料庫,這種政策比較現實:大客戶帶來收益多,完全覆寫服務和資料庫的成本,必須保證不能被一些非必要因素影響。

不管是基于什麼政策拆分隔離,首先都必須面對資料庫設計的問題。

二、資料庫設計

1、拆分思想

資料庫在業務體系不大的情況,一般都是單庫出現,最多加一個備份庫以備不時之需,當業務體量不斷擴大,就會考慮拆分場景,例如常見的:水準拆分,垂直拆分政策。

水準拆分

首先把單表表分割N個結構相同的表,然後把資料按照政策分散到不同的表中,這是表層面;如果把表在分散在不同的資料庫中,這就是資料庫層面的水準拆分。

垂直拆分

把單表中資料按照不同特點,拆分成兩張不同的表,常見的政策是根據資料是修改多,還是讀取多,把修改頻繁的字段放一張表,讀取頻繁的放另一張表,這是表層面;如果根據業務特點,拆分不同庫,這就是資料庫層面。

2、拆分模式

讀寫分離

讀寫分離是資料庫拆分的最基本方式,實作起來難度也不大,隻需要根據讀寫庫的配置,把業務中資料寫操作路由到寫庫,資料讀操作路由到讀庫即可。

架構設計:分布式服務,庫表拆分模式詳解一、服務間隔離二、資料庫設計三、架構體系難點四、源代碼位址

這種方式實作的資料庫拆分雖然相對容易,如果出現主從複制挂掉的情況,就會導緻資料讀不到,或者資料讀取延時,是以在強一緻的要求的情況下,使用不多。

分庫分表

分庫分表主要用來解決單表資料量過大的問題,根據特定字段的路由規則,把資料分散到不同的庫,不同的表中。

架構設計:分布式服務,庫表拆分模式詳解一、服務間隔離二、資料庫設計三、架構體系難點四、源代碼位址

通常是基于一些唯一值的雜湊演算法實作的分庫分表政策。也有一些成熟的中間件可以內建到項目直接使用,這種模式更多适用于單點資料的查詢的場景,可以基于路由快速定位資料所在的庫表。

業務分庫

基于業務特點拆分資料庫,是目前分布式架構下,或者微服務模式的基礎用法,不同業務場景下資料放在一個庫,因為資料關聯性很強,在使用的時候友善,同時與其他業務資料隔離開來,避免單點故障導緻資料庫挂掉。

架構設計:分布式服務,庫表拆分模式詳解一、服務間隔離二、資料庫設計三、架構體系難點四、源代碼位址

這種模式雖然看起來更合理,但是複雜度也是非常的陡,因為兩種業務場景下的資料不可能絕對沒有關聯,比如訂單庫一定依賴使用者庫的資訊,這就需要訂單服務和使用者服務之間需要通信,引發的問題就會很多。

使用者分庫

在多租戶場景下,會根據客戶流水大小提供不相同的服務和資料庫,這是一個十分現實的政策,畢竟可能一個大客戶的月流水超過幾個小客戶的總和。

架構設計:分布式服務,庫表拆分模式詳解一、服務間隔離二、資料庫設計三、架構體系難點四、源代碼位址

既然可以根據客戶情況分庫,也可以基于其他政策,比如地區,常見雲服務的應用,選擇華南,華北,華東區之類的。

三、架構體系難點

這裡所提到的涉及問題,是指基于業務分庫模式下的出現的問題。

1、服務依賴

在分布式架構體系下,不同服務都有各自的資料庫,但是資料之間一定是有關系的,服務A要用服務C的資料庫,就必須通過服務C提供的接口來擷取,這是基本機制,不然拆分服務和庫就沒意義了,這樣就會導緻服務間産生依賴關系。

架構設計:分布式服務,庫表拆分模式詳解一、服務間隔離二、資料庫設計三、架構體系難點四、源代碼位址

如上圖,如果訂單服務和論壇服務同時依賴使用者服務,那麼就要考慮如果使用者服務挂掉,會影響多大的範圍,做好權衡,還有一個關鍵點,如果多個服務依賴一個服務,那麼就要保證被依賴的服務有足夠的能力應對,例如這裡,如果訂單服務有10W的流量,論壇服務有10W的流量,那麼就要保證部署上使用者服務起碼要能承受20W的流量。

2、分布式事務

既然資料庫在不同的服務下面,服務之間又存在依賴關系,那麼保證資料的事務一緻性就是非常大的難題。

這裡基于支付業務的轉賬場景做一個簡單的示範,從資料源1的賬戶表中,向資料源2的賬戶表中操作轉賬,盡管在代碼層面看添加了事務最進階别的控制,但是卻沒有起到控制作用,導緻出賬成功,但是入賬失敗,這就是典型的分布式事務問題。

@Service
public class AccountServiceImpl implements AccountService {

    @Resource
    private JdbcTemplate jdbcTemplateOne ;

    @Resource
    private JdbcTemplate jdbcTemplateTwo ;

    /**
     * @param fromUser 出賬 賬戶
     * @param toUser   入賬 賬戶
     * @param money    涉及 金額
     */
    @Transactional(isolation= Isolation.SERIALIZABLE)
    @Override
    public void transfer(String fromUser, String toUser, int money) {
        // fromUser 出賬
        jdbcTemplateOne.update(
                "UPDATE user_account SET money = money-? WHERE username= ?",
                    new Object[] {money, fromUser});
                    
        int i = 1/0 ;
        
        // toUser 入賬
        jdbcTemplateTwo.update(
                "UPDATE user_account SET money = money+? WHERE username= ?",
                    new Object[] {money, toUser});
    }
}           

這裡隻是先示範分布式事務的問題,如何解決分布式事務問題,需要很多的篇幅描述,後面的連續幾篇文章再細說。

四、源代碼位址

GitHub·位址
https://github.com/cicadasmile/data-manage-parent
GitEE·位址
https://gitee.com/cicadasmile/data-manage-parent