優化一覽圖
優化
筆者将優化分為了兩大類:軟優化和硬優化。軟優化一般是操作資料庫即可;而硬優化則是操作伺服器硬體及參數設定。
1、軟優化
1)查詢語句優化
首先我們可以用explain或describe(簡寫:desc)指令分析一條查詢語句的執行資訊。
例:
顯示:
其中會顯示索引和查詢資料讀取資料條數等資訊。
2)優化子查詢
在mysql中,盡量使用join來代替子查詢。因為子查詢需要嵌套查詢,嵌套查詢時會建立一張臨時表,臨時表的建立和删除都會有較大的系統開銷,而連接配接查詢不會建立臨時表,是以效率比嵌套子查詢高。
3)使用索引
索引是提高資料庫查詢速度最重要的方法之一,使用索引的三大注意事項包括:
like關鍵字比對'%'開頭的字元串,不會使用索引;
or關鍵字的兩個字段必須都是用了索引,該查詢才會使用索引;
使用多列索引必須滿足最左比對。
4)分解表
對于字段較多的表,如果某些字段使用頻率較低,此時應當将其分離出來進而形成新的表。
5)中間表
對于将大量連接配接查詢的表可以建立中間表,進而減少在查詢時造成的連接配接耗時。
6)增加備援字段
類似于建立中間表,增加備援也是為了減少連接配接查詢。
7)分析表、檢查表、優化表
分析表主要是分析表中關鍵字的分布;檢查表主要是檢查表中是否存在錯誤;優化表主要是消除删除或更新造成的表空間浪費。
分析表: 使用 analyze 關鍵字,如analyze table user
op: 表示執行的操作;
msg_type: 資訊類型,有status、info、note、warning、error;
msg_text: 顯示資訊。
檢查表: 使用 check關鍵字,如check table user [option]。 option 隻對myisam有效。共五個參數值:
quick: 不掃描行,不檢查錯誤的連接配接;
fast: 隻檢查沒有正确關閉的表;
changed: 隻檢查上次檢查後被更改的表和沒被正确關閉的表;
medium: 掃描行,以驗證被删除的連接配接是有效的,也可以計算各行關鍵字校驗和;
extended: 最全面的的檢查,對每行關鍵字全面查找。
優化表: 使用optimize關鍵字,如optimize [local|no_write_to_binlog] table user;
local|no_write_to_binlog都是表示不寫入日志,優化表隻對varchar、blob和text有效,通過optimize table語句可以消除檔案碎片,在執行過程中會加上隻讀鎖。
2、硬優化
1)硬體三件套
配置多核心和頻率高的cpu,多核心可以執行多個線程;
配置大記憶體,提高記憶體,即可提高緩存區容量,是以能減少磁盤i/o時間,進而提高響應速度;
配置高速磁盤或合理分布磁盤:高速磁盤提高i/o,分布磁盤能提高并行操作的能力。
2)優化資料庫參數
優化資料庫參數可以提高資源使用率,進而提高mysql伺服器性能。mysql服務的配置參數都在my.cnf或my.ini,下面列出性能影響較大的幾個參數:
key_buffer_size: 索引緩沖區大小;
table_cache: 能同時打開表的個數;
query_cache_size和query_cache_type: 前者是查詢緩沖區大小,後者是前面參數的開關,0表示不使用緩沖區,1表示使用緩沖區,但可以在查詢中使用sql_no_cache表示不要使用緩沖區,2表示在查詢中明确指出使用緩沖區才用緩沖區,即sql_cache;
sort_buffer_size: 排序緩沖區。
3)分庫分表
因為資料庫壓力過大,首先一個問題就是高峰期系統性能可能會降低,因為資料庫負載過高對性能會有影響。
另外一個,壓力過大把你的資料庫給搞挂了怎麼辦?
是以此時你必須得對系統做分庫分表+讀寫分離,也就是把一個庫拆分為多個庫,部署在多個資料庫服務上,這時作為主庫承載寫入請求。然後每個主庫都挂載至少一個從庫,由從庫來承載讀請求。
4)緩存叢集
如果使用者量越來越大,此時你可以不停的加機器,比如說系統層面不停加機器,就可以承載更高的并發請求。
然後資料庫層面如果寫入并發越來越高,就擴容加資料庫伺服器,通過分庫分表是可以支援擴容機器的,如果資料庫層面的讀并發越來越高,就擴容加更多的從庫。
但是這裡有一個很大的問題:
資料庫其實本身不是用來承載高并發請求的,是以通常來說,資料庫單機每秒承載的并發就在幾千的數量級,而且資料庫使用的機器都是比較高配置,比較昂貴的機器,成本很高。
如果你就是簡單的不停的加機器,其實是不對的。
是以在高并發架構裡通常都有緩存這個環節,緩存系統的設計就是為了承載高并發而生。單機承載的并發量都在每秒幾萬,甚至每秒數十萬,對高并發的承載能力比資料庫系統要高出一到兩個數量級。
你完全可以根據系統的業務特性,對那種寫少讀多的請求,引入緩存叢集。
具體來說,就是在寫資料庫的時候同時寫一份資料到緩存叢集裡,然後用緩存叢集來承載大部分的讀請求。這樣的話,通過緩存叢集,就可以用更少的機器資源承載更高的并發。