天天看點

mysql inner join 效率_mysql的大小表前後順序對inner join的效率有影響嗎?

Aititi 集合連接配接 表格連接配接的join算法 attilax總結 艾提拉總結

常見的join算法 - CSDN部落格.html

Nexted-loop join中小表驅動大表的原因分析

原創 2017年07月31日 20:53:27

· 标簽:

· 414

1.

Next-loop join:

1. outer_iterator = SELECT A.xx,A.c FROM A WHERE A.xx IN (5,6);

2. outer_row = outer_iterator.next;

3. while(outer_row) {

4. inner_iterator = SELECT B.yy FROM B WHERE B.c = outer_row.c;

5. inner_row = inner_iterator.next;

6. while(inner_row) {

7. output[inner_row.yy,outer_row.xx];

8. inner_row = inner_iterator.next;

9. }

10. outer_row = outer_iterator.next;

11. }

過濾後留下的結果集M,N(M>N) 1.如果都走全表的話,大表做驅動和小表做驅動都是M*N 2.如果走索引的話: a.索引對小表的作用不會太大,對于大表索引的作用就很大了,除非索引建的不好。。 b.假設nexted-loop join中驅動表過濾後的行數為K,那麼while(outer_row)一定會循環K次,這時驅動表上索引的功能是比聚簇索引占有更小的空間,一個節點上的資料量會更大些,減少随機I/O。 c.如果被驅動表過濾後的行數為W,那麼在while(outer_row)中兩表連接配接條件上被驅動表還有機會利用索引來大大減少内循環的次數。

是以過濾結果中的小表做驅動表。。

果兩個表一樣大,效率是一樣的。 如果兩個表的資料量相差很大,那效率上是有差別的。 一般來說,小表去join大表,效率要比大表去join小表高的多。 通常SQL會自動去選擇效率好的查詢方案。 是以寫SQL盡量先查詢和過濾資料量小的表,再去join大的表。