1.簡單介紹
MyISAM是MySQL的預設資料庫引擎(5.5版之前),由早期的ISAM(Indexed Sequential Access Method:有索引的順序通路方法)所改良。雖然性能極佳,但卻有一個缺點:不支援事務處理(transaction)。不過,在這幾年的發展下,MySQL也導入了InnoDB(另一種資料庫引擎),以強化參考完整性與并發違規處理機制,後來就逐漸取代MyISAM。
InnoDB,是MySQL的資料庫引擎之一,為MySQL AB釋出binary的标準之一。InnoDB由Innobase Oy公司所開發,2006年五月時由甲骨文公司并購。與傳統的ISAM與MyISAM相比,InnoDB的最大特色就是支援了ACID相容的事務(Transaction)功能,類似于PostgreSQL。目前InnoDB采用雙軌制授權,一是GPL授權,另一是專有軟體授權。
2.MyISAM和InnoDB兩者之間的明顯差別:
簡單梳理如下
1) 事務支援
MyISAM不支援事務,而InnoDB支援。InnoDB的AUTOCOMMIT預設是打開的,即每條SQL語句會預設被封裝成一個事務,自動送出,這樣會影響速度,是以最好是把多條SQL語句顯示放在begin和commit之間,組成一個事務去送出。
MyISAM是非事務安全型的,而InnoDB是事務安全型的,預設開啟自動送出,宜合并事務,一同送出,減小資料庫多次送出導緻的開銷,大大提高性能。
2) 存儲結構
MyISAM:每個MyISAM在磁盤上存儲成三個檔案。檔案的名字以表的名字開始,擴充名指出檔案類型。.frm檔案存儲表定義(表的結構檔案)。表資料檔案的擴充名為.MYD (MYData)。索引檔案的擴充名是.MYI (MYIndex)。(重點哦!!!)
MyISAM在磁盤上存儲的檔案的具體展現:
InnoDB:所有的表(指資料庫裡面所有的表)都儲存在同一個資料檔案中(也可能是多個檔案,或者是獨立的表空間檔案 小疑問: 這句話是什麼意思啊????是不是說有可能是資料庫裡面所有的表資料檔案都存在一個檔案裡面,也有可能是分開存?),InnoDB表的大小隻受限于作業系統檔案的大小,一般為2GB。
解釋: innodb引擎是把索引檔案和資料檔案存儲在一起
3) 存儲空間
MyISAM:可被壓縮,存儲空間較小。支援三種不同的存儲格式:靜态表(預設,但是注意資料末尾不能有空格,會被去掉)、動态表、壓縮表。(小疑問:什麼是動态表,什麼是壓縮表???)
InnoDB:需要更多的記憶體和存儲,它會在主記憶體中建立其專用的緩沖池用于高速緩沖資料和索引。
4) 可移植性、備份及恢複
MyISAM:資料是以檔案的形式存儲,是以在跨平台的資料轉移中會很友善。在備份和恢複時可單獨針對某個表進行操作。
InnoDB:免費的方案可以是拷貝資料檔案、備份 binlog(二進制日志),或者用 mysqldump,在資料量達到幾十G的時候就相對痛苦了。
更多内容還未更新完,請參考下方連結:
http://www.cnblogs.com/kevingrace/p/5685355.html
MySQL索引實作
在MySQL中,索引屬于存儲引擎級别的概念,不同存儲引擎對索引的實作方式是不同的,本文主要讨論MyISAM和InnoDB兩個存儲引擎的索引實作方式。
1.MyISAM索引實作
MyISAM引擎使用B+Tree作為索引結構,葉節點的data域存放的是資料記錄的位址。下圖是MyISAM索引的原理圖:
這裡設表一共有三列,假設我們以Col1為主鍵,則上圖是一個MyISAM表的主索引(Primary key)示意。可以看出MyISAM的索引檔案僅僅儲存資料記錄的位址。在MyISAM中,主索引和輔助索引(Secondary key)在結構上沒有任何差別,隻是主索引要求key是唯一的,而輔助索引的key可以重複。如果我們在Col2上建立一個輔助索引,則此索引的結構如下圖所示:
(小疑問:筆者從下圖并沒有看出輔助索引的key重複情況,隻不過是下圖沒有把輔助索引的key重複的情況畫出來而已)
同樣輔助索引的資料結構也是一棵B+樹,data域儲存資料記錄的位址。是以,MyISAM中索引檢索的算法為首先按照B+Tree搜尋算法搜尋索引,如果指定的Key存在,則取出其data域的值,然後以data域的值為位址,讀取相應資料記錄。
MyISAM的索引方式也叫做“非聚集”的,之是以這麼稱呼是為了與InnoDB的聚集索引區分。
2.InnoDB索引實作
雖然InnoDB也使用B+Tree作為索引結構,但具體實作方式卻與MyISAM截然不同
第一個重大差別是InnoDB的資料檔案本身就是索引檔案。從上文知道,MyISAM索引檔案和資料檔案是分離的,索引檔案僅儲存資料記錄的位址。而在InnoDB中,表資料檔案本身就是按B+Tree組織的一個索引結構,這棵樹的葉節點data域儲存了完整的資料記錄。這個索引的key是資料表的主鍵,是以InnoDB表資料檔案本身就是主索引。(可以根據下圖來了解)
上圖是InnoDB主索引(同時也是資料檔案)的示意圖,可以看到葉節點包含了完整的資料記錄。這種索引叫做聚集索引。因為InnoDB的資料檔案本身要按主鍵聚集,是以InnoDB要求表必須有主鍵(MyISAM可以沒有)(解釋:InnoDB存儲引擎是表資料檔案和索引檔案是一個總檔案,相比于MyISAM而言,InnoDB把表資料檔案和索引檔案融合成了一個檔案),如果沒有顯式指定,則MySQL系統會自動選擇一個可以唯一辨別資料記錄的列作為主鍵,如果不存在這種列,則MySQL自動為InnoDB表生成一個隐含字段作為主鍵,這個字段長度為6個位元組,類型為長整型。
第二個與MyISAM索引的不同是InnoDB的輔助索引data域存儲相應記錄主鍵的值而不是位址。換句話說,InnoDB的所有輔助索引都引用主鍵作為data域。例如,下圖為定義在Col3上的一個輔助索引:
這裡以英文字元的ASCII碼作為比較準則。聚集索引(解釋:就是把表資料檔案和索引融合成一個總檔案的方式)這種實作方式使得按主鍵的搜尋十分高效,但是輔助索引搜尋需要檢索兩遍索引:首先檢索輔助索引獲得主鍵,然後用主鍵到主索引中檢索獲得記錄。
了解不同存儲引擎的索引實作方式對于正确使用和優化索引都非常有幫助,例如知道了InnoDB的索引實作後,就很容易明白為什麼不建議使用過長的字段作為主鍵,因為所有輔助索引都引用主索引,過長的主索引會令輔助索引變得過大。再例如,用非單調的字段作為主鍵在InnoDB中不是個好主意,因為InnoDB資料檔案本身是一棵B+Tree,非單調的主鍵會造成在插入新記錄時資料檔案為了維持B+Tree的特性而頻繁的分裂調整(解釋:如果我們的主鍵是單調的,那就不會分裂調整B+Tree的結構,而如果主鍵是非單調的話,那就很有可能調整B+Tree的結構(跟平衡二叉樹一樣,為了起到平衡整顆樹的形狀而調整結構)),十分低效,而使用自增字段作為主鍵則是一個很好的選擇。