Infobright裡面支援所有的MySQL原有的資料類型。其中Integer類型比其他資料類型更加高效。盡可能使用以下的資料類型:
TINYINT,SMALLINT,MEDIUMINT,INT,BIGINT
DECIMAL(盡量減少小數點位數)
DATE ,TIME
效率比較低的、不推薦使用的資料類型有:
BINARY VARBINARY
FLOAT
DOUBLE
VARCHAR
TINYTEXT TEXT
Infobright資料類型使用的一些經驗和注意點:
(1)Infobright的數值類型的範圍和MySQL有點不一樣,比如Infobright的Int的最小值是-2147483647,而MySQl的Int最小值應該是-2147483648。其他的數值類型都存在這樣的問題。
(2)能夠使用小資料類型就使用小資料類型,比如能夠使用SMALLINT就不适用INT,這一點上Infobright和MySQL保持一緻。
(3)避免效率低的資料類型,像TEXT之類能不用就不用,像FLOAT盡量用DECIMAL代替,但是需要權衡畢竟DECIMAL會損失精度。
(4)盡量少用VARCHAR,在MySQL裡面動态的Varchar性能就不強,是以盡量避免VARCHAR。如果适合的話可以選擇把VARCHAR改成CHAR存儲甚至專程INTEGER類型。VARCHAR的優勢在于配置設定空間的長度可變,既然Infobright具有那麼優秀的壓縮性能,個人認為完全可以把VARCHAR轉成CHAR。CHAR會具有更好的查詢和壓縮性能。
(5)能夠使用INT的情況盡量使用INT,很多時候甚至可以把一些CHAR類型的資料往整型轉化。比如搜尋日志裡面的客戶永久id、客戶id等等資料就可以用BIGINT存儲而不用CHAR存儲。其實把時間分割成year、month、day三列存儲也是很好的選擇。在我能見到的系統裡面時間基本上是使用頻率最高的字段,提高時間字段的查詢性能顯然是非常重要的。當然這個還是要根據系統的具體情況,做資料分析時有時候很需要MySQL的那些時間函數。
(6)varchar和char字段還可以使用comment lookup,comment lookup能夠顯著地提高壓縮比率和查詢性能。