天天看點

Infobright的資料類型

Infobright裡面支援所有的MySQL原有的資料類型。其中Integer類型比其他資料類型更加高效。盡可能使用以下的資料類型:

  TINYINT,SMALLINT,MEDIUMINT,INT,BIGINT

  DECIMAL(盡量減少小數點位數)

  DATE ,TIME

  效率比較低的、不推薦使用的資料類型有:

  BINARY VARBINARY

  FLOAT

  DOUBLE

  VARCHAR

  TINYTEXT TEXT

  Infobright資料類型使用的一些經驗和注意點:

  (1)Infobright的數值類型的範圍和MySQL有點不一樣,比如Infobright的Int的最小值是-2147483647,而MySQl的Int最小值應該是-2147483648。其他的數值類型都存在這樣的問題。

  (2)能夠使用小資料類型就使用小資料類型,比如能夠使用SMALLINT就不适用INT,這一點上Infobright和MySQL保持一緻。

  (3)避免效率低的資料類型,像TEXT之類能不用就不用,像FLOAT盡量用DECIMAL代替,但是需要權衡畢竟DECIMAL會損失精度。

  (4)盡量少用VARCHAR,在MySQL裡面動态的Varchar性能就不強,是以盡量避免VARCHAR。如果适合的話可以選擇把VARCHAR改成CHAR存儲甚至專程INTEGER類型。VARCHAR的優勢在于配置設定空間的長度可變,既然Infobright具有那麼優秀的壓縮性能,個人認為完全可以把VARCHAR轉成CHAR。CHAR會具有更好的查詢和壓縮性能。

  (5)能夠使用INT的情況盡量使用INT,很多時候甚至可以把一些CHAR類型的資料往整型轉化。比如搜尋日志裡面的客戶永久id、客戶id等等資料就可以用BIGINT存儲而不用CHAR存儲。其實把時間分割成year、month、day三列存儲也是很好的選擇。在我能見到的系統裡面時間基本上是使用頻率最高的字段,提高時間字段的查詢性能顯然是非常重要的。當然這個還是要根據系統的具體情況,做資料分析時有時候很需要MySQL的那些時間函數。

  (6)varchar和char字段還可以使用comment lookup,comment lookup能夠顯著地提高壓縮比率和查詢性能。