mysql資料庫在做查詢時候,有時候是英文字母大小寫敏感的,有時候又不是的,主要是由mysql的字元校驗規則的設定決定的,通常預設是不支援的大小寫字母敏感的。
1. 什麼是字元集和校驗規則?
字元集是一套符号和編碼。校對規則是在字元集内用于比較字元的一套規則。任何一個給定的字元集至少有一個校對規則,它可能有幾個校對規則。要想列出一個字元集的校對規則,使用SHOW COLLATION語句。
校對規則一般有這些特征:
兩個不同的字元集不能有相同的校對規則。
每個字元集有一個預設校對規則。例如,utf8預設校對規則是utf8_general_ci。
存在校對規則命名約定:它們以其相關的字元集名開始,通常包括一個語言名,并且以_ci(大小寫不敏感)、_cs(大小寫敏感)或_bin(二進制)結束。
2. 不同級别的字元集和校驗規則可控制大小寫敏感
MySQL5.1在同一台伺服器、同一個資料庫或甚至在同一個表中使用不同字元集或校對規則來混合定義字元串。字元集和校對規則有4個級别的預設設定:伺服器級、資料庫級、表級和連接配接級。
2.1伺服器級
MySQL按照如下方法确定伺服器字元集和伺服器校對規則:
(1)修改配置檔案/etc/my.cnf
在[mysqld]下添加:collation_server = utf8_bin
重新開機執行個體
更改伺服器級的校驗規則(collation_server )後,資料庫校驗規則(collation_collation)預設會繼承伺服器級的。
注意:
這個隻适用于在重新啟動之後, 建立的庫,已存在的庫不受影響.
同樣的, 即使庫的校驗規則改了,已經存在的表不受修改影響;
同理與已經存在的列... mysql> create database yutest0;
Query OK, 1 row affected (0.00 sec)
mysql> use yutest0;
Database changed
mysql> create table t1 (name varchar(10));
Query OK, 0 rows affected (0.01 sec)
mysql> insert into t1 values('AAA');
Query OK, 1 row affected (0.00 sec)
mysql> insert into t1 values('aaa');
Query OK, 1 row affected (0.01 sec)
mysql> select * from t1;
+------+
| name |
+------+
| AAA |
| aaa |
+------+
2 rows in set (0.00 sec)
mysql> select * from t1 where name='aaa';
+------+
| name |
+------+
| aaa |
+------+
1 row in set (0.00 sec)
可以看出,在伺服器級進行相應的校對規則設定,查詢大小寫敏感。
(2)當伺服器啟動時根據有效的選項設定
當啟動mysqld時,根據使用的初始選項設定來确定伺服器字元集和校對規則。
shell> mysqld --character-set-server=latin1 --collation-server=latin1_swedish_ci
2.2資料庫級
MySQL這樣選擇資料庫字元集和資料庫校對規則:
如果指定了character set X和collate Y,那麼采用字元集X和校對規則Y。
如果指定了character set X而沒有指定collate Y,那麼采用character set X和character set X的預設校對規則。
否則,采用伺服器字元集和伺服器校對規則。
(1)修改配置檔案/etc/my.cnf
進行了兩組測試:
1) 在[mysqld]下添加: collation_server = utf8_bin
collation_database = utf8_bin
2) 在[mysqld]下添加: collation_database = utf8_bin
重新開機執行個體,兩組都不能正常啟動,錯誤資訊如下:
可見,my.cnf配置檔案中不支援設定collation_database 變量。
(2)建立資料庫時設定資料庫校驗規則 mysql> create database yutest default character set utf8 collate utf8_bin;
Query OK, 1 row affected (0.00 sec)
mysql> show variables like 'collation_%';
+----------------------+-----------------+
| Variable_name | Value |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database | utf8_bin |
| collation_server | utf8_general_ci |
+----------------------+-----------------+
3 rows in set (0.00 sec)
mysql> select * from t1;
+------+
| name |
+------+
| ABC |
| abc |
+------+
2 rows in set (0.00 sec)
mysql> select * from t1 where name='abc';
+------+
| name |
+------+
| abc |
+------+
1 row in set (0.01 sec)
可以看出,在資料庫級進行相應的校對規則設定,查詢大小寫敏感。
2.3表級
MySQL按照下面的方式選擇表字元集和校對規則:
如果指定了character set X和collate Y,那麼采用character set X和collate Y。
如果指定了character set X而沒有指定collate Y,那麼采用character set X和character set X的預設校對規則。
否則,采用資料庫字元集和伺服器校對規則。
在建立表時設定表級校驗規則: mysql> create database yutest2;
Query OK, 1 row affected (0.01 sec)
mysql> use yutest2;
Database changed
mysql> create table t1(name varchar(10))
-> default character set utf8 collate utf8_bin;
Query OK, 0 rows affected (0.01 sec)
mysql> insert into t1 values('ABC');
Query OK, 1 row affected (0.00 sec)
mysql> insert into t1 values('abc');
Query OK, 1 row affected (0.00 sec)
mysql> show variables like 'collation_%';
+----------------------+-----------------+
| Variable_name | Value |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database | utf8_general_ci |
| collation_server | utf8_general_ci |
+----------------------+-----------------+
3 rows in set (0.00 sec)
mysql> select * from t1;
+------+
| name |
+------+
| ABC |
| abc |
+------+
2 rows in set (0.00 sec)
mysql> select * from t1 where name='abc';
+------+
| name |
+------+
| abc |
+------+
1 row in set (0.00 sec)
可以看出,在表級進行相應的校對規則設定,查詢大小寫敏感。
2.4 連接配接級
考慮什麼是一個“連接配接”:它是連接配接伺服器時所作的事情。用戶端發送SQL語句,例如查詢,通過連接配接發送到伺服器。伺服器通過連接配接發送響應給用戶端,例如結果集。對于用戶端連接配接,這樣會導緻一些關于連接配接的字元集和校對規則的問題,這些問題均能夠通過系統變量來解決: mysql> show variables like 'character%';
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
8 rows in set (0.00 sec)
當查詢離開用戶端後,在查詢中使用哪種字元集?
伺服器使用character_set_client變量作為用戶端發送的查詢中使用的字元集。
伺服器接收到查詢後應該轉換為哪種字元集?
轉換時,伺服器使用character_set_connection和collation_connection系統變量。它将用戶端發送的查詢從character_set_client系統變量轉換到character_set_connection。
伺服器發送結果集或傳回錯誤資訊到用戶端之前應該轉換為哪種字元集?
character_set_results變量訓示伺服器傳回查詢結果到用戶端使用的字元集。包括結果資料,例如列值和結果中繼資料(如列名)。
3. 建立資料庫表時大小寫不敏感,仍然有方法在查詢時區分大小寫
3.1 在SQL語句中使用collate
使用collate子句,能夠為一個比較覆寫任何預設校對規則。collate可以用于多種SQL語句中,比如where,having,group by,order by,as,聚合函數。 mysql> select * from t1 where name collate utf8_bin = 'ABC';
+------+
| name |
+------+
| ABC |
+------+
1 row in set (0.00 sec)
mysql> select * from t1 where name = 'ABC';
+------+
| name |
+------+
| ABC |
| Abc |
| abc |
+------+
3 rows in set (0.00 sec)
mysql> select * from t1;
+------+
| name |
+------+
| ABC |
| Abc |
| abc |
+------+
3 rows in set (0.00 sec)
3.2 binary操作符
binary操作符是collate子句的一個速記符。binary 'x'等價與'x' collate y,這裡y是字元集'x'二進制校對規則的名字。每一個字元集有一個二進制校對規則。例如,latin1字元集的二進制校對規則是latin1_bin,是以,如果列a是字元集latin1,以下兩個語句有相同效果: select * from t1 order by binary a;
select * from t1 order by a collate latin1_bin;
mysql> select * from t1 where binary name = 'ABC';
+------+
| name |
+------+
| ABC |
+------+
1 row in set (0.00 sec)
mysql>
mysql> select * from t1 where name = 'ABC';
+------+
| name |
+------+
| ABC |
| Abc |
| abc |
+------+
3 rows in set (0.00 sec)