from:http://hi.baidu.com/wangzengfang/blog/item/c9f97b7b34c6caf00bd18724.html
下面的文章可供參考,但我遇到了幾百兆的數量庫,幾次用此方法都失敗,原因是編輯器不能支援這麼大的文本檔案的編輯,另存為UTF8格式後,再次導入都不成功。
怎麼辦呢?程式員還是靠程式吧。
從資料庫中取出中文字元串來,用函數一看是UTF-8格式的,所有不能再轉換為UTF-8格式的了,那怎麼辦呢?仔細想想,原來的網頁顯示中文是可行的,這時實際上是在GBK,GB2312編碼下的。那我把字元串取出後轉換成GBK的,即UTF-8=>BGK,果然可以顯示了。注意這時網頁中所有的編碼都是UTF-8的了,應該跟一般的UTF-8的網頁一樣可以插入到資料庫裡了。但是插入記錄還是亂碼,于是把set names utf8再加上。竟然成功了。
但有個問題:為何字段格式是latin1,卻可以gbk顯示出來,但檢測卻是utf-8編碼,卻在utf-8下顯示不出來,必須轉換成bgk才可以顯示出來?找到一篇強文!http://hi.baidu.com/wangzengfang/blog/item/8563a8f9b56bd25d252df2d7.html
相信 MySQL 的編碼對很多人來說 … 一直是個相當令人頭痛的問題 … 今天所要做的介紹是如何把資料庫的資料, 由 latin1 轉成 utf8..
一般 .. MySQL 裝起來後(用 rpm 安裝) ,系統的預設編碼是 latin1.
而很多人在安裝一些網頁的系統時,如 wordpress、LifeType、phpBB … 等等,都會選擇 utf8 。
這時 … 系統一樣可以正常運作 … 隻是當用 phpmyadmin 進入管理資料庫時,就會發現 .. 怎麼中文字的部分都變成了歪七扭八 ..
或者一些鬼畫符的文字。如:凡事先從工作講起
此現象就是 utf8 的文字以 latin1形式儲存,phpmyadmin 以 utf8 的資料讀取方式讀取 … 讀出來的資料就是這種鬼畫符…>
若要解決 phpmyadmin 讀出的鬼畫符 … 有兩個方法:
1. 進入 phpmyadmin 内一個名為 libraries 的子目錄 .. 編輯 select_lang.lib.php. 找到 $mysql_charset_map 這一段下方 ..
‘utf-8′ => ‘utf8′,把它改成‘utf-8′ => ‘latin1′,
然後存盤 … 這時候就可以發現原先的鬼畫符 … 這時候又都正常了.
2. 把資料庫的編碼轉成 utf8 …
步驟:
a. 把資料庫 dump 出來
mysqldump -u xxx -p database > database.sql –default-character-set=latin1
這時候 dump 出來的 database.sql 是 latin1 的檔案格式,然而是 utf8 的文字資料,是以這時若用 vi 開檔看它 …
還是會發現中文字是鬼畫符 … 這時不要被眼前的假象所騙 … 以為自己做錯 .. 幾接着做下一步驟。
b. 把 dump 出來的 database.sql 下載下傳回去 .. 用 emEditor或者editplus等支援儲存檔案時可選擇檔案存儲格式的編輯器把 database.sql 打開,
它可以正常識别 utf8 的文字 ..用字元串替換的功能,把 “latin1” 都替換成 “utf8” ,之後直接另存新檔 .. 這時把檔案類型設定儲存成 UTF-8。
c. 再把 database-utf8.sql 上傳到 server .. 這時我們用 vi 開啟它 .. 就可以看見是正常的中文字 .. 這就表示檔案沒問題啰。
d. 把檔案彙入資料庫
mysql database < database-utf8.sql -u xxx -p --default-character-set=utf8
注意你的database名稱,如果你想把資料導入到另外一個資料庫中時,因為你想保留原來的資料庫中的資料。那你應該先自己建立一個空的資料庫。這條指令并不能在資料庫不存在的情況下建立資料庫。
如果資料量不是很大 … 那麼很快就可以完成這個步驟 .. 這時候若沒有錯誤訊息出現 .. 那麼恭喜你 ..
你已經完成了資料庫轉換的工作了。如果有錯誤訊息出現 .. 主要有兩個情形 ..
1. 檔案檔案内的中文字,用 vi 看是亂碼 ..檔案檔的格式不是 utf-8。
2. 彙入的時候漏掉指定采用 utf8 的資料編碼彙入。
以上的作業是在 資料庫系統都是處于 latin1 的環境底下,也就是沒有在 my.cnf 指定 default-character-set=utf8。