天天看点

PHP乱码问题,UTF-8(乱码)

一.html页面转utf-8编码问题 

1.在head后,title前加入一行:

<meta http-equiv='content-type' content='text/html; charset=utf-8' />

顺序不能错,一定要在

显示的标题有可能是乱码!

2.html文件编码问题:

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:utf-8,  如果是ansi,需要将编码改成:utf-8。  3.html文件头bom问题:  将文件从其他的编码转换成utf-8编码时,有时候会在文件的最开始加上一个bom标签,  在个bom标签可能会导致浏览器在显示中文的时候出现乱码。  删除这个bom标签的方法:  1.可以用dreamweaver打开文件,并重新保存,即可以去除bom标签!  2.可以用editplus打开文件,并在菜单“首选项”->“文件”->"utf-8标识",设置为:“总是删除签名”,  然后保存文件,即可以去除bom标签!  4.web服务器utf-8编码问题:  如果你按以上所列的步骤做了,还是有中文乱码问题,  请检查你的所使用的web服务器的编码问题  如果你使用的是apache,请将配置文件里的:charset 设成:utf-8(这里仅列出方法,具体格式请参考apache的配置文件)  如果你使用的是nginx,请将nginx.conf里的:charset 设成 utf-8,  具体找到 "charset gb2312;"或者类似的语句,改成:“charset utf-8;”。

二.php页面转utf-8编码问题 

1.在代码开始出加入一行: 

header("content-type: text/html;charset=utf-8");

2.php文件编码问题

3.php文件头bom问题: 

php文件一定不可以有bom标签 

否则,会出现session不能使用的情况,并有类似的提示: 

warning: session_start() [function.session-start]: cannot send session cache limiter - headers already sent 

这是因为,在执行session_start() 的时候,整个页面不能有输出,但是当由于前php页面存在bom标签, 

php把这个bom标签当成是输出了,所以就出错了! 

所以php页面一定要删除bom标签 

4.php以附件形式保存文件的时候,utf-8编码问题: 

php以附件形式保存文件,文件名必须是gb2312编码, 

否则,如果文件名中有中文的话,将是显示乱码: 

如果你的php本身是utf-8编码格式的文件, 

需要将文件名变量由utf-8转成gb2312: 

iconv("utf-8", "gb2312", "$filename"); 

5.截断显示文章标题时,出现乱码或者“?”问号的问题: 

一般文章标题很长的时候,会显示一部分标题,会对文章标题进行截断, 

由于一个utf-8编码格式的中文字符会占用3个字符宽度, 

截取标题的时候,有时会只截取到一个中文字符的1个字符或2字符宽度, 

没截取完整,将出现乱码或“?”问号的情况, 

用下面的函数截取标题,就不会有问题:

function get_brief_str($str, $max_length) 

echo strlen($str) ."<br>"; 

if(strlen($str) > $max_length) 

$check_num = 0; 

for($i=0; $i < $max_length; $i++) 

if (ord($str[$i]) > 128) 

$check_num++; 

if($check_num % 3 == 0) 

$str = substr($str, 0, $max_length)."..."; 

else if($check_num % 3 == 1) 

$str = substr($str, 0, $max_length + 2)."..."; 

else if($check_num % 3 == 2) 

$str = substr($str, 0, $max_length + 1)."..."; 

return $str; 

}

三.mysql数据库使用utf-8编码的问题

1.用phpmyadmin创建数据库和数据表 

创建数据库的时候,请将“整理”设置为:“utf8_general_ci” 

或执行语句:

create database `dbname` default character set utf8 collate utf8_general_ci;

创建数据表的时候:如果是该字段是存放中文的话,则需要将“整理”设置为:“utf8_general_ci”,

如果该字段是存放英文或数字的话,默认就可以了。

相应的sql语句,例如:

create table `test` ( 

`id` int not null , 

`name` varchar( 10 ) character set utf8 collate utf8_general_ci not null , 

primary key ( `id` ) 

) engine = myisam ;

2.用php读写数据库

在连接数据库之后:

[hide]$connection = mysql_connect($host_name, $host_user, $host_pass);

加入两行:

mysql_query("set character set 'utf8'");//读库

mysql_query("set names 'utf8'");//写库

就可以正常的读写mysql数据库了。

四.js相关的utf-8编码问题 

1.js读cookie的中文乱码问题 

php写cookie的时候需要将中文字符进行escape编码,  否则js读到cookie中的中文字符将是乱码。  但php本身没有escape函数,我们新写一个escape函数: 

function escape($str) 

preg_match_all("/[\x80-\xff].|[\x01-\x7f]+/",$str,$r); 

$ar = $r[0]; 

foreach($ar as $k=>$v) 

if(ord($v[0]) < 128) 

$ar[$k] = rawurlencode($v); 

else 

$ar[$k] = "%u".bin2hex(iconv("utf-8","ucs-2",$v)); 

return join("",$ar); 

js读cookie的时候,用unescape解码,

然后就解决cookie中有中文乱码的问题了。

2.外部js文件utf-8编码问题

当一个html页面或则php页面包含一个外部的js文件时,

如果html页面或则php页面是utf-8编码格式的文件,

外部的js文件同样要转成utf-8的文件,

否则将出现,没有包含不成功,调用函数时没有反应的情况。

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:utf-8,

如果是ansi,需要将编码改成:utf-8。

五.flash相关的utf-8编码问题

flash内部对所有字符串,默认都是以utf-8处理 

1.flash读文普通本文件(txt,html) 

要将文本文件的编码存为utf-8 

2.flash读xml文件 

要将xml文件的编码存为utf-8 

在xml第1行写: 

3.flash读php返回数据 

如果php编码本身是utf-8的,直接echo就可以了 

如果php编码本身是gb2312的,可以将php转存成utf-8编码格式的文件,直接echo就可以了

如果php编码本身是gb2312的,而且不允许改文件的编码格式, 

用下面的语句将字符串转换成utf-8的编码格式 

$new_str = iconv("gb2312", "utf-8", "$str"); 

再echo就可以了 

4.flash读数据库(mysql)的数据 

flash要通过php读取数据库中的数据 

php本身的编码不重要,关键是如果数据库的编码是gb2312的话, 

需要用下面的语句将字符串转换成utf-8的编码格式 

5.flash通过php写数据 

一句话,flash传过来的字符串是utf-8格式的, 

要转换成相应的编码格式,再操作(写文件、写数据库、直接显示等等) 

还是用iconv函数转换 

6.flash使用本地编码(理论上不推荐使用) 

如果想让flash不使用utf-8编码,而是使用本地编码 

对于中国大陆地区而言,本地编码是gb2312或gbk 

as程序内,可以添加以下代码: 

system.usecodepage = true; 

那么flash内所有字符都是使用gb2312的编码了 

所有导入到flash或者从flash导出的数据,都应该做相应的编码转换 

因为使用本地编码,会造成使用繁体中文地区的用户产生乱码,所以不推荐使用