UTF-8是UNICODE的一种变长字符编码,由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。如果UNICODE字符由2个字节表示,则编码成UTF-8很可能需要3个字节,而如果UNICODE字符由4个字节表示,则编码成UTF-8可能需要6个字节。用4个或6个字节去编码一个UNICODE字符可能太多了,但很少会遇到那样的UNICODE字符。
基于UTF-8字符集有能够显示任何类型的字符及跨平台的这个优势,utf8越来越多的被人们使用。所以建议在写网页代码的时候,在第一行(没有任何输出的情况下)加入以下header代码:
header(“Content-type: text/html; charset=utf-8″);
这一句前不能向页面输出任何内容,意思是不能使用echo等语句,也不能输出html标签或文字
如果在header前输出了<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″ />等标签或文字那肯定会报错
实际上你用了header(“Content-type: text/html; charset=utf-8″);
这一句的话就不需要用<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″ />了,同一个道理
如果用的不是utf8代码的话,那只需要修改charset=后面的参数就可以了。
例如:
header(“Content-type: text/html; charset=gbk”);