<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE wml PUBLIC "-//WAPFORUM//DTD WML 1.1//EN" "http://www.wapforum.org/DTD/wml_1.1.xml">
<wml>
<head><meta forua="true" http-equiv="Cache-Control" content="max-age=0" /></head>
<card title="UTF8 与 UTF8 +BOM 区别" id="card1">
<p> 游客</p><p>
标题:UTF8 与 UTF8 +BOM 区别<br/>
正文:<br/>
一个带标签，一个没有标签。BOM是Byte Order Mark（定义字节顺序），因为在网络传输中分两种顺序：大头和小头。由于兼容性，带BOM的utf-8在一些browser中显示为乱码。网上搜索了关于Byte Order Mark的信息：在UCS 编码中有一个叫做&amp;quot;ZERO WIDTH NO-BREAK SPACE&amp;quot;的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符&amp;quot;ZERO WIDTH NO-BREAK SPACE&amp;quot;。这样如果接收者收到FEFF，就表明这个字节流是Big-Endian的；如果收到FFFE，就表明这个字节流是Little- Endian的。因此字符&amp;quot;ZERO WIDTH NO-BREAK SPACE&amp;quot;又被称作BOM。UTF-8不需要BOM来表明字节顺序，但可以用BOM来表明编码方式。字符&amp;quot;ZERO WIDTH NO-BREAK SPACE&amp;quot;的UTF-8编码是EF BB BF。所以如果接收者收到以EF BB BF开头的字节流，就知道这是UTF-8编码了。Windows就是使用BOM来标记文本文件的编码方式的。带BOM的UTF-8，所有PHP无法识别，直接将EF BB BF输出，在charset=&amp;quot;utf-8&amp;quot;的页面中是空白，在GB2312的页面中的输出的就是稀有汉字：锘匡豢 怎么转化为 UTF-8，无bom格式 ？？用 UltarEdit   可以转化的直接用UE打开你的文件,然后在文件选项里面有一个转化的选项里面选ascii转化为 uft-8 就可以了【UTF8 + BOM产生问题与小结】写python脚本的时候发现这样一个问题：从xls文件导出到txt时，无法直接转换为int型数据，输出查看发现和文件编码方式产生的附加信息有关用一个简单的文件举例90905909079090890909909399094090946909599096190965当文件分别用ascii，utf8，utf8+bom作为编码格式时，显示输出结果如下：使用ascii编码的输出：['90905\r\n', '90907\r\n', '90908\r\n', '9<br/><a href="http://camnpr.com/wap.asp?mode=WAP&amp;act=View&amp;id=1204&amp;Page=1">[&lt;&lt;]</a><a href="http://camnpr.com/wap.asp?mode=WAP&amp;act=View&amp;id=1204&amp;Page=1">[[1]]</a><a href="http://camnpr.com/wap.asp?mode=WAP&amp;act=View&amp;id=1204&amp;Page=2">[2]</a><a href="http://camnpr.com/wap.asp?mode=WAP&amp;act=View&amp;id=1204&amp;Page=3">[3]</a><a href="http://camnpr.com/wap.asp?mode=WAP&amp;act=View&amp;id=1204&amp;Page=11">[&gt;&gt;]</a><br/>
<br/>
<a href="wap.asp?act=Com&amp;id=1204">查看评论(0)</a><br/>
<a href="wap.asp?act=AddCom&amp;inpId=1204">发表评论</a><br/><br/>

<br/>

<br/>
<a href="http://camnpr.com/wap.asp">首页</a>
</p>
</card>
</wml>