A-A+

独家已解决:XML解析错误:未组织好 This page contains the following errors

2014年12月24日 16:04 汪洋大海 暂无评论 阅读 244 views 次

在使用Firefox浏览器测试我编写的xml文件时,遇到如下错误:
我的xml源代码如下:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.baidu.com/?q=%BB%FA%C6%B1&mb=bt</loc>
<lastmod>2012-06-26T17:35:23+08:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>

Firefox浏览器提示的错误如下:

XML解析错误:未组织好
位置:http://www.baidu.com/err.xml
行:4,列:42:
<loc>http://www.baidu.com/?q=%BB%FA%C6%B1&m=m.htm</loc>
-----------------------------------------^

谷歌Chrome浏览器提示的错误如下:

This page contains the following errors:
error on line 4 at column 42: EntityRef: expecting ';'
Below is a rendering of the page up to the first error.

分析问题
Firefox浏览器、谷歌Chrome浏览器以及大多数浏览器在显示xml文件时,显示的并不是文件源码,而是经过“xml解析器”解析后的结果。但是,“xml解析器”在遇到字符“&”时,会把“&”当做一个实体引用的开始,而去寻找这个实体引用的结束符号“;”,本文上面遇到的就是这个问题。
在xml文档中,像“&”这样的预定义的实体引用一共有5个,分别是“&”、“<”、“>”、“'”、“"”。
解决方法一:
把实体引用编码后使用,即
把“&” 编码为 “&amp;
把“<” 编码为“&lt;
把“>” 编码为 “&gt;
把“'” 编码为 “&apos;
把“"” 编码为 “&quot;
针对本文上面的问题,即把原来代码中的:

<loc>http://www.baidu.com/?q=%BB%FA%C6%B1&mb=bt</loc>

替换为:

<loc>http://www.baidu.com/?q=%BB%FA%C6%B1&amp;mb=bt</loc>

解决方法二:
在标记CDATA中,所有的标记、实体引用都被忽略,而被“xml解析器”一视同仁地当做原始字符数据看待,CDATA的形式如下:<![CDATA[文本内容]]>
针对本文上面的问题,即把原来代码中的:

<loc>http://www.baidu.com/?q=%BB%FA%C6%B1&mb=bt</loc>

替换为:

<loc><![CDATA[http://www.baidu.com/?q=%BB%FA%C6%B1&mb=bt]]></loc>

使用CDATA需要注意的两点,一:由于CDATA的结束符号是“]]>”,所以CDATA中不能包含“]]>”,二:由于CDATA中的所有标记、实体引用都被忽略,所以CDATA不能嵌套使用。

标签:

给我留言