zhengzuo 2006-3-1
由于笔者是使用Rss聚合软件(
Rss bandit)来看那些提供Rss服务的网站信息,感觉方便很多,省了不少时间,不过长期以来发现一些网站生成的Rss文件时常会存在问题,导致客户端软件无法解析。这里笔者出于找问题的目的列举几个网站,希望这些网站能提供更健壮的Rss服务,同时希望那些将要提供Rss服务的网站能够引起注意,对外提供稳定的服务。
由于Rss文件根据不同时间生成新的摘要,笔者对以下的几个典型例子加上了出错日期。当用IE浏览器查看问题的rss文件内容时,有些网站会跳到其他正常页面,笔者一般使用Firefox进行查看,如果还是看不到rss文件内容通过下载到本地再打开。
其中的几条如下:
时间: 2006-2-28
错误显示:
XML解析错误:未组织好
位置:行:140,列:68
<pubDate>2006-1-4 17:06:51</pubDate><dc:creator>[美]Tara Calishain & Real Dornfest 著</dc:creator>
-------------------------------------------------------------------^
分析原因:
由于&没有转换成amp;导致rss文件不再是一个合法xml文件。
XML 规范定义了五个可以用来替代不同的特殊字符的实体。这些实体是:
< 代表小于符号
> 代表大于符号
" 代表一个双引号
' 代表一个单引号(或撇号)
& 代表一个“与”符号。
时间:隔个几天就会出现问题。
说明:veryCD上出错的机率比较大。笔者订阅电影、动漫、剧集、软件、音乐、游戏、杂志、资料和综艺等模块,都会出现错误。
错误显示1:verycd中rss文件的一些错误用ie打开,提示“无法显示 XML 页。使用 XSL 样式表无法查看 XML 输入。请更正错误然后单击 刷新按钮,或以后重试”。
在fireFox中看到的结果省略后如下:
XML解析错误:未组织好
位置:行:88,列:2369,文件太长,下面列出一部分,
<description><![CDATA[<img alt="《林依晨 ☞ ♥精义入神♥影音典藏》20060228更新[RMVB]" ......˙*.影迷俱乐部.*˙ .<br />♥ 恋恋依晨 ♥
http://linichen.net/<br />♥ 依晨花园 ♥
http://www.linyichen.com/]]></description>
使用vs.net 2003打开,进行xml数据验证,提示: “”(十六进制值 0x07)是无效的字符。 行 88,位置 2369。
错误显示2:在vs.net 2003中显示:
“”(十六进制值 0x1C)是无效的字符。 行 55,位置 698。
<description><![CDATA[<img alt="《盾牌 第五季》(The Shield Season 5)[风软FRM出品]更新到第3集[RMVB]" align="right" /><br />【类型】: 剧情/动作<br />......演员】: <br />Michael Chiklis
<br /> ..... Det. Vic Mackey <br />Catherine Dent <br /> ..... Det. Danielle 'Danny' Sofer I<br />Walt Goggins <br /> ..... Det. Shane Vendrell (as Walton Goggins)<br />Michael Jace S<br /> ..... Off. Julien Lowe <br />Kenny Johnson <br /> ..... Det. Curtis 'Lemonhead' Lemansky (as Kenneth Johnson) Jay Karnes <br /> ..... Det. Holland 'Dutch' Wagenbach <br />Benito Martinez .... <br /><br />]]></description>
。