XML解析文件出错解决方法

在解析xml时，经常因为文件中含特殊字符而解析失败。原因有两个：一是内容中含有XML预定义好的实体，二是内容中含有低位非打印字符。

1.内容中含有xml预定好的实体，如“<”和“&”，对xml来说是禁止使用的，针对这种字符，解决方式是使用CDATA部件以"<![CDATA[" 标记开始，以"]]>"标记结束，是CDATA内部内容被解析器忽略。具体说明参考《XML CDATA是什么？》。

2.内容中含有低位非打印字符，解析时会报错：""(十六进制值 0x1D)是无效的字符.加载或保存XML时引发的异常.System.ArgumentException: “”(十六进制值 0x1D)是无效的字符。

出错的原因是内容中含有低位非打印字符，处理方法是对其进行过滤，过滤方法为：

return System.Text.RegularExpressions.Regex.Replace(str,@"[\x00-\x08]|[\x0B-\x0C]|[\x0E-\x1F]";

以上两种情况，第一种较为普遍，第二种遇到情况比较少，在面对一些用户输入数据时生成xml，可以对xml结点内容执行上述过滤，以保证xml文件使用者可以正确解析xml文档。

posted on 2013-02-28 18:29 陈晨阅读(48292) 评论(0) 收藏举报

刷新页面返回顶部

公告