当前位置: 首页 > 面试题库 >

萨克斯-ExpatParser $ ParseException

淳于昊然
2023-03-14
问题内容

我正在制作一个读取XML Internet的Android应用程序。此应用程序使用SAX解析XML。这是我的解析部分代码:

public LectorSAX(String url){
    try{
        SAXParserFactory spf=SAXParserFactory.newInstance();
        SAXParser sp = spf.newSAXParser();
        DefaultHandler lxmlr=new LibraryXMLReader() ;
        sp.parse(url, lxmlr);

        nodo=((LibraryXMLReader)lxmlr).getNodoActual();

    }catch(ParserConfigurationException e){ 
        System.err.println("Error de parseo en LectorSAX.java: "+e);
    }catch(SAXException e){
        System.err.println("Error de sax LectorSAX.java: " + e);
    } catch (IOException e){
        System.err.println("Error de  io LectorSAX.java: " + e);
    }
}

问题是发生SAXException。异常消息如下:

org.apache.harmony.xml.ExpatParser $ ParseException:在第4行,第42列:格式不正确(无效的令牌)

但是,如果我将相同的代码放在普通的Java SE应用程序中,则不会发生此异常,并且一切正常。

为什么相同的代码在Java SE应用程序(而不是Android)中可以正常工作?另一方面,如何解决问题呢?

谢谢您的帮助。

问候。


问题答案:

这可能是字符编码问题。
如您所见,无效令牌错误指向第4行。
在此行中,您可以找到一个急流( Meteorología )和一个波浪号( España )。XML标头显示 ISO-8859-15
编码值。由于它比UTF或ISO-8859-1编码少见,因此当SAXParser连接并尝试使用系统默认字符集将字节内容转换为char时,可能会导致错误。


然后,您需要告诉SAXParser使用哪个字符集。一种方法是将InputSource而不是URL传递给parse方法。举个例子:

SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser parser = factory.newSAXParser();

InputSource is = new InputSource(url);
is.setEncoding("ISO-8859-15");

DefaultHandler lxmlr=new LibraryXMLReader() ;
sp.parse(is, lxmlr);

编辑: 似乎Android
VM不支持此编码,引发org.apache.harmony.xml.ExpatParser$ParseException: At line 1, column 0: unknown encoding异常。
作为ISO-8859-15,它主要与ISO-8859-1兼容,除了一些特定的字符(如您在此处看到的)外,一种解决方法是将ISO-8859-15值更改ISO-8859-1为setEncoding方法,从而迫使解析器使用其他但兼容的字符集编码:

is.setEncoding("ISO-8859-1");

看起来,由于Android不支持声明的字符集,因此它使用了默认字符集(UTF-8),因此解析器无法使用XML声明来选择适当的编码。



 类似资料:
  • 问题内容: 我的联系人在解析RSS和Atom文件时遇到SAX问题。根据他的说法,好像来自Item元素的文本被截断为撇号或有时是带重音的字符。编码似乎也有问题。 我尝试了SAX,但也进行了一些删节操作,但无法进一步挖掘。如果有人曾经解决过这个问题,我将不胜感激。 这是ContentHandler中使用的代码: 编辑:编码问题可能是由于将信息存储在字节数组中,因为我知道Java在Unicode中工作。

  • 我目前有以下文件。 http://www.cse.unsw.edu.au/~cs9321/14s1/assignments/musicDb.xml 我的类。 } 我在另一个类中创建了一个对象并调用,但我一直收到上述错误。 有人知道问题出在哪里吗? 谢谢你的帮助。

  • 我正在尝试使用jasperreports,当我尝试运行正在开发的应用程序时,我遇到了下一个错误: 对于我写的代码: 怎么了?。谢谢。xml是这样的,我不知道出了什么问题: 再次感谢。

  • 我正在用Strapi CMS后端和使用composition API的NuxtJS前端建立一个社区网站。 除了正常的注册和使用电子邮件和用户名登录(有效!),我希望用户能够使用GitHub登录。 我正在使用@nuxtjs/auth模块进行授权。 我已经使用ngrok“部署”了我的Strapi后端。这显然是使OAuth工作所必需的。 我已经设置了我的GitHub应用程序,使用 where? nuxt

  • 我正在我的项目中实现Hibernate Envers,对于这个客户端,数据库中的表和列必须遵循特定的名称模式。name模式使用表名来生成列名的一部分,保存修订的表与原始表有不同的名称(当然),因此我需要能够更改Envers生成的表的列名。 如何更改实体试听表的列名称? 我正在使用Hibernate 4.3.11-FINAL 我毫不费力地喊出修订表(REVINFO)名称,也没有列实体的试镜表名称