当前位置: 首页 > 知识库问答 >
问题:

ClassNotFoundException:org。阿帕奇。薛西斯。解析器。使用样板管道时的抽象语法分析器

韦思淼
2023-03-14

我是非常新的boilertube,我正在尝试以下基本代码:

package contentExtraction;

import java.net.URL;

import de.l3s.boilerpipe.extractors.ArticleExtractor;

public class ContentExtractor {

    public static void main(String[] args) throws Exception {
        final URL url = new URL(
//              "http://www.l3s.de/web/page11g.do?sp=page11g&link=ln104g&stu1g.LanguageISOCtxParam=en"
            "http://www.dn.se/nyheter/vetenskap/annu-godare-choklad-med-hjalp-av-dna-teknik"
            );

       System.out.println(ArticleExtractor.INSTANCE.getText(url));
    }

}

但我在尝试运行上述代码时遇到以下错误:

Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/xerces/parsers/AbstractSAXParser
    at java.lang.ClassLoader.defineClass1(Native Method)
    at java.lang.ClassLoader.defineClass(Unknown Source)
    at java.security.SecureClassLoader.defineClass(Unknown Source)
    at java.net.URLClassLoader.defineClass(Unknown Source)
    at java.net.URLClassLoader.access$100(Unknown Source)
    at java.net.URLClassLoader$1.run(Unknown Source)
    at java.net.URLClassLoader$1.run(Unknown Source)
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader.findClass(Unknown Source)
    at java.lang.ClassLoader.loadClass(Unknown Source)
    at sun.misc.Launcher$AppClassLoader.loadClass(Unknown Source)
    at java.lang.ClassLoader.loadClass(Unknown Source)
    at de.l3s.boilerpipe.sax.BoilerpipeSAXInput.getTextDocument(BoilerpipeSAXInput.java:51)
    at de.l3s.boilerpipe.extractors.ExtractorBase.getText(ExtractorBase.java:69)
    at de.l3s.boilerpipe.extractors.ExtractorBase.getText(ExtractorBase.java:87)
    at contentExtraction.ContentExtractor.main(ContentExtractor.java:16)
Caused by: java.lang.ClassNotFoundException: org.apache.xerces.parsers.AbstractSAXParser
    at java.net.URLClassLoader.findClass(Unknown Source)
    at java.lang.ClassLoader.loadClass(Unknown Source)
    at sun.misc.Launcher$AppClassLoader.loadClass(Unknown Source)
    at java.lang.ClassLoader.loadClass(Unknown Source)
    ... 16 more

我在谷歌上搜索了错误,发现了这个链接。我以为我错过了xercesImpl。我的依赖项中的jar。我包含了相同的代码,但是我的代码给出了相同的错误。问题是什么?

共有1个答案

权承
2023-03-14

我自己想出了解决办法。boilerpipejar还有更多的依赖项。我将我的项目转换为maven项目,包括依赖项:

<dependency>
    <groupId>com.syncthemall</groupId>
    <artifactId>boilerpipe</artifactId>
    <version>1.2.1</version>
</dependency>

当我构建上述项目时,我可以看到实际上有4个JAR导入到Maven Dependencies文件夹中:

boilerpipe-1.2.1。jar
nekohtml-1.9.18。jar
xercesImpl-2.11.0。jar
xml-api-1.4.01。jar

 类似资料:
  • 更新:这个异常是Maven偶尔抛出的,无法理解为什么构建结果会发生变化。。。 大家好,当我在不同的机器上部署web应用程序时,当我尝试使用打开XLSX文件时,会收到此异常

  • 我正试图让我的Grails应用程序使用logback插件登录。根据文档说明,以下是我迄今为止所做的工作: 然后我运行了一个。当我运行一个时,我得到一个绝对巨大的堆栈跟踪,如下所示: 此外,在我的GGTS IDE中,添加到中的两个导入语句出现了编译器错误。听起来我的Grails应用程序中仍然有Log4j引用,并且运行将Log4j JAR从我的类路径中删除。这可能解释了堆栈跟踪。但这并不能解释为什么G

  • 我正在使用Pax考试(3.5.0)进行OSGi单元测试。我已经创建了一个测试,但是当我运行它时,我得到了这个堆栈跟踪: 我已经配置了在选项中,我看到了。 但我还是有例外。有人知道我做错了什么吗? 干杯

  • 我正在使用maven(即eclipse的maven插件)进行依赖关系管理,通常它是有效的。例如,jasypt解决了强文本问题,我可以毫无问题地使用它。然而,在尝试使用Log4J时,我遇到了诸如“import org.apache.Log4J无法解决”之类的问题,尽管我遵循了上描述的确切步骤http://logging.apache.org/log4j/2.x/maven-artifacts.htm

  • 我正在使用jersey构建一个web服务应用程序。使用apache shiro进行授权/身份验证im。 我找到了一些演示如何在web应用程序中使用apache shiro的教程。它们使用显示登录方法。具有用户名和密码字段的jsp页面,并且超过此字段。jsp页面是在shiro中配置的。我喜欢这样: 我想知道如何在没有任何密码的情况下进行身份验证。jsp页面,因为我的项目只有web服务。因此,我想我需

  • Apache Kafka:分布式消息传递系统 Apache Storm:实时消息处理 我们如何在实时数据管道中使用这两种技术来处理事件数据? 在实时数据管道方面,我觉得两者做的工作是一样的。如何在数据管道上同时使用这两种技术?