当前位置: 首页 > 知识库问答 >
问题:

如何通过Java应用程序使用Apache Nutch?

欧阳博超
2023-03-14

我必须使用apache Nutch设计一个基于Java/Java EE的搜索引擎。我在互联网上搜索了很多关于apache nutch安装的文章,但找不到任何关于java程序访问或控制apache nutch进行爬行的文章/教程。

共有1个答案

闻人梓
2023-03-14

Apache Nutch只会帮助您抓取数据,但您需要将它找到的数据索引到搜索服务器中。这就是Apache Solr的用武之地。然后,您可以编写Java应用程序,使用Solrj与Solr交互。

请参见本文,了解Nutch和Solr的哪些版本可以最好地协同工作。

 类似资料:
  • 问题内容: 我需要通过.bat文件运行Java应用程序。有人可以帮忙吗? 问题答案: 只需创建一个.bat文件,其中包含以下几行:

  • 问题内容: 我们希望在我们的Java EE应用服务器(JBoss 4.2.3)中提供一些客户请求。我读到Java EE规范不允许从企业bean打开套接字 。但是规范建议没有其他选择。 具体而言,企业bean不应: 侦听,接受网络套接字上的连接或从网络套接字进行多播 所以问题是:我该怎么办才能在应用程序服务器中提供一些基于 二进制 tcp的协议(而不是http)? 这里有人建议实现资源适配器。这是您

  • 显示 “无法导入资源”@AcmeDemoBundle/Controller/SecuredController。php“from”D:/UserData/WWWRoot/Symfony/app/config/routing。yml”。确保“AcmeDemoBundle/Controller/SECUEDCONTROLLER”。php“bundle已正确注册并加载到应用程序内核类中。” 这是我的 处

  • 问题内容: 我正在尝试使用pyinstaller在Windows上使用tkcalendar在Windows上安装python应用程序。应用程序正在运行,但tkcalendar.Calendar无法运行。 当我在不安装的情况下运行应用程序时,一切正常,但是如果执行此操作,则日历小部件将不会出现。我认为pyinstaller可以看到此模块,但他对tkcalendar使用的模块有疑问。我试图用 –pat

  • 我使用托管Gitlab来托管我的Git存储库,最近我使用它来构建/部署PHP和Java应用程序到服务器。 我想做的是,一旦构建完成,使用SSH部署应用程序。有时,这可能只是通过SSH将最终构建的内容(PHP文件)上载到服务器,或者有时它可能是上载已编译的文件。jar文件,然后在远程服务器上执行命令以重新启动服务。 我已经将我自己的Docker容器设置为构建环境,这包括Java、PHP、Compos

  • 我正在通过终端安装CreateReact应用程序。我已经检查了节点。js版本是4.5。0,高于此处的要求。npm的版本是2.15。9.然后我键入命令npm install-g create react app,出现这样的错误信息: 我想知道为什么我会犯这样的错误。有人能帮我解决这个问题吗?非常感谢你!