环境

优质
小牛编辑
119浏览
2023-12-01

本章将指导您完成在Windows和Linux上设置Apache Tika的过程。 安装Apache Tika时需要用户管理。

系统需求 (System Requirements)

JDKJava SE 2 JDK 1.6或更高版本
Memory1 GB RAM(推荐)
磁盘空间没有最低要求
操作系统版本Windows XP或更高版本,Linux

第1步:验证Java安装

要验证Java安装,请打开控制台并执行以下java命令。

OS任务命令
Windows打开命令控制台\> java -version
Linux打开命令终端$ java -version

如果已在系统上正确安装Java,则应根据您正在使用的平台获得以下输出之一。

OSoutput
Windows

Java版“1.7.0_60”

Java(TM)SE运行时环境(版本1.7.0_60-b19)

Java Hotspot(TM)64位服务器VM(内置24.60-b09,混合模式)

Lunix

java版“1.7.0_25”

打开JDK运行时环境(rhel-2.3.10.4.el6_4-x86_64)

打开JDK 64位服务器VM(内置23.7-b01,混合模式)

第2步:设置Java环境

将JAVA_HOME环境变量设置为指向计算机上安装Java的基本目录位置。 例如,

OSoutput
Windows将环境变量JAVA_HOME设置为C:\ProgramFiles\java\jdk1.7.0_60
Linuxexport JAVA_HOME =/usr/local/java-current

将Java编译器位置的完整路径附加到系统路径。

OSoutput
Windows附加字符串; C:\Program Files\Java\jdk1.7.0_60\bin到系统变量PATH的末尾。
Linuxexport PATH = $ PATH:$ JAVA_HOME/bin/

如上所述,从命令提示符验证命令java-version。

第3步:设置Apache Tika环境

程序员可以通过使用将Apache Tika集成到他们的环境中

  • 命令行,
  • Tika API,
  • Tika的命令行界面(CLI),
  • Tika的图形用户界面(GUI),或
  • 源代码。

对于这些方法中的任何一种,首先,您必须下载Tika的源代码。

您可以在https://Tika.apache.org/download.html,找到Tika的源代码,在那里您可以找到两个链接 -

  • apache-tika-1.6-src.zip - 它包含Tika的源代码,和

  • Tika -app-1.6.jar - 这是一个包含Tika应用程序的jar文件。

下载这两个文件。 Tika官方网站的快照如下所示。

蒂卡环境

下载文件后,设置jar文件tika-app-1.6.jar的类路径。 添加jar文件的完整路径,如下表所示。

OSoutput
Windows将字符串“C:\jars\Tika-app-1.6.jar”附加到用户环境变量CLASSPATH
Linux

导出CLASSPATH = $ CLASSPATH -

/usr/share/jars/Tika-app-1.6.tar -

Apache使用Eclipse提供Tika应用程序,一个图形用户界面(GUI)应用程序。

Tika-Maven使用Eclipse构建

m2e发布
  • 选择最新版本并在p2 url列中保存url的路径。

  • 现在重新访问eclipse,在菜单栏中单击“ Help ,然后从下拉菜单中选择“ Install New Software

日食
  • 单击“ Add按钮,键入任意名称,因为它是可选的。 现在将已保存的URL粘贴到“ Location字段中。

  • 将添加一个新插件,其中包含您在上一步中选择的名称,选中前面的复选框,然后单击“ Next

安装
  • 继续安装。 完成后,重新启动Eclipse。

  • 现在右键单击该项目,然后在configure选项中选择convert to maven project

  • 将出现一个用于创建新pom的新向导。 输入组ID作为org.apache.tika,输入最新版本的Tika,选择packaging为jar,然后单击Finish

Maven项目已成功安装,您的项目将转换为Maven。 现在您必须配置pom.xml文件。

配置XML文件

https://mvnrepository.com/artifact/org.apache.tika获取Tika maven依赖关系

下面显示的是Apache Tika的完整Maven依赖。

<dependency>
   <groupId>org.apache.Tika</groupId>
   <artifactId>Tika-core</artifactId>
   <version>1.6</version>
   <groupId>org.apache.Tika</groupId>
   <artifactId> Tika-parsers</artifactId>
   <version> 1.6</version>
   <groupId> org.apache.Tika</groupId>
   <artifactId>Tika</artifactId>
   <version>1.6</version>
   <groupId>org.apache.Tika</groupId>
   < artifactId>Tika-serialization</artifactId>
   < version>1.6< /version>
   < groupId>org.apache.Tika< /groupId>
   < artifactId>Tika-app< /artifactId>
   < version>1.6< /version>
   <groupId>org.apache.Tika</groupId>
   <artifactId>Tika-bundle</artifactId>
   <version>1.6</version>
</dependency>

最后更新:

类似资料

  • 标准的 Python 发行版不会与 NumPy 模块捆绑在一起。 一个轻量级的替代方法是使用流行的 Python 包安装程序 pip 来安装 NumPy。 pip install numpy 启用 NumPy 的最佳方法是使用特定于您的操作系统的可安装的二进制包。 这些二进制包含完整的 SciPy 技术栈(包括 NumPy,SciPy,matplotlib,IPython,SymPy 以及 Pyt

  • 环境 shell编程跟java、php编程一样,只要有一个能编写代码的文本编辑器和一个能解释执行的脚本解释器就可以了。 OS 当前主流的操作系统都支持shell编程,本文档所述的shell编程是指Linux下的shell,讲的基本都是POSIX标准下的功能,所以,也适用于Unix及BSD(如Mac OS)。 Linux Linux默认安装就带了shell解释器。 Mac OS Mac OS不仅带了

  • 你的应用程序可能需要大量的软件包才能正常的工作。如果都不需要 Flask 包的话,你有可能读错了教程。当应用程序运行的时候,你的应用程序的 环境 基本上是所有一切事情的根基。我们是幸运的,因为有许多方式使得我们能够轻松地管理我们的环境。 使用 virtualenv 管理你的环境 virtualenv 是用于在所谓 虚拟环境 中隔离你的应用程序的一个工具。一个虚拟环境是包含了你的应用依赖的软件的一个

  • 在我们开始编写Perl程序之前,让我们了解如何设置Perl环境。 Perl可在各种平台上使用 - Unix(Solaris,Linux,FreeBSD,AIX,HP/UX,SunOS,IRIX等) 赢9x/NT/2000/ WinCE Macintosh(PPC,68K) Solaris(x86,SPARC) OpenVMS Alpha(7.2及更高版本) Symbian Debian GNU/k

  • 要开始使用Koa框架进行开发,您需要安装Node和npm(节点包管理器)。 如果您还没有这些,请转到Node setup以在本地系统上安装节点。 通过在终端中运行以下命令,确认已安装节点和npm。 $ node --version $ npm --version 您应该收到类似于 - 的输出 v5.0.0 3.5.2 请确保您的节点版本高于6.5.0。 现在我们已经设置了Node和npm,让我

  • 在开始使用Rexx之前,您需要确保在系统上运行Rexx的全功能版本。 本章将介绍在Windows机器上安装Rexx及其后续配置以开始使用Rexx。 在继续安装之前,请确保满足以下系统要求。 系统需求 (System Requirements) Memory 2 GB RAM(推荐) 磁盘空间 没有最低要求。 优选地,具有足够的存储空间来存储将使用Rexx创建的程序。 操作系统版本 Rexx可以安装