当前位置: 首页 > 知识库问答 >
问题:

Mapreduce Hadoop的PDF输入格式

邹阳
2023-03-14

我正在使用以下依赖项

<dependency>
        <groupId>org.apache.pdfbox</groupId>
        <artifactId>pdfbox</artifactId>
        <version>1.8.10</version>
    </dependency>
    <dependency>
        <groupId>org.apache.pdfbox</groupId>
        <artifactId>fontbox</artifactId>
        <version>1.8.5</version>
    </dependency>

共有1个答案

公良修竹
2023-03-14

1)将pdfbox的jar文件也放在hadoop lib文件夹中(使库jar在运行时对hadoop可用)。

2)重启hadoop集群。

 类似资料:
  • 或者,选择多个有效格式将是一个可接受的解决方案。 当前发生的情况: 如果字段的日期格式设置为,将被拒绝。 如果字段的日期格式设置为,则接受(但格式设置为)。

  • 问题内容: 我正在尝试在Django应用程序中使用Python从SVG输入文件生成PDF。 我已经找到了两个可行的解决方案:cairo + rsvg和imagemagick,但是它们都有一个问题:它们具有一些我不想安装在服务器上的奇怪的依赖项,例如DBUS和GTK。 因此,我正在寻求另一种从SVG生成PDF的方法,而不必在服务器上安装所有这些愚蠢的依赖项。 问题答案: 您考虑过svglib吗? 它

  • 我正在尝试使用最大熵分类器的OpenNLP实现,但似乎文档非常缺乏,尽管这个库显然是为易于使用而设计的,但我找不到输入文件格式(即训练集)的单一示例和/或规范。 有人知道在哪里可以找到这个或一个最简单的培训示例吗?

  • 问题内容: 我正在使用Liferay 6.2,并想使用 liferay-ui:input-date 字段。现场本身工作正常。但是我想更改显示的日期格式 毫米/日/年 至 dd.mm.yyyy 但是该怎么做呢?我看不到有什么衣服可以设置这个… 问题答案: 我查看了输入日期标记库代码,如果要更改模式,则必须修改其代码。文件的路径:\ webapps \ ROOT \ html \ taglib \ u

  • 我的问题是关于thymeleaf数据对象绑定。表单标记中有th:object=“${newPost}”。Thymeleaf看到它,当我提交我的表单时,它将每个,绑定到这个对象的字段。 但是如果我从type='text'更改为type='anything else'>thymeleaf不会映射任何内容。我如何使thymeleaf绑定其他标签,如等到我的对象?