我正在尝试使用以下代码在Spyder中读取带有tabla py的PDF文件:
import tabula
df = tabula.read_pdf("test.pdf")
df
但是,当我运行此命令时,会出现以下错误:
CalledProcessError:命令“['java','-Dfile.encoding=UTF8','-jar','tabla-jar路径','-pages','1','-guess',PDF文件路径']'返回非零退出状态1。
通过升级到Java8,类似的问题也得到了解决,但我已经在使用Java8,Spyder在其环境变量中提供了它。有人能帮忙吗?
如果有人有类似的问题,那就是指向我安装的旧版本Java的Java。
CalledProcessError:Command'['java','-Dfile.encoding=UTF8','-jar',C:\Users\vijv2c13136\AppData\Local\Continuum\anaconda2\lib\site packages\tabla\tabla-1.0.2-jar-with-dependencies.jar','-pages',all','-g
我正在尝试阅读包含以下内容的pdf文件: 如果我打开它,它可以工作,但是如果我尝试使用编解码器.open(文件名,编码=“utf8”,mode=“rb”)来获取unicode字符串,我得到了以下异常: 您知道从此文件的内容中获取 unicode 字符串的方法吗? PS:我使用的是蟒蛇 2.7
我试图从一个名为poll.txt的文件中获取数据集,然后使用相关数据。 poll.txt内容: 源代码,选举票.java: 但是,当我运行程序时,在给出异常之前,只使用了其中一行: 我试着在“scanner.nextLine();”语句中移动,但没有用。如果我不要求nextLine,这个程序运行良好,但我显然需要它,而且我似乎不知道出了什么问题。
我试图将整个文件作为字符串对象加载到内存中。但是在应用程序结束后,我的内存不会被释放回垃圾收集器。我知道在内存中读取整个文件是不好的,但是我必须将数据发送到另一个类,有人能帮助我如何做这只是一个流,而不是将整个代码加载到内存中,如果没有,有人能说我现在的代码有什么问题吗
我正在尝试从db中选择*。abc在蜂箱中,这个蜂箱表是使用spark加载的 它不工作显示错误: 错误:java。伊奥。IOException:java。lang.IllegalArgumentException:bucketId超出范围:-1(状态=,代码=0) 当我使用以下属性时,我能够查询配置单元: 现在,当我尝试读取相同的hive表db.abc使用火花,我收到的错误如下: 客户端只有在具有以
我返回了一个代码,使用jsoup-1.7.3.jar读取网页,它对一些网站有效,但对一些URL显示读取超时错误。 线程“main”java.net.SocketTimeoutException中的异常:java.net.SocketInputStream.socketRead0(本机方法)处java.net.SocketInputStream.Read(SocketInputStream.java