当前位置: 首页 > 面试题库 >

从Runtime.getRuntime()。exec()启动wkhtmltopdf:永不终止?

白子昂
2023-03-14
问题内容

我正在从Java应用程序(Tomcat服务器的一部分,在调试模式下在Win7 64位的Eclipse
Helios中运行)中启动wkhtmltopdf:我要等待它完成,然后再做更多工作。

String cmd[] = {"wkhtmltopdf", htmlPathIn, pdfPathOut};
Process proc = Runtime.getRuntime().exec( cmd, null );

proc.waitFor();

waitFor()永远不会回来。我仍然可以在Windows任务管理器中看到该过程(使用我传递给exec()的命令行:看起来不错)。和它的工作原理。wkhtmltopdf生成了我期望的PDF,就在期望的位置。即使进程仍在运行(在我手动终止它之前),我也可以将其打开,重命名,无论如何。

从命令行,一切都很好:

c:\ wrk> wkhtmltopdf C:\ Temp \ foo.html c:\ wrk \ foo.pdf
载入页面(1/6)
计数页数(2/6)
解析链接(4/6)
加载页眉和页脚(5/6)
打印页面(6/6)
完成了

这个过程退出就好了,生活还在继续。

那么runtime.exec(),导致wkhtmltopdf永不终止的原因是什么?

我可以抓取proc.getInputStream()并查找“完成”,但这很……卑鄙。我想要更一般的东西。

我已经在有工作目录的情况下调用exec()了。我试过有没有空的“ env”数组。不开心

为什么我的流程挂起了,该怎么办才能解决?

PS:我已经尝试使用其他几个命令行应用程序,它们都表现出相同的行为。

高层管理人员陷入困境。

我正在尝试读取标准输出和错误,但没有成功。从命令行,我知道应该有一种与命令行体验非常相似的东西,但是当我读取proc.getInputStream()返回的输入流时,我立即得到了EOL(-1,我正在使用inputStream.read())。

我检查了JavaDoc for Process,发现了这一点

父流程使用这些流将输入馈入子流程并从子流程获取输出。由于某些本机平台仅为标准输入和输出流提供了有限的缓冲区大小,因此无法及时写入子进程的输入流或读取子进程的输出流可能导致[b]子进程阻塞,甚至死锁[/
b]。

重点已添加。所以我尝试了。Standard Out inputStream上的第一个“ read()”被阻塞,直到我终止进程为止。

使用WKHTMLTOPDF

使用通用命令行ap&no params,因此它应该“转储用法并终止”,它会吸收适当的std :: out,然后终止。

有趣!

JVM版本问题?我正在使用1.6.0_23。最新的是… v24。我只是检查了更改日志,没有发现有什么希望,但是无论如何我都会尝试进行更新。

好的。不要让输入流填满,否则它们会被阻塞。检查一下 .close()也可以防止这种情况,但是亮度不是很高。

总体上可以正常工作(包括我测试过的通用命令行应用程序)。

但具体来说
,它会下降。看来wkhtmltopdf正在使用某些终端操作/光标来完成ASCII图形进度条。我相信这会导致inputStream立即返回EOF,而不是给我正确的值。

有任何想法吗?几乎不会破坏交易,但绝对可以。


问题答案:

我遇到了与您完全相同的问题,并且已经解决。这是我的发现:

由于某些原因,wkhtmltopdf的输出将进入该进程的STDERR,而不是STDOUT。我已经通过从Java和perl调用wkhtmltopdf验证了这一点

因此,例如在Java中,您将必须执行以下操作:

//ProcessBuilder is the recommended way of creating processes since Java 1.5 
//Runtime.getRuntime().exec() is deprecated. Do not use. 
ProcessBuilder pb = new ProcessBuilder("wkhtmltopdf.exe", htmlFilePath, pdfFilePath);
Process process = pb.start();

BufferedReader errStreamReader = new BufferedReader(new  InputStreamReader(process.getErrorStream())); 
//not "process.getInputStream()" 
String line = errStreamReader.readLine(); 
while(line != null) 
{ 
    System.out.println(line); //or whatever else
    line = reader.readLine(); 
}

附带说明一下,如果从Java派生一个进程,则必须从stdout和stderr流中读取(即使您不对其进行任何操作),因为否则,流缓冲区将被填充,并且该进程将挂起并且永远不会返回。

为了使代码更可靠,以防万一wkhtmltopdf的开发人员决定将其写入stdout,您可以将子进程的stderr重定向到stdout,并且仅读取如下流:

ProcessBuilder pb = new ProcessBuilder("wkhtmltopdf.exe", htmlFilePath, pdfFilePath); 
pb.redirectErrorStream(true); 
Process process = pb.start(); 
BufferedReader inStreamReader = new BufferedReader(new  InputStreamReader(process.getInputStream()));

实际上,在必须从Java派生外部进程的所有情况下,我都会这样做。这样,我不必阅读两个流。

如果您不希望主线程阻塞,则还应该在不同的线程中读取生成的进程的流,因为从流中读取是阻塞的。

希望这可以帮助。

更新
:我在项目页面中提出了这个问题,并回答说这是设计使然,因为wkhtmltopdf支持在STDOUT中提供实际的pdf输出。请参阅链接以获取更多详细信息和Java代码。



 类似资料:
  • 问题内容: 仅当数据库名称包含(新数据库(myid)等)时,我才能读取文件。我给出以下示例代码: 假设我的数据库名称de mo是指我在打印行时得到的数据库名称仅是de。数据库名称带有空白时可以吗? 问题答案: 您熟悉双引号错误吗?(用于或) 你可以试试: 只需确保您不必传递的任何参数都包含双引号( 而不 是以双引号开头) (请参见 错误6511002 ) 任何类似的参数: 将在 内部 (通过实现)

  • 问题内容: 启动的进程无法创建临时文件。 在Eclipse的Maven插件中使用 从启动报价: 完整日志 演示代码段遇到相同的错误。 更新: 传递TMP和TEMP环境变量无济于事。 通过 而不是也无济于事。 如果envp为null,则子进程继承当前进程的环境设置。 问题答案: 通过传递一组环境变量来解决。

  • 问题内容: 我正在执行一个命令,该命令向我返回文件的修订号;’文档名称’。但是,如果执行命令时遇到问题,则应用程序将挂断。我该怎么做才能避免这种情况?请在下面找到我的代码。 问题答案: 我想问题是您只在读取InputStream而没有在读取ErrorStream。您还必须注意并行读取两个流。可能发生这种情况,当前从输出流中管道传输的数据已填满OS缓冲区,您的exec命令将自动挂起,以使您的阅读器有

  • 问题内容: 我正在尝试通过使用删除垃圾文件 只要我不使用通配符,它​​就可以正常工作,即,这有效: 而以下内容返回“没有此类文件或目录”: 我应该能够做到这里概述的所有美好的事情,对吗? 问题答案: 我可能建议您让Java为您执行此操作? 使用file.listFiles()获取文件列表 如果需要,使用file.getName()。contains(string)对其进行过滤 遍历执行file.d

  • 我有一些Java(swing)代码调用。如果我从命令行运行它,程序运行得非常好。

  • 我正在尝试使用PHP从HTML生成PDF。我正在运行MacOSX作为我的开发环境,尽管我希望这段代码在生产linux服务器上运行。 到目前为止,我得到了: 此代码在/tmp/tmp_PDF中生成PDF。pdf。问题是它永远不会 浏览器挂起,表示正在等待服务器。。。。 就好像shell_exec命令永远不会结束。我注意到当我从终端运行wkhtmltopdf时,它没有退出回命令行。我得到: 然后它也放