当前位置: 首页 > 面试题库 >

使用Apache POI将Word转换为HTML

谭修然
2023-03-14
问题内容

我看到有一个称为的转换器,WordToHtmlConverter但未公开处理方法。如何传递doc文件并获取HTML文件(或OutputStream)?


问题答案:

该代码现在对我有用!

    HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(new FileInputStream("D:\\temp\\seo\\1.doc"));

    WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
            DocumentBuilderFactory.newInstance().newDocumentBuilder()
                    .newDocument());
    wordToHtmlConverter.processDocument(wordDocument);
    Document htmlDocument = wordToHtmlConverter.getDocument();
    ByteArrayOutputStream out = new ByteArrayOutputStream();
    DOMSource domSource = new DOMSource(htmlDocument);
    StreamResult streamResult = new StreamResult(out);

    TransformerFactory tf = TransformerFactory.newInstance();
    Transformer serializer = tf.newTransformer();
    serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
    serializer.setOutputProperty(OutputKeys.INDENT, "yes");
    serializer.setOutputProperty(OutputKeys.METHOD, "html");
    serializer.transform(domSource, streamResult);
    out.close();

    String result = new String(out.toByteArray());
    System.out.println(result);


 类似资料:
  • 本文向大家介绍Java使用poi将word转换为html,包括了Java使用poi将word转换为html的使用技巧和注意事项,需要的朋友参考一下 使用poi将word转换为html,支持doc,docx,转换后可以保持图片、样式。 1.导入Maven包 2.转换代码 演示地址: https://www.xiaoyun.studio/app/preview.html 以上就是本文的全部内容,希望对

  • 我想使用@RunFor(Parameterized.class)和 实际的测试数据应由业务人员通过Excel创建。 是否有一种简单/通用的方法可以将Apache POI XSSFSheet获取到指定的字符串数组集合? 如果是:有人能提供一个例子吗? 我发现了这个问题:使用Apache POI在TestNG中进行Datadriven测试---但我希望是一种3线测试;-)

  • 问题内容: 如何使用PHP将html转换为word / excel / powerpoint? 问题答案: 尝试以下PHP类: Php电子表格 PHPWord PHP演示 到目前为止,我仅使用PHPExcel,但它工作得很好并且易于学习。由于所有课程均来自同一家公司,因此我认为它们也应满足您的需求。

  • 我需要将带有彩色单词的. docx文件转换为html。我尝试过庞大的库,但颜色丢失了。我如何才能实现我的目标?

  • 每个人。我需要一个VBA代码来将excel数据转换为PDf到word doc,我写了一个宏,将excel打印为pdf,但现在我想从该pdf打印为word,所以简短的版本,Excel到PDF到Word。所有这些都是为了我想保留excel数据的格式

  • 问题内容: 如何将Word文档转换为PDF,其中文档包含各种内容,例如表格。尝试使用iText时,原始文档看起来与转换后的PDF不同。有没有我可以使用的开源API /库,而不是调用可执行文件? 问题答案: 这是一项艰巨的任务,如果您想要完美的结果(如果不使用Word则不可能),则难度就更大了,因为仅使用纯Java即可为您完成所有操作且都是开源的API数量为零,我相信( 更新:我错了,请参见下文 )