当前位置: 首页 > 知识库问答 >
问题:

转换时Apache POI出现问题。将docx转换为json文档格式。

梁楷
2023-03-14

我现在正在解析一个26页的文件。带有图像、表格、斜体和下划线的docx。我能清除

我使用ApachePOI创建了带有XWPF段落列表的XWPF文档格式。当我遍历XWPF段落时,如果一个段落包含不同的样式,我无法获得各行的样式(斜体、下划线、粗体)。

我尝试过使用XWPF。段落getrun()。XWPF。。。跑getfamilyfont()我将得到null。但是当我运行XWPF时,我在段落级别获得数据。段落getstyle()

如果您遇到类似问题,请务必告诉我。

共有1个答案

韦棋
2023-03-14

我希望这些代码可以帮助你,你可以得到一些风格从CTRPr对象。

CTRPr rPr = run.getCTR().getRPr();
if(rPr!=null){
    CTFonts rFonts = rPr.getRFonts();
    if(rFonts!=null){
        String eastAsia = rFonts.getEastAsia();
        String hAnsi = rFonts.getHAnsi();
        Enum hAnsiTheme = rFonts.getHAnsiTheme();

    }
}
 类似资料:
  • 我刚刚尝试通过docx4j的示例webapp获取docx文档:http://webapp.docx4java.org/OnlineDemo/docx_to_pdf_fop.html生成的PDF文件的表格格式不正确。事实上,表格明显不正确…… 我只是想知道这是因为docx4j不正确支持表格还是某种错误。如果是这样,如果有人能给我指出正确的信息。

  • 我花了大量的时间试图确定到底出了什么问题,使用LibreOffice将pdf转换为docx(以及doc转换为docx)的代码。 我使用了两个windows run接口来测试运行一些我发现相关的代码,也尝试了python,但两者都不起作用。 我在Windows上安装了LibreOffice v6.0.2。 我一直在使用此代码的变体尝试将某些pdf文件转换为与特定pdf文件不相关的docx: 我已经在

  • 问题内容: 我以这种方式将猫鼬文档作为json返回: 但是,还返回了user . proto。没有它我怎么能回来?我尝试了这个但没有用: 问题答案: 您也可以尝试mongoosejs的lean():

  • 上面的代码给了我一个错误,如下所示 线程“main”java.lang.nosuchmethoderror:org.docx4j.org.xhtmlrenderer.docx.docx.docx.docxrenderer.(ljava/lang/string;)V在org.docx4j.convert.in.xhtml.xhtmlimporterimpl.getrenderer(xhtmlimpo

  • 问题内容: 我尝试使用json格式的文件作为输入。这是示例数据的片段。 可以在r中使用这种复杂的json格式制作一个csv,以便更平滑地处理数据吗? 例如,有以下基本类别:基本信息照片创建者位置类别网址 可以制作带有basic_information.id,creator.id等子类别类别的csv文件吗? 问题答案: 在研究您的答案时,我在评论中张贴了一些链接,但现在我非常确信这是解决问题的方法。