问题：

使用Docx4J将超文本标记语言RTF合并到Docx

祁景山

2023-03-14

我是Docx4j的新手，我需要一些建议。

目前，我正在用Java创建一个简单的（X）超文本标记语言文档。它包含来自数据库的一些信息。创建这个html后，Docx4j使用一个非常简单的word模板创建了一个Word Docx文件。这工作罚款。

现在我必须增强这个HTML。一个数据库值包含保存RTF文件的字节数组。

目前，我将这些数据作为字符串放入HTML。

String content = new String(allbytes,"UTF-8");
html+=content;

至少html文件如下所示：

<html>
....
<td>
    {\rtf1\ansi\deflang1033\ftnbj\uc1\deff1..... 
</td>
...
</html>

Docx4J现在创建了一个单词Docx，它将RTF显示为字符串，而不是导入的RTF文件。

当然不是，但我希望它是进口的RTF。我该如何存档？有没有简单的方法可以做到这一点？

共有1个答案

景永春

2023-03-14

将rtf转换为docx内容不在docx4j的范围之内。

您需要寻找第三方解决方案，该解决方案可以将rtf转换为docx，否则，可以将rtf转换为（x）html（请参阅将rtf转换为html）

你可以试试http://sourceforge.net/projects/rtf2xml/然后将XML转换为WordML。

另一种可能是LibreOffice通过JODConverter。

类似资料：

Docx到超文本标记语言：使用DOCX4J标题的字体样式不正确

我有一个docx文件，带有Calibri Light的Heading1样式（每隔一个文本也使用Calibri Light）。转换为html后，每个文本都是Calibri Light（正确），但当我打开html文件时，Heading1样式的文本是Times New Roman。（原因：html文件内部没有为Heading1样式设置字体系列）当我打开docx文件并检查Heading1样式的字体时，它
使用Python将超文本标记语言呈现为纯文本

我正在尝试使用BeautifulSoup转换HTML文本块。以下是一个示例：我试着做了这样的事情： ...但是这样我的span元素总是在新行上。这当然是一个简单的例子。有没有办法在超文本标记语言页面中获取文本，就像它在浏览器中呈现的方式一样（不需要css规则，只是div、spans、li等元素呈现的常规方式）在Python中？
超文本标记语言解析使用JSoupJava

对于上面的html内容，我如何使用Jsoup解析并获取文本当我使用我得到了这样的东西
使用iText将超文本标记语言转换为PDF

我之所以发布这个问题，是因为许多开发人员或多或少地以不同的形式问同一个问题。我会自己回答这个问题（我是iText Group的创始人/首席技术官），这样它就可以成为“维基答案”如果堆栈溢出的“文档”特性仍然存在，那么这将是文档主题的一个很好的候选者。我正在尝试将以下HTML文件转换为PDF：在浏览器中，这种超文本标记语言如下所示： HTMLWorker根本不考虑CSS 当我使用时，我需要创建一
使用JSoup的超文本标记语言解析

我是新来的。我想解析html，但问题是我们必须在中指定的URL，我将在运行时从其他页面响应此URL。有没有办法将收到的网址传递到中？我读过这样的东西：但是我不知道如何使用它。我很想知道是否有其他方法比jsoup更好。
用REST检查超文本标记语言文档

我正在尝试使用放心来检查服务器返回的HTML文档的一些属性。演示该问题的SSCCE如下所示: 现在，此尝试以，这是由所有可能的错误大约 30 秒左右后超时！如果我用< code>xmlPathConfig()删除这一行。用()。功能(...)当特性“http://Apache . org/XML/features/disallow-DOCTYPE-decl”设置为true时，由于< code>D

使用Docx4J将超文本标记语言RTF合并到Docx

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档