当前位置: 首页 > 知识库问答 >
问题:

如何用Docx4J获取Word 2010文档中字符串的行号、页号

卓致远
2023-03-14

注:1)有两个空白页,第3页和第4页。2)页末和页首没有段落。

共有1个答案

汤玉宸
2023-03-14

您需要的是一个页面布局模型,因为为了准确地确定页面或行上的内容,您需要考虑映射的纸张大小、页眉、页脚、排水沟、边距、字体和大小、行高等等。

这不是docx4j所具备的,所以您需要想出一些东西(基本的单词计数会更简单:例如,您可以计数文档中的所有text对象)。

一种方法可能是考虑docx4j中的PDF呈现功能是如何工作的。请看一下docx4j中的FOP呈现代码,它至少可以为重新映射页面提供一些线索:

 类似资料:
  • 本文向大家介绍如何在Python中获取文档字符串?,包括了如何在Python中获取文档字符串?的使用技巧和注意事项,需要的朋友参考一下 文档字符串是文档字符串,它是字符串文字,它出现在类,模块,函数或方法定义中,并被写为第一条语句。 Doc字符串有两种类型: 单行文档字符串 多行文档字符串 这些主要用于DataScience  /机器 学习 编程中。 单行文档字符串 这种类型的Doc字符串适合一行

  • 问题内容: 如何获取字符串中的括号值。 我只需要AED文字。谢谢 问题答案: 编译并打印“ AED”。甚至适用于多个括号: 正则表达式表示: :字符 :开始比赛组 :以下字符之一 :不是以下字符 :与前面的一样,这表示“除” 以外的所有字符 :集合中的其他内容之一 :停止比赛组 :字面量闭式括号

  • 问题内容: 我有一个Java程序,旨在考虑xml dom并将其写入字符串。我正在使用这些软件包:和 所以我有,,对象… 有没有办法在一个调用中获取代表我的xml dom的字符串? 问题答案: 它不是一个电话,而是: setOutputProperty方法使字符串输出更漂亮,因此可以将其取出。

  • 如何在Go中获取字符串的字符数? 例如,如果我有一个字符串“hello”,该方法应该返回5。我看到返回字节数,而不是字符数,因此返回2而不是1,因为在UTF-8中用两个字节编码。