当前位置: 首页 > 知识库问答 >
问题:

PDFBox:PDPage和PDPageNode之间的区别

周翰
2023-03-14

所以,我是PDFBox新手,我正在编写一个类,它使用这个库将图像添加到PDF文档现有页面上的特定坐标。

到目前为止,一切都很顺利,但有一件事让我担心。

PDDocument doc = PDDocument.load(pdfFile);
List pages = doc.getDocumentCatalog().getAllPages();
PDPage page = (PDPage) pages.get(pageNumber);

这基本上就是我获取要添加图像的特定页面的方式。我担心的是getAllPages()方法的留档指示它返回PDPage和PDPageNode对象。到目前为止,在我的测试中,我似乎只得到PDPages,所以我一直很好,但我不希望有一天出现PDPageNode并使用ClassCastException破坏我的代码。

那么,这两门课有什么区别,我该如何避免我所担心的?

共有1个答案

钱跃
2023-03-14

别担心,你会得到PDPage对象(在1.8.10中)。javadoc清楚地告诉“此方法将返回此文档中所有PDPage对象的平面列表”,PDPageNode中的源代码证实了这一点:

    for( int i=0; i<kids.size(); i++ )
    {
        // ignore duplicates (from malformed PDFs)
        if (!seen.contains(kids.get(i)))
        {
            COSBase obj = kids.getObject( i );
            if (obj instanceof COSDictionary)
            {
                COSDictionary kid = (COSDictionary)obj;
                if( COSName.PAGE.equals( kid.getDictionaryObject( COSName.TYPE ) ) )
                {
                    result.add( new PDPage( kid ) );
                }
                else
                {
                    if (recurse)
                    {
                        getAllKids(result, kid, recurse);
                    }
                    else
                    {
                        result.add( new PDPageNode( kid ) );
                    }
                }
            }
            seen.add(kids.get(i));
        }
    }

如果您刚刚开始使用PDFBox,我建议您使用2.0,API更简单:

/**
 * Returns the page at the given index.
 *
 * @param pageIndex the page index
 * @return the page at the given index.
 */
public PDPage getPage(int pageIndex)

作为普通用户,您不需要PDPageNode类。之所以使用该类,是因为有些节点不是叶子,即页面对象组织在PDF中的树中,而不是作为列表。但是getAllPages()会将这些内容作为列表提供给您。

 类似资料:
  • 问题内容: 我错放了太多次了,我想我一直忘记,因为我不知道两者之间的区别,只是一个给了我我期望的价值,而另一个却没有。 为什么是这样? 问题答案: 是的简写形式(尽管请注意,该表达式只会被计算一次。) 是的,即指定一元的到。 例子:

  • 问题内容: 因此,我有一段简单的代码可以打印出整数1-10: 然后,如果仅在第3行上更改一个运算符,它将打印出无限数量的1整数(我知道为什么会这样做)。为什么在运行第二个程序时没有出现语法错误?如果赋值运算符后面跟着一个加法运算符,它不会调用语法错误吗? 问题答案: 与相同, 只是意味着。

  • 问题内容: 有人可以解释一下 和 我不知道“确切”的含义 问题答案: 在这个例子中,什么都没有。当您具有多个具有相似名称的路径时,该参数将起作用: 例如,假设我们有一个显示用户列表的组件。我们还有一个用于创建用户的组件。的网址应嵌套在下。因此,我们的设置可能如下所示: 现在,这里的问题是,当我们转到路由器时,将通过所有定义的路由,并返回它找到的第一个匹配项。因此,在这种情况下,它将首先找到路线,然

  • 问题内容: 我很好奇printStackTrace()和toString()之间的区别是什么。乍一看,他们 似乎 做的完全相同。 码: 问题答案: 不,有重要区别!使用toString,您只有异常的类型和错误消息。使用printStackTrace()可以获得异常的整个堆栈跟踪,这对于调试非常有帮助。 System.out.println(toString())的示例: printStackTra

  • 问题内容: 我看不到两种方式之间的任何区别,@ Qualifier 始终与 @Autowired一起使用 。 VS 有人能让我知道其中的区别吗?谢谢! 问题答案: 可以单独使用。如果单独使用,将按类型进行接线。因此,如果在容器中声明了多个相同类型的bean,而又不知道要注入哪个bean,就会出现问题。结果,通过指定Bean名称(按名称进行绑定),与一起使用来阐明要实际连接的Bean 也按名称接线。