基本内容

优质
小牛编辑
128浏览
2023-12-01

这部分我们使用的DOM树和变量都是前一章做的那个。

假设程序员在数据模型中放置了一个XML文档,就是名为 doc 的变量。这个变量和DOM 树的根结点"document"对应。 真实的变量 doc 之后结构是非常复杂的, 大约类似DOM树。所以为了避免钻牛角尖,我们通过例子来看看如何使用。

通过名称来访问元素

这个FTL打印book的title:

<h1>${doc.book.title}</h1>

将会输出:

<h1>Test Book</h1>

正如你所看到的,docbook 都可以当作哈希表来使用。你可以按照子变量的形式来获得它们的子结点。 基本上,你用描述路径的方法来访问在DOM树中的目标(元素title)。 你也许注意到了上面有一些是假象:使用 ${doc.book.title}, 就好像我们指示 FreeMarker 打印 title 元素本身, 但是我们应该打印它的子元素文本(看看 DOM 树)。 那也可以办到,因为元素不仅仅是哈希表变量,也是字符串变量。 元素结点的标量是从它的文本子结点级联中获取的字符串结果。然而,如果元素有子元素, 尝试使用一个元素作为标量会引起错误。比如${doc.book}将会以错误而终止。

该FTL打印2个chapter的title:

<h2>${doc.book.chapter[0].title}</h2>
<h2>${doc.book.chapter[1].title}</h2>

这里,book 有两个 chapter 子元素, doc.book.chapter 是存储两个元素结点的序列。 因此,我们可以概括上面的FTL,所以它以任意chapter的数量起作用:

<#list doc.book.chapter as ch>
  <h2>${ch.title}</h2>
</#list>

但是如果只有一个chapter会怎么样呢?实际上, 当你访问一个作为哈希表子变量的元素时,通常 也可以是序列(不仅仅是哈希表和字符串),但如果序列只包含一个项, 那么变量也作为项目自身。所以,回到第一个示例中,它也会打印book的title:

<h1>${doc.book[0].title[0]}</h1>

但是你知道那里就只有一个 book 元素, 而且book也就只有一个title,所以你可以忽略那些 [0]。 如果book恰好有一个 chapter(否则它就是模糊的: 它怎么知道你想要的是哪个 chaptertitle? 所以它就会以错误而停止),${doc.book.chapter.title} 也可以正常进行。 但是因为一个book可以有很多chapter,你不能使用这种形式。如果元素 book 没有子元素 chapter, 那么 doc.book.chapter 将是一个长度为零的序列, 所以用FTL <#list ...> 也可以进行。

知道这样一个结果是很重要的,比如,如果 book 没有 chapter,那么 book.chapter 就是一个空序列,所以 doc.book.chapter??不会false,它就一直是 true!类似地,doc.book.somethingTotallyNonsense?? 也不会是 false。来检查是否有子结点,可以使用 doc.book.chapter[0]??(或doc.book.chapter?size == 0)。 当然你可以使用类似所有的空值处理操作符 (比如 doc.book.author[0]!"Anonymous" ),只是不要忘了那个 [0]

Note:

序列的大小是1的规则是方便XML包装的方便特性(通过多类型的FTL变量来实现)。 通常其他序列将不会起作用。

现在我们完成了打印每个chapter所有的 para 示例:

<h1>${doc.book.title}</h1>
<#list doc.book.chapter as ch>
  <h2>${ch.title}</h2>
  <#list ch.para as p>
    <p>${p}
  </#list>
</#list>

将会输出:

<h1>Test</h1>
  <h2>Ch1</h2>
    <p>p1.1
    <p>p1.2
    <p>p1.3
  <h2>Ch2</h2>
    <p>p2.1
    <p>p2.2

上面的FTL可以书写的更加漂亮:

<#assign book = doc.book>
<h1>${book.title}</h1>
<#list book.chapter as ch>
  <h2>${ch.title}</h2>
  <#list ch.para as p>
    <p>${p}
  </#list>
</#list>

最终,一个"广义的"子结点选择机制是: 模板列出所有示例XML文档的para

<#list doc.book.chapter.para as p>
  <p>${p}
</#list>

将会输出:

  <p>p1.1
  <p>p1.2
  <p>p1.3
  <p>p2.1
  <p>p2.2
  

这个示例说明了哈希表变量选择序列子结点的做法 (在前面示例中的序列大小为1)。在这个具体的例子中,子变量 chapter 返回一个大小为2的序列 (因为有两个 chapter),之后子变量 para 在那个序列中选择 para 所有结点的子结点。

这种机制的一个负面结果是类似于 doc.somethingNonsense.otherNonsesne.totalNonsense 这样的东西会被算作是空序列,而且你也不会得到任何错误信息。

访问属性

这个XML和原来的那个是相同的,除了它使用title属性,而不是元素:

<!-- THIS XML IS USED FOR THE "Accessing attributes" CHAPTER ONLY! -->
<!-- Outside this chapter examples use the XML from earlier.       -->

<book title="Test">
  <chapter title="Ch1">
    <para>p1.1</para>
    <para>p1.2</para>
    <para>p1.3</para>
  </chapter>
  <chapter title="Ch2">
    <para>p2.1</para>
    <para>p2.2</para>
  </chapter>
</book>

一个元素的属性可以通过和元素的子元素一样的方式来访问, 除了你在属性名的前面放置一个@符号:

<#assign book = doc.book>
<h1>${book.@title}</h1>
<#list book.chapter as ch>
  <h2>${ch.@title}</h2>
  <#list ch.para as p>
    <p>${p}
  </#list>
</#list>

这会打印出和前面示例相同的结果。

按照和获取子结点一样的逻辑来获得属性,所以上面的 ch.@title 结果就是大小为1的序列。如果没有 title 属性,那么结果就是一个大小为0的序列。 所以要注意,这里使用内建函数也是有问题的:如果你很好奇 foo 是否含有属性 bar, 那么你不得不写 foo.@bar[0]??。 (foo.@bar?? 是不对的,因为它总是返回 true)。类似地,如果你想要一个 bar 属性的默认值,那么你就不得不写 foo.@bar[0]!"theDefaultValue"

正如子元素那样,你可以选择多结点的属性。 例如,这个模板将打印所有chapter的title属性:

<#list doc.book.chapter.@title as t>
  ${t}
</#list>

探索DOM树

这个FTL将会枚举所有book元素的子结点:

<#list doc.book?children as c>
- ${c?node_type} <#if c?node_type == 'element'>${c?node_name}</#if>
</#list>

将会输出:

- text
- element title
- text
- element chapter
- text
- element chapter
- text

?node_type 的意思可能没有解释清楚。 有一些在DOM树中存在的结点类型,比如 "element""text""comment""pi"等。

?node_name 返回结点的结点名称。 对于其他的结点类型,也会返回一些东西,但是它对声明的XML处理更有用,这会在后面章节中讨论。

如果book元素有属性,由于实际的原因它可能 不会 在上面的列表中出现。 但是你可以获得包含元素所有属性的列表,使用变量元素的子变量 @@。如果你将XML的第一行修改为这样:

<book foo="Foo" bar="Bar" baaz="Baaz">

然后运行这个FTL:

<#list doc.book.@@ as attr>
- ${attr?node_name} = ${attr}
</#list>

然后得到这个输出(或者其他相似的结果):

- baaz = Baaz
- bar = Bar
- foo = Foo

要返回子结点的列表,有一个方便的子变量来仅仅列出元素的子元素:

<#list doc.book.* as c>
- ${c?node_name}
</#list>

将会输出:

- title
- chapter
- chapter

你可以使用内建函数 parent 来获得元素的父结点:

<#assign e = doc.book.chapter[0].para[0]>
<#-- Now e is the first para of the first chapter -->
${e?node_name}
${e?parent?node_name}
${e?parent?parent?node_name}
${e?parent?parent?parent?node_name}

将会输出:

para
chapter
book
@document

在最后一行你访问到了DOM树的根结点,文档结点。 它不是一个元素,这就是为什么得到了一个奇怪的名字; 现在我们不来处理它。很明显,文档结点没有父结点。

你可以使用内建函数 root 来快速返回到文档结点:

<#assign e = doc.book.chapter[0].para[0]>
${e?root?node_name}
${e?root.book.title}

将会输出:

@document
Test Book

在内建函数完整的列表中你可以用来在DOM树中导航, 可以阅读结点内建函数参考

使用XPath表达式

Note:

XPath表达式仅在Jaxen(推荐使用, 但是使用至少Jaxen 1.1-beta-8版本,不能再老了)或Apache Xalan库可用时有效。 (Apache Xalan库在Sun J2SE 1.4,1.5和1.6(也许在后续版本)中已经包含了; 不需要独立的Xalan的jar包。)

Note:

不要使用前一部分的示例XML,那里的title 是一个属性;仅对那部分使用。

如果哈希表的键使用了结点变量而不能被解释(下一部分对此精确定义), 那么它就会被当作Xpath表达式被解释。要获得XPath的更多信息, 可以访问http://www.w3.org/TR/xpath

例如,这里我们列出 title 元素(不是属性!)内容为"Ch1"的chapter的 para 元素:

<#list doc["book/chapter[title='Ch1']/para"] as p>
  <p>${p}
</#list>

将会输出:

  <p>p1.1
  <p>p1.2
  <p>p1.3

长度为1(在前面部分解释过了)的序列的规则也代表XPath的结果。 也就是说,如果结果序列仅仅包含1个结点,它也会当作结点自身。 例如,打印chapter元素"Ch1"第一段:

${doc["book/chapter[title='Ch1']/para[1]"]}

这也会输出相同内容:

${doc["book/chapter[title='Ch1']/para[1]"][0]}

XPath表达式的内容结点(或者是结点序列) 是哈希表子变量被用作发布XPath表达式的结点。 因此,这将打印和上面例子相同的内容:

${doc.book["chapter[title='Ch1']/para[1]"]}

请注意,现在你可以使用0序列或多(比1多)结点作为内容, 这只在程序员已经建立 FreeMarker 使用Jaxen而不是Xalan时才可以。

也要注意XPath序列的项索引从1开始,而FTL的序列项索引是用0开始的。 因此,要选择第一个chapter,XPath表达式是 "/book/chapter[1]", 而FTL表达式是 book.chapter[0]

如果程序员设置 FreeMarker 使用Jaxen而不是Xalan, 那么 FreeMarker 的变量在使用XPath变量引用时是可见的:

<#assign currentTitle = "Ch1">
<#list doc["book/chapter[title=$currentTitle]/para"] as p>
...

请注意,$currentTitle 不是 FreeMarker 的插值, 因为那里没有 {}。 那是XPath表达式。

一些XPath表达式的结果不是结点集,而是字符串,数字或者布尔值。 对于那些XPath表达式,结果分别是FTL字符串,数字或布尔值变量。 例如,下面的例子将会计算XML文档中 para 元素的总数, 所以结果是一个数字:

${x["count(//para)"]}

将会输出:

5

XML命名空间

默认来说,当你编写如 doc.book 这样的东西时, 那么它会选择属于任何XML命名空间(和XPath相似)名字为 book 的元素。如果你想在XML命名空间中选择一个元素, 你必须注册一个前缀,然后使用它。比如,如果元素 book 是命名空间 http://example.com/ebook, 那么你不得不关联一个前缀,要在模板的顶部使用 ftl 指令ns_prefixes 参数:

<#ftl ns_prefixes={"e":"http://example.com/ebook"}>

现在你可以编写如 doc["e:book"] 的表达式。 (因为冒号会混淆 FreeMarker,方括号语法的使用是需要的。)

ns_prefixes 的值作为哈希表, 你可以注册多个前缀:

<#ftl ns_prefixes={
    "e":"http://example.com/ebook",
    "f":"http://example.com/form",
    "vg":"http://example.com/vectorGraphics"}
>

ns_prefixes 参数影响整个 FTL 命名空间。 这就意味着实际中,你在主页面模板中注册的前缀必须在所有的 <#include ...> 的模板中可见,而不是 <#imported ...> 的模板(经常用来引用FTL库)。从另外一种观点来说, 一个FTL库可以注册XML命名空间前缀来为自己使用,而前缀注册不会干扰主模板和其他库。

要注意,如果一个输入模板是给定XML命名空间域中的, 为了方便你可以设置它为默认命名空间。这就意味着如果你不使用前缀, 如在 doc.book 中,那么它会选择属于默认命名空间的元素。 这个默认命名空间的设置使用保留前缀 D,例如:

<#ftl ns_prefixes={"D":"http://example.com/ebook"}>

现在表达式 doc.book 选择属于XML命名空间 http://example.com/ebookbook 元素。 不幸的是,XPath不支持默认命名空间。因此,在XPath表达式中, 没有前缀的元素名称通常选择不输入任何XML命名空间的元素。然而, 在默认命名空间中访问元素你可以直接使用前缀D,比如: doc["D:book/D:chapter[title='Ch1']"]

请注意,当你使用默认命名空间时,那么你可以使用保留前缀 N 来选择不属于任意结点空间的元素。比如 doc.book["N:foo"]。这对XPath表达式不起作用, 上述的都可以写作 doc["D:book/foo"]

不要忘了转义!

我们在所有的示例中都犯了大错。我们生成HTML格式的输出, HTML格式保留如 <& 等的字符。所以当我们打印普通文本(比如标题和段落)时, 我们不得不转义它,因此,示例的正确版本是:

<#escape x as x?html>
<#assign book = doc.book>
<h1>${book.title}</h1>
<#list book.chapter as ch>
  <h2>${ch.title}</h2>
  <#list ch.para as p>
    <p>${p}
  </#list>
</#list>
</#escape>

所以如果book的标题是"Romeo & Julia", 那么HTML输出的结果就是正确的:

...
<h1>Romeo &amp; Julia</h1>
...