当前位置: 首页 > 知识库问答 >
问题:

XSLT将多个输入文件从hocr转换为alto xml Saxon

蔡晨
2023-03-14

在使用Saxon将多个输入文件从hocr转换为alto xml(每个输入文件都需要一个xml输出)时遇到困难,我可以一次转换一个文件,但当我尝试对多个文件使用collection()命令时,会收到错误消息“Source file collection('file:\c:?select=*(hocr))不存在”。所以我知道我使用的路径有问题,但不确定在这种情况下正确使用collection()应该是什么。任何帮助都将不胜感激。我一直在尝试的完整命令是:

java-cp saxon-he-10.1。罐子网。旧金山。撒克逊人。Transform-t-s:集合file:///c:/?select=*(hocr))-xsl:hocr to ALTO master\hocr__alto2。0.xsl-o:SaxonHE10-1J

也试过

java-cp saxon-he-10.1。罐子网。旧金山。撒克逊人。Transform-t-s:集合file:///c:/?select=_*.hocr)-xsl:hocr到ALTO master\hocr__alto2。0.xsl-o:SaxonHE10-1J

共有1个答案

松高歌
2023-03-14

命令行上的-s选项需要文件名或URI,而不是XPath表达式。

如果要调用collection()函数,它必须在XPath表达式中,通常在样式表中(尽管它也可以在命令行中使用?param=collection('s)设置的样式表参数中)file:///c:/?select=*xml')

还请注意,集合函数的参数是URI,而不是Windows文件名,并且URI从不包含反斜杠。选择参数是一个“全局”,通常以Select=*. xml的形式出现。我不知道您打算用Select=*.(hocr)做什么。

 类似资料:
  • 谈到XSLT,我是一个完全的新手,所以我很难找到解决问题的方法。 我有以下来自PeopleSoft的XML: PeopleSoft"有益地"将所有文本数据放入CDATA部分,我想删除CDATA,并将字符串放在正常的文本节点中: 有人能在我需要创建我想要的输出的XSLT上给我一个正确的方向吗?非常感谢提前

  • 我能得到php mime电子邮件解析器/解码器的帮助吗https://code.google.com/p/php-mime-mail-parser/不涉及任何安装。我甚至试过phpclasses的Zend和decoder。org,但没有帮助。我找不到如何将输入输入程序并从中获取输出,因为没有这方面的教程 我的目标:我需要将mime邮件从输入流转换为可读文本 请帮帮忙

  • 问题内容: 我正在尝试获取一个示例,该示例使用XSLT 2.0来输出工作中的多个文件。 在Java 1.6上使用Saxon B 9.7.0.1,出现此错误: input.xml transform.xml 问题答案: URI中的字符20是“文档和设置”中的第一个空格。作为快速解决方案,请尝试将文件移动到没有空格的路径。(例如,“ C:\ test”或类似的代码。)我怀疑长期的解决方法是将XSLT更

  • 我想将xml文件格式转换为另一种格式;使用XSL1.0或2.0版。 http://www.w3.org/1999/xsl/transform“version=”1.0“> 这段代码是从“struct”节点的“members”属性中提取相关ID的起点,以后只用于发出“field”节点。 xslt处理器需要解析Struct节点的'members'属性。“members”属性是字段ID的列表。 在上面的

  • 在这里你可以看到我正在处理的一些文件。 与我最相似的问题是这个问题(将一个文本文件文件夹合并到一个CSV中,每个内容都在一个单元格中),但我无法实现那里提出的任何解决方案。 我尝试的最后一个是Nathaniel Verhaaren在前面提到的问题中提出的Python代码,但我得到了与问题作者完全相同的错误(即使在实施了一些建议之后): 与我类似的其他问题(例如,Python:将多个。txt文件解析

  • 我使用的是saxon for xml到html的xslt转换,我需要两个输出文件,一个是基本html,一个是javascript文件,如果不支持js,它可以是文本文件。这是我的转换c#代码,也是xsl文档的一部分。我需要从转换后的xml输出一个html文件和一个带有脚本的javascript文件 这里是xsl文档的一部分