当前位置: 首页 > 知识库问答 >
问题:

XSLT 2.0函数的输入文件编码unparsed-text()

南宫凡
2023-03-14

假设我有这个文件。md编码为UTF-8(md表示降价格式)

Hello world
This text is encoded in UTF-8.

然后我使用函数unparsed-text('file.md','UTF-8')来处理它。这就像一个魅力。

当(比方说)我使用我的母语(捷克语)特定字符时,就会出现问题,例如,thisfile2。md

Hello world
This character "š" is read like "sh" in english.  

在unparsed-text()中使用相同的编码参数,我得到错误:

XTDE1200:无法读取输入文件file:/C:/file2。md(java.nio.charset.MalformedInputException):输入长度=1

<代码>文件2。md具有与文件相同的编码UTF-8。md,捷克字符在此字符集中,但XSLT处理器不接受它。如果我将编码参数更改为windows-1250,即未分析的文本('file2.md','windows-1250'),效果会很好。

所以问题是,为什么我会出现这个错误?它是否与输入文件扩展名为. md(. txt有效)的事实有关。有办法吗?我真的希望能够在我的xsl样式表中使用与提供的输入文件相同的编码。

感谢您的回答。

共有1个答案

咸疏珂
2023-03-14

正如Martin所说,您提供的证据表明该文件是在Windows-1252中编码的,因此unparsed-text('file.md','utf-8')拒绝它是正确的。

 类似资料:
  • 问题内容: 我有一个基本的HTML表单,可以从中获取在Firebug中检查的一些信息。 我唯一的问题是,在将文件数据发送到服务器之前,我试图对文件数据进行 base64 编码,然后将其以该格式保存到数据库。 在Javascript + jQuery中: 我有一些基于可用javascript的操作: .getAsBinary()、. getAsText()、. getAsTextURL 但是,这些都

  • 函数功能:在控件中输入文字 函数方法 widget.setText(wid,text) 参数 类型 必填 说明 wid userdata 是 控件对象 text string 是 需要输入的文字 函数用例 --脚本页面 点击新建脚本按钮 输入文字 --除控件函数外请勿将其他积木编程函数用于触动精灵,同理请勿将触动精灵函数用于积木编程 mSleep(1000) wid = widget.find({

  • 所以我一直在开发一个基本的Java应用程序,它通过缓冲读取器从文本文件中读取数据,并将其填充到swing JTable中。 代码在NetBeans中运行良好,特殊字母在控制台和表单本身中都能完美显示。 问题是在我构建项目并将其放在我的硬盘驱动器的某个地方并通过生成的. jar运行它之后,它会弄乱文件中的读取,并且出现奇怪的字母...... 我试过这些: ... 和 我希望你能帮助我。

  • 您正尝试解压一个 被加密的 文件或查看加密文件的内容,请输入密码或是取消解压。 在一次解压多个压缩文件时,您可以启用"用于所有压缩文件"选项把输入的密码应用给所有的压缩文件。如果仅处理一个文件则此选项无效。此选项的其它可能的操作是跳过加密的压缩文件。只要输入一个空的字符串作为密码并设置“用于所有压缩文件”您可以使用它对所有压缩文件只输入一次密码。 如果您已经保存了一些密码,您可以使用密码对话框中输

  • 我试图调用一个类似如下的实度函数: 使用web3j,我将创建与下面类似的函数,但是我不太确定如何表示以Solidity表示的结构的顺序。 关于我应该如何表示结构的任何指示? 谢了。

  • 我已经为用户创建了多个文件上传选项。我想对上传的文件进行编码和解码...在这里,我编写了将图像转换为base64字符串的程序...如何使用 base64 对文件进行编码和解码。 我的代码是 在控制台中我打印文件的编码值…如何使用控制台输出进行解码。