当前位置: 首页 > 知识库问答 >
问题:

在Pentaho中清除字符串中的错误XML字符

诸葛奇玮
2023-03-14

问题是:通过web/apps/文件交换接收错误的XML。

文本中显示了字符SUB,并且从XML获取数据步骤将无法读取它,说明在文档的元素内容中发现了无效的XML字符(Unicode: 0x1a)。

共有1个答案

晏沈义
2023-03-14

在这篇文章中找到了解决方案。

我不需要使用答案中包含的整个JavaScript函数,只需要使用XML中不允许使用的部分字符。

我所做的是在“修改的Java脚本值”中使用一个简单的Replace()函数

var str=result.replace(/[^\x09\x0A\x0D\x20-\xFF\x85\xA0-\uD7FF\uE000-\uFDCF\uFDE0-\uFFFD]/gm,");

这清除了整个XML中的错误字符,并使整个XML可读。

 类似资料:
  • 问题内容: 如何在Python 2.6中删除XML字符串中的空格和换行符?我尝试了以下软件包: etree:此代码段保留原始空格: 我不能使用将提供参数的Python 2.7 。 渺小:一样: 问题答案: 最简单的解决方案可能是使用lxml,您可以在其中设置解析器选项以忽略元素之间的空白: 这可能足以满足您的需求,但是有些警告是安全的: 这只会删除元素之间的空格节点,并尽量不要删除内容混合的元素内

  • 本文向大家介绍python清除字符串里非字母字符的方法,包括了python清除字符串里非字母字符的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了python清除字符串里非字母字符的方法。分享给大家供大家参考。具体如下: 希望本文所述对大家的Python程序设计有所帮助。

  • 本文向大家介绍python清除字符串里非数字字符的方法,包括了python清除字符串里非数字字符的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了python清除字符串里非数字字符的方法。分享给大家供大家参考。具体如下: 希望本文所述对大家的Python程序设计有所帮助。

  • 问题内容: 我正在使用“带有CSV和SOAP / xml请求的Jmeter”。我的测试在80个数据集中运行,并且CSV中的某些字段对于测试问题必须为空。 我的JMeter构建:-ThreadGroup -CSV数据-SOAP / XML -XPathExtractor-结果 CSV,例如矩阵表,多行和多列。 SOAP / XML 我的问题:当Jmeter替换了变量时: 当某些为空时一切都很好 系统

  • 问题内容: 如果我有一个字符串列表,例如: 为了摆脱每个字符串中的所有s,我该怎么办?我尝试在for循环中使用或,但是它无法像正常字符串(不在列表中)那样工作。有人有建议吗? 问题答案: 尝试这个:

  • 问题内容: 我有像这样的字符串“ aaaabbbccccaaddddcfggghhhh”,我想删除重复的字符,得到像这样的字符串“ abcadcfgh”。 一个简单的实现是: 使用正则表达式是否可能有更好的实现? 问题答案: 你可以这样做: 正则表达式使用反向引用和捕获组。 正常的正则表达式是,但是您必须在Java中使用另一个反斜杠来使反斜杠转义。 如果您想要重复的字符数: 演示版