当前位置: 首页 > 知识库问答 >
问题:

无法使用正则表达式提取器提取jmeter中已编码的PDF数据?

顾嘉德
2023-03-14

当我在调试采样器中看到时,我的变量中没有任何东西。

共有1个答案

刘兴朝
2023-03-14

如果要将文本从PDF文件提取到JMeter变量中,唯一的方法是使用JSR223 PostProcessor和PDFBox

>

  • 下载tika-app.jar并将其放入JMeter类路径
  • 重新启动JMeter以拾取。jar
  • 添加JSR223 PostProcessor作为返回PDF的请求的子级
  • 将以下代码放入“脚本”区域:

    def handler = new org.apache.tika.sax.BodyContentHandler();
    def metadata = new org.apache.tika.metadata.Metadata();
    def inputstream = new ByteArrayInputStream(prev.getResponseData());
    def context = new org.apache.tika.parser.ParseContext();
    def pdfparser = new org.apache.tika.parser.pdf.PDFParser();
    pdfparser.parse(inputstream, handler, metadata, context);
    vars.put('pdfText', handler.toString())
    

    更多信息:

      null

  •  类似资料:
    • 问题内容: 我只是想使用jmeter提取json响应数据,但不能这样做。 我得到类似的东西。 我正在尝试但无法获得。 谁能帮我使这个工作正常? 问题答案: 外观在响应中是否唯一(仅出现一次)? 如果是这样,您可以简单地使用正则表达式提取器添加到HTTP请求中,该请求器返回json响应,并带有如下正则表达式: `` 并将进一步提取的值称为。 但是,如果您的情况更加复杂,并且在json响应中出现了几种

    • 我试图创建一个线程组,使登录到我们的系统中。为此,我需要包含 每次打开页时生成的标记,并保存在隐藏值中。因此,通常的解决方案,如响应,执行正则表达式提取器,并使值变量和it稍后请求,对我来说不起作用。因为标记与和时不同。 然后,我找到了一个并行控制器,这对我来说可能是一个解决方案。但我找不到办法。另外,没有我的母语(日语)的参考资料。我想要标记到某些登录操作,所以我需要用并行控制器做正则表达式提取

    • 我想知道为什么JMeter中的正则表达式提取器在参数化后不提取数据。响应消息:内部服务器错误 添加的表达式包括: > name=“\uuuueventvalidation”id=“\uuueventvalidation”value=“(.?)” name=“\uuuu VIEWSTATE”id=“\uuuu VIEWSTATE”value=“(.?)”

    • 问题内容: 我有一些粗略的字符串: 我想使用Java Regex类提取[some number]中的文本。 我大致知道我想使用什么正则表达式(尽管欢迎所有建议)。我真正感兴趣的是Java调用以获取正则表达式字符串并将其用于源数据以产生[some number]的值。 编辑:我应该补充一点,我只对单个[一些数字](基本上是第一个实例)感兴趣。源字符串很短,我不会寻找[some number]的多次出

    • 我试图使用JMeter登录到ASP.NET web窗体应用程序。我将登录序列记录到*.jmx文件中,现在尝试使用正则表达式提取器后处理器提取__ViewState、__ViewStateGenerator和__EventValidation隐藏输入。 在这三种情况下,JMeter提取的是我想要提取的变量的名称(例如“${viewstate}”),而不是我想要提取的值。下面是当我查看ViewResu

    • 我有一个JMeter脚本,它处理一系列请求,每个请求都不同,get,post,等等。 每个请求从服务器返回一个自定义标头,标头中有一些数值。这个头返回它在服务器端所花费的实际处理时间(没有延迟/HTTP开销) 我可以添加一个正则表达式提取器来毫无问题地从头部获取该值,但我希望所有请求都重复这样做。 在JMeter中跟踪正则表达式提取器的结果 谢谢你。