如果消息正文是文本消息(纯文本或XML),则可以像下面这样提取它。
String msgBody = ((TextMessage) message).getText();
JMS2.0API在message
接口中公开了附加的方法
。
如果您的消息代理或源符合JMS2.0,那么我们将以一种更干净的方式提取消息正文,而不进行对象转换,如下所示。
String msgBody = message.getBody(String.class);
问题内容: 我正在用Java开发一个应用程序,该应用程序可以从不同的网页获取文本信息并将其汇总为一页。例如,假设我在不同的网页(例如印度教,印度时报,政治家等)上都有新闻。该应用程序应该从这些页面的每个页面中提取要点,并将它们整合为一条新闻。该应用程序基于Web内容挖掘的概念。作为该领域的初学者,我不知道从哪里开始我浏览了一些研究论文,这些论文将消除噪声作为构建此应用程序的第一步。 因此,如果给我
我需要从如下节点中提取文本: 我需要建立: 仅返回div的所有内容。-不在子元素内的所有内容。两者都错了。迭代子节点会忽略文本节点。 文本节点-某些文本
问题内容: 我正在寻找一种使用jdk或其他库从网页(最初为html)提取文本的方法。请帮忙 谢谢 问题答案: 尽可能使用HTML解析器;Java有很多可用的。 或者您可以像许多人一样使用正则表达式。但是,通常不建议这样做,除非您进行的处理非常简单。 相关问题 Java HTML解析 哪种HTML解析器最好? 任何好的Java HTML解析器? 文字提取: 从HTML Java提取文本 标签剥离:
问题内容: 这是我的问题。我有一个html内容:innerText我需要提取“ innerText”。在Jsoup中尝试此操作时,我发现当由Jsoup解析时,内部文本超出了定位标记。 这是我的代码 输出: 为什么“ innerText”移到了定位标记之外? 问题答案: 您可以通过调用元素上的方法来访问文本。 顺便说一句 使用您发布的代码(和JSoup 1.8.1)产生以下输出
本章介绍如何使用Java从Word文档中提取简单文本数据。 如果要从Word文档中提取元数据,请使用Apache Tika。 对于.docx文件,我们使用类org.apache.poi.xwpf.extractor.XPFFWordExtractor,它从Word文件中提取并返回简单数据。 同样,我们有不同的方法从Word文件中提取标题,脚注,表格数据等。 以下代码显示如何从Word文件中提取简单
下面的示例将展示在将HTML String解析为Document对象后使用方法获取文本。 语法 (Syntax) Document document = Jsoup.parse(html); Element link = document.select("a").first(); System.out.println("Text: " + link.text()); 哪里 docume