当前位置: 首页 > 知识库问答 >
问题:

从类“Parse”opennlp获取文本

葛承德
2023-03-14

我有一个解析树,它是opennlp中类parse的对象。我想打印解析树中的文本。例如,考虑以下句子:Wikipedia是一个由非营利维基媒体基金会支持的合作编辑、多语言、免费的互联网百科全书 。我已经确定了句子中的名词短语:

 (NP (NNP Wikipedia))
 (NP (NP (DT a) (RB collaboratively) (JJ edited,) (JJ multilingual,) (JJ free) (NNP    Internet) (NN encyclopedia)) (VP (VBN supported) (PP (IN by) (NP (DT the) (JJ non-profit) (NNP Wikimedia) (NNP Foundation.)))))
 (NP (DT a) (RB collaboratively) (JJ edited,) (JJ multilingual,) (JJ free) (NNP Internet)  (NN encyclopedia))
 (NP (DT the) (JJ non-profit) (NNP Wikimedia) (NNP Foundation.))

我想输出列表<代码>[“维基百科”,“合作编辑…”,“非营利维基媒体基金会”]Parse中的getText方法返回整个句子,而不仅仅是与解析树关联的字符串。有没有直接在OpenNLP中实现的方法?

共有2个答案

公羊曜灿
2023-03-14

您是否尝试过使用方法Parse.getUNICEF()?这将返回一个包含所有子级的Parse数组。从那里您可以使用getLabel()找到要打印出来的Parse对象。

南门嘉
2023-03-14

我找到了解决方案,函数是:Parse。getCoveredText()

 类似资料:
  • 我使用组块来标记数据,并从文本中获取位置。最初,我尝试从next中提取名词短语,当我们使用名词短语名称(也被称为名词短语)时,它无法使用。然后我转移到核心nlp的位置,我试着运行下面的代码 InputStream inputStreamTokenizer=new FileInputStream("文本文档中的D:\project\关系提取\Libraray\解析/en-token.bin");To

  • 我正在尝试使用PHP从网页收集文本,这样当该网站上的文本更新时,它也会自动更新。 以网站http://www.roblox.com/CW-Ultimate-Amethyst-Addiction-item?id=188004500为例——在类中,有一个数字说R$20,003——我的目标是从Roblox获取文本到我的网站。 我已尝试使用该代码执行此操作,但无效-我遇到以下错误: 警告:file_get

  • 我只需要从远程csv文件中提取头文件。 我目前的方法如下: Papa parse有一个方法来流式传输数据,并单独查看每行,这很好,我可以使用parser.abort()终止流,以防止它在第一行之后继续,如下所示: 这很好,但因为我使用的是远程文件,它必须下载数据才能读取。即使代码在第一行被解析后将控件释放回浏览器,但在解析找到第一行并提供我所需的信息后,下载仍会持续很长时间,尤其是对于大型文件,在

  • 我正在尝试使用OpenNLP对发票进行分类。根据它的描述,我将它分为两类。我已经建立了一个包含20K描述的培训文件,并将每个描述标记到正确的类中。 培训数据如下所示(第一列是代码,我将其用作类,第二列是发票描述): 使用OpenNLP的Document分类器,我实现了98.5%的正确率。但是,为了提高效率,我取了错误的分类文档并用它来扩展训练数据。 例如,当我第一次运行它时,“MOTONETA I

  • 当我执行时,它也打印和,我如何在Python中使用selenium只获取示例文本?

  • 问题内容: 通常,我见过人们像这样使用类文字: 但是,如果类型是通用类型,例如List,该怎么办?这可以正常工作,但由于应将List参数化,因此发出警告: 那么为什么不添加一个<?>呢?好吧,这会导致类型不匹配错误: 我想像这样的事情会起作用,但这只是一个普通的语法错误: 如何获得Class >静态信息,例如使用类文字? 我可以使用,以摆脱在第一个例子中所造成的非参数使用列表,警告的,但我宁愿不要