我有一个NLP任务,我需要确保多个句子的一个段落至少包含一个结构良好的问题,我正在使用OpenNLP生成段落中的解析树。我的问题是:
1-有没有一种方法可以为一个结构合理的问题获取可能的解析树列表。
2.如何比较两个解析树
谢谢
你自己已经回答了这个问题。你只需要获取包含不同类型问题的数据集,然后进行处理。
>
获取不同类型的问题并解析相应的树。以某种格式获取所有输出解析树,以便在下一步中使用。
说到比较解析树,基本上就是比较文本。这是一项非常简单的任务。
但是很明显,如果你直接玩文本文件,这样做会花费更长的时间和内存。为此,将标准问题的解析树转换并保存为二进制,与下一步连接时,这将花费更少的时间和内存。
希望这对你有帮助,祝你一切顺利!
OpenNLP是一个关于自然语言处理的Apache项目。NLP程序的目的之一是解析一个句子,给出其语法结构的树。例如,句子“天空是蓝色的”可能被解析为 其中是句子,是名词短语,是动词短语。等效地,上面的树可以写成一个带括号的字符串,如下所示: 我试图使用OpenNLP从句子中获取带括号的字符串,但我无法让示例代码正常工作。 特别是,我正在遵循本教程的最后一部分,我的代码在初始化时卡住了。 我已经从
前面的章节重点关注词:如何识别它们,分析它们的结构,分配给他们词汇类别,以及获得它们的含义。我们还看到了如何识别词序列或n-grams中的模式。然而,这些方法只触碰到支配句子的复杂约束的表面。我们需要一种方法处理自然语言中显著的歧义。我们还需要能够应对这样一个事实,句子有无限的可能,而我们只能写有限的程序来分析其结构和发现它们的含义。 本章的目的是要回答下列问题: 我们如何使用形式化语法来描述无限
我很难解析JSON的某些内部部分(使用Moshi),这些内部部分可能变化很大,并且高度非结构化。总体看来是: 和数据类结构如下所示: “DataItem”的模式变化很大。看起来Moshi codegen支持适配器,可能允许手动解析这些内部数据类,但我没有找到正确的教程或示例。理想情况下,我希望解析整个响应,就像解析一个定义良好的JSON一样。 以下是我如何使用改装/摩什 我如何实现这一点?任何示例
我正在试用OpenNLP句子检测工具。文本在一个文件-para3中。txt。内容: 我使用以下命令运行此命令: 我得到如下输出: 理想情况下,我会看到三句话作为输出: 现在,如果我尝试其他句子,其中“句号”或“句号”出现,句子检测就会发生。一个人可能会猜到文本中有3个句子,但是如何通过OpenNLP完成呢?NLP的哪些工具可以在这里提供帮助???句子检测的下一个层次是什么?
我正在使用opennlp的Parse模型来解析一行输入,我的代码: 如果我的输入是p.toString显示,但p.toString显示 我怎样才能让它和p.show一样?
我试图使用官方OpenNLP网站手册示例来训练一个新模型,以下是示例: 问题出在2º线上, 帮我说:不赞成。改用PlainTextByLineStream(InputStreamFactory,Charset)。但是我不知道如何使用这个构造函数。我想举一个例子,使用同一个语料库文件使用这个未弃用的构造函数。 我已经编写了下一段代码,使用opennlp帮助和两种使用train方法的方法,不推荐的和建