链接到斯坦福情绪分析页面 “使用PTB格式的数据集,可以使用以下命令重新训练模型:” 来自dev.txt的示例(前导的4代表5...4/5正极性)
我设法获得了一个已经配置好的最小java示例,该示例使用OpenNLP组件作为管道。 代码如下所示: 摘自opennlptextanalyzer.xml: 是获取值的开始,但是由于UIMA拥有基元类型的类,即使是注释类中的toString方法的源代码读起来也像是一记耳光。 哪里可以找到使用基本UIMA的java代码,哪里有好的教程(除了框架本身的javadoc)?
我是Java和Stanford NLP工具包的新手,并试图在一个项目中使用它们。具体地说,我尝试使用Stanford Corenlp toolkit来注释文本(使用Netbeans而不是命令行),并尝试使用http://nlp.Stanford.edu/software/Corenlp.shtml#Usage上提供的代码(使用Stanford Corenlp API)。问题是:有人能告诉我如何在文
我正计划建立一个聊天机器人,它可以得到用户的输入,并分析和调用不同的web服务在Java。例如, 对于第一个,它必须识别它是一个检索请求,因为它是“get”调用,它是关于书和日期的。在第二个文本需要提取关键词“书籍”和出版物名称“ABC”。第三个是不同的,它是一个创建带有姓名和地址的客户请求调用。 由于我更舒适的与Java,我正在寻找NLP可以实现以上。在互联网上,我找到了更多关于OpenNLP和
Stanford NLP是否为提供了一种训练方法,使其能够用自己的语料库进行训练,并创建自己的句子拆分模型? 我正在与德语句子工作,我需要创建我自己的句子拆分任务的德语模型。因此,我需要训练句子拆分器。 我有办法做到吗?
我使用Stanford NLP文本分类器(ColumnDataClassifier)从我的Java代码。我有两个主要问题。
在stanford core nlp我已安装java运行时环境的文件夹中运行命令java-MX4G-CP“*”edu.stanford.nlp.pipeline.StanfordCorenlpServer-port 9000-timeout 15000时,出现以下错误: 无效的最大堆大小:-XMX4G指定的大小超过了可表示的最大大小。错误:无法创建Java虚拟机。错误:发生致命异常。程序将退出。
我尝试了使用stanford nlp python软件包和live demo对tweet文本进行情感分析,但结果不同。python包的结果是肯定的,而live demo的结果是否定的。 对于python包,我下载stanford-corenlp-4.0.0并安装py-corenlp,基本按照本答案中的说明:Stanford nlp for python,代码如下所示: 现场演示: 现场演示结果的屏
我想使用斯坦福大学的NLP服务器与德语文本。我测试了http://corenlp.run/,它在德语中运行良好。如果我在自己的机器上用 java -mx4g -cp “*” edu.stanford.nlp.pipeline.StanfordCoreNLPServer [port] [超时] 它只适用于英语。如果我选择德语,我会收到错误消息 无法处理传入的注释 命令行显示: java.util.P
我想做的只是找到任何给定字符串的情绪(积极/消极/中性)。在研究中,我遇到了斯坦福大学的NLP。但可悲的是它在爪哇。对于如何使它适用于Python有什么想法吗?
我有138k的用户反馈记录,我想对这些记录进行分析,以了解用户最常说的话的大致模式。每一个都有1-5颗星的评级,所以我不需要做任何情绪分析。我最感兴趣的是将数据集拆分为 我遇到的一个关键问题是,我希望看到很多n-gram。我知道其中一些,如“HOV车道”、“拼车车道”、“绕道时间”、“让路”等,但我也希望通过编程来检测常见的双向和三向图。我一直在玩弄Spacy,但它似乎没有任何能力在语料库级别上进
我从几个网络搜索中拼凑出以下内容。我可以让简单的Java regex与之匹配,但在使用NER时,我没有尝试过任何匹配(所有这些都是从web搜索中复制来的示例,并稍微调整了一下)。 为了清晰起见,请编辑:(下面代码中的中的成功/失败为true/false。) 我不知道我是否需要明确地提到某个模型或注释或其他东西,或者我是否遗漏了其他东西,或者我是否只是以完全错误的方式处理它。
任何带有工作示例的答案都会很棒。