当前位置: 首页 > 知识库问答 >
问题:

String与Stanford NLP词的转换

寿飞飙
2023-03-14

我试图使用Stanford Core NLP的Stemmer类(https://github.com/stanfordnlp/corenlp/blob/master/src/edu/Stanford/nlp/process/Stemmer.java)进行词根挖掘。

String stemmedterm=CoreNLPKeyPhraseStemmer.keystemming(term);  

在CorenlpKeyPhraseStemmer的keystemming方法中进行词干的主要工作由以下一行完成:

String s1= s.stem(token.word());

但是,我的问题是,令牌的类型必须是word,即edu.stanford.nlp.ling.word(https://nlp.stanford.edu/nlp/javadoc/javanlp/index.html?edu/stanford/nlp/ling/word.html),同时从另一个类调用keystemming。有什么方法可以将提供的字符串转换为word吗?

共有1个答案

段阳夏
2023-03-14

阅读Word类的代码,它似乎在其构造函数中支持String,所以我相信您只需做以下操作

Word(token.stem())

获取带词根标记的word对象。

 类似资料:
  • 本文向大家介绍Java Date与String的相互转换详解,包括了Java Date与String的相互转换详解的使用技巧和注意事项,需要的朋友参考一下 Java Date与String的相互转换详解 前言: 我们在注册网站的时候,往往需要填写个人信息,如姓名,年龄,出生日期等,在页面上的出生日期的值传递到后台的时候是一个字符串,而我们存入数据库的时候确需要一个日期类型,反过来,在页面上显示的时

  • String转换到Byte数组时,每个byte(byte类型其实就是uint8)保存字符串对应字节的数值。 注意Go的字符串是UTF-8编码的,每个字符长度是不确定的,一些字符可能是1、2、3或者4个字节结尾。 示例1: package main import "fmt" func main() { s1 := "abcd" b1 := []byte(s1) fmt.Pri

  • 我的maven依赖结构如下: 我的代码运行良好,如下所示: 但是,当我将openie添加到管道中时,代码失败了。 有人能在这方面给我建议吗?

  • 本文向大家介绍Java中Date与String相互转换的方法,包括了Java中Date与String相互转换的方法的使用技巧和注意事项,需要的朋友参考一下 我们在注册网站的时候,往往需要填写个人信息,如姓名,年龄,出生日期等,在页面上的出生日期的值传递到后台的时候是一个字符串,而我们存入数据库的时候确需要一个日期类型,反过来,在页面上显示的时候,需要从数据库获取出生日期,此时该类型为日期类型,然后

  • 本文向大家介绍Java实现String与StringBuilder相互转换,包括了Java实现String与StringBuilder相互转换的使用技巧和注意事项,需要的朋友参考一下 String类型是Java中的一个类,它用来表示一组字符。 Java中的字符串是不可变的,一旦创建,就不能更改字符串的值。 由于字符串是不可变的,因此如果您尝试重新分配字符串的值。它的引用将指向新的String对象,

  • 问题内容: 我想 在Databricks中将转换为。 有人可以帮忙吗? 背景 (也欢迎一个更好的解决方案):我有一个Kafka流,经过一些步骤后,该流变成了2列数据帧。我想将其放入Redis缓存中,第一列作为键,第二列作为值。 更具体地说 ,输入的类型是:。我尝试放入Redis,如下所示: 错误消息如下所示: 我已经玩过一些想法(例如function ),但是没有一个帮助。 问题答案: 如果要将行