我一直在使用Stanford POS Tagger标记句子中的词性。我从stackoverflow上的留档和其他问题中学到的是,下面的代码给出了句子的POS标记
MaxentTagger tagger = new MaxentTagger("./left3words-wsj-0-18.tagger");
String tags=tagger.tagString(Summary);
但我想要的是获得单个单词的POS标签。一种可能的方法是分解输入字符串并逐字逐句地向Tagger提供输入,但它似乎并不优雅,我认为它增加了出错的机会。Javadoc说应用函数可以返回标记单词的数组列表,但我无法成功调用此函数。任何想法,我怎么能得到一个字符串的单个单词的POS标记使用斯坦福POS标记器要么通过应用函数要么通过一些其他功能??
看起来你应该使用标记文本()和标签Sentence()来获取标记单词的列表。查看标记器演示.java包含在后记分发中。
我正在尝试编写一个java程序,它可以反转句子中的每个单词。例如,如果句子是“Hello World.Hello Java”,输出应该是“olleH dlroW.olleH avaJ”。我可以反转,但我得到的输出是“olleH.dlroW olleH.avaJ”,即使是圆点也会反转,这是不应该发生的。谁能帮我修一下吗? 谢谢你!! 我试过这样的方法: 预期输出:olleH dlro. olleH
问题内容: 我有以下两个带有POS标签的字符串: Sent1 :“ 类似作家专业或 词组工作方式的 东西真的很酷。 ” [(’something’,’NN’),(’like’,’IN’),(’how’,’WRB’),(’writer’,’NN’),(’pro’,’NN’) ,(或),(CC),(短语学,NN),(作品,NNS),(would,MD),(be,VB) ,(’really’,’RB’)
问题内容: 我如何从输出中仅选择前10个字? 问题答案: 要增加对其他分词符(例如逗号和破折号)的支持,可以提供一种快速的方法,并且不需要拆分字符串: 作为Pebbl提到,PHP不处理UTF-8或Unicode那么好,所以如果这是一个问题,那么你可以替换为与对。
我能够检查我输入的单词是否是回文。但是我怎么让它检查整个句子。比如:一个人,一个计划,一只猫,一只火腿,一头牦牛,一个山药,一顶帽子,一条运河——巴拿马! 这是我的回文: 输出: 输入一个句子:一个男人,一个计划,一只猫,一个火腿,一头牦牛,一个山药,一顶帽子,一条运河! 这句话不是回文 //这不也是回文吗?这就是我想说的。我想输入一整句话。 然而,如果我只做一个词: 输入一个句子:abccba
问题内容: 文字为: 我只想得到 我试过了 : 但这给了我: 问题答案: 正则表达式是不必要的。只需使用或即可。
我正在尝试编写我的第一个Elasticsearch分析插件,我从github中找到了一个可扩展的标准Analyzer插件项目:Elasticsearch分析standardext,在该项目中它提供了以下代码: 这里是链接 我想知道如何获得这些单词边界的字符类。 我问有问题的作者:如何获得单词边界“字符类”?#2,但是作者似乎不会回答我的问题。 我尝试阅读Unicode文本分段文档:https://