我正在寻找一种Java驱动的解决方案来满足分析句子以记录关键字是肯定还是否定使用的要求。
即关键词可能是’白菜’和句子:
我喜欢白菜而不喜欢豌豆
我想要某种Java文本分析器将此记录为肯定。可以使用lucene(休眠搜索)库吗?
有什么想法吗?
您正在寻找“情感分析”。LingPipe是一种可能,他也与竞争对手保持友好联系。Jeff
Dalton 的博客中还提供了大量自然语言处理工具。
分析你的文本 问题到这里就变得稍微复杂了一些。传入到Document中的数据是如何转变成倒排索引的?查询语句是如何转换成一个个Term使高效率文本搜索变得可行?这种转换数据的过程就称为文本分析(analysis) 文本分析工作由analyzer组件负责。analyzer由一个分词器(tokenizer)和0个或者多个过滤器(filter)组成,也可能会有0个或者多个字符映射器(character
本书的这一部分将教你如何处理文本,特别是,它是文本解析的正式开始。所以我不会涉及编程语言理论的所有不同理论元素,因为这是整个大学的学位。这只是简单而朴素的文本解析的开始,可以在许多编程环境中使用它。 大多数程序员与解析文本有着奇怪的关系。所有计算机程序设计的核心是解析,它是计算机科学中最容易理解和形式化的方向之一。解析数据在计算中无处不在。你可以在网络协议,编译器,电子表格,服务器,文本编辑器,图
输入文本为2020年2月20日 以下代码块抛出,其中包含无法分析的消息文本“28Feb2020”,在索引7中找到未分析的文本:
问题内容: 我使用Elasticsearch 1.7.4及其Java API。目前,我想按用户计数前10个高频搜索词。因此,我必须记录要搜索的用户类型的查询文本的单词,并且在记录单词之前必须分析查询文本。如链接所示,我找到了分析文本的宁静方法,但是在TransportClient中找不到api。 有谁知道如何使用Java api或其他方式而不是请求静态API来分析Elasticsearch中的文本
功能介绍 获取版本分析报告数据,包括表格详情数据与趋势数据,所获取数据与 https://mtj.baidu.com 中报告数据一致 接口 https://openapi.baidu.com/rest/2.0/mtj/svc/app/getDataByKey 此处仅列本接口特有参数,公共参数请参考报告级API说明 获取表格数据 参数名 参数类型 是否必须 描述 method string 是 v
6.4.3 编程案例:文本文件分析 本节讨论一个文件分析程序,其功能是输入一个文本文件,对文件内容进行分词(将字符流划分为单词),然后统计文件中的字符数、单词数、每个单词的出现次数以及行数,最 后输出统计结果。按出现频率前 n 名的单词。这种分析在很多应用中都会用到,例如自然语 言处理、文档相似性比较、搜索引擎等。 分析程序的算法设计是直接了当的,其核心是对多个指标进行累积计数。其中,对字符 数和