当前位置：首页 > 软件库 > 程序开发 > 中文分词库 >

elasticsearch-analysis-jieba

授权协议 Apache

开发语言 Java

所属分类程序开发、中文分词库

软件类型开源软件

地区国产

投递者龙承德

操作系统跨平台

开源组织无

适用人群未知

软件概览

结巴分词插件(for elasticsearch)，目前支持0.90.*以上版本

----------------------------------------------------
| Jieba Chinese Analysis Plugin | ElasticSearch    |
----------------------------------------------------
| 0.0.1-SNAPSHOT (master)       | 0.90.*           |
----------------------------------------------------

支持两种分词模式(seg_mode):

index 索引模式，搜索引擎建立索引阶段使用该模式
search 搜索模式，搜索时采用该种模式分词

使用说明

创建mapping

#!/bin/bash curl -XDELETE '0:9200/test/';echo curl -XPUT '0:9200/test/' -d ' {  "index" : {  "number_of_shards": 1,  "number_of_replicas": 0,  "analysis" : {  "analyzer" : {  "jieba_search" : {  "type" : "jieba",  "seg_mode" : "search",  "stop" : true  },  "jieba_index" : {  "type" : "jieba",  "seg_mode" : "index",  "stop" : true  }  }  }  } }';echo

test

# index mode curl '0:9200/test/_analyze?analyzer=jieba_index' -d '中华人民共和国';echo

结果:

{ "tokens": [ { "token": "中华", "start_offset": 0, "end_offset": 2, "type": "word", "position": 1 }, { "token": "华人", "start_offset": 1, "end_offset": 3, "type": "word", "position": 2 }, { "token": "人民", "start_offset": 2, "end_offset": 4, "type": "word", "position": 3 }, { "token": "共和", "start_offset": 4, "end_offset": 6, "type": "word", "position": 4 }, { "token": "共和国", "start_offset": 4, "end_offset": 7, "type": "word", "position": 5 }, { "token": "中华人民共和国", "start_offset": 0, "end_offset": 7, "type": "word", "position": 6 } ] }

# search mode curl '0:9200/test/_analyze?analyzer=jieba_search' -d '中华人民共和国';echo

结果：

{ "tokens": [ { "token": "中华人民共和国", "start_offset": 0, "end_offset": 7, "type": "word", "position": 1 } ] }

使用案例

ElasticSearch自定义分析器-集成结巴分词插件

关于结巴分词 ElasticSearch 插件： https://github.com/huaban/elasticsearch-analysis-jieba 该插件由huaban开发。支持Elastic Search 版本<=2.3.5。结巴分词分析器结巴分词插件提供3个分析器：jieba_index、jieba_search和jieba_other。 jieba_index: 用于索引分词
ElasticSearch-7.4.2集群安装指南-包含ik/pinyin/jieba插件

ElasticSearch-7.4.2集群安装指南备注： 1- 安装ElasticSearch不建议使用root账号，下文均按照账号为duser来介绍； 2- 该版本配置了账号密码； 1、下载编译好的ES安装包本安装包，包括已经编译好的：ik / pinyin / jieba插件；别的不同版本的结巴插件，可以访问该链接上述链接下载的jieba安装包需要编译，编译过程参考： Elastics
centos7系统下elasticsearch7.5.1集群安装elasticsearch-jieba-plugin 7.4.2 和analysis-kuromoji 日语分词...

elasticsearch7.5.1集群安装elasticsearch-jieba-plugin 7.4.2 和analysis-kuromoji 日语分词器安装插件需要在集群的其中一个节点安装后重启es程序，没有问题后拷贝到其他节点重启后生效 1.elasticsearch-jieba需要使用gradle进行编译 # 安装gradle 下载gradle的二进制文件 wget https:
elasticsearch的Jieba 中文分词插件

elasticsearch-jieba-plugin jieba analysis plugin for elasticsearch: 7.7.0, 7.4.2, 7.3.0, 7.0.0, 6.4.0, 6.0.0, 5.4.0, 5.3.0, 5.2.2, 5.2.1, 5.2.0, 5.1.2, 5.1.1 特点支持动态添加字典，不重启ES。简单的修改，即可适配不同版本的ES 支持动态添
Elasticsearch分析器（Analyzer）

Elasticsearch分析器（Analyzer）分析器概念分词就是将一段文本按照一定的规则切分成以一个一个的关键字的过程 Elasticsearch的分析器（Analyzer）有三个组成部分：字符过滤器（character filters）在一段文本分词之前，进行预处理，比如过滤html标签等分词器（tokenizer）接收字符流，将其分解为单个分词，记录每个分词的顺序、位置、开始
ElasticSearch7.13.2安装包，及部署指北

安装包链接：ES7.13.2.zip-其它文档类资源-CSDN下载 0- 系统配置说明在进行系统配置更改时，请统一使用root账户操作，在启动elasticsearch进程请统一使用duser账户。 0x00 基础环境 Tips: 基础环境请使用 root 账户! Java环境主机模式需要java 1.8环境，可先检查有无java环境，如果满足条件则进行下一步，否则请先安装java。按照如
Docker 部署 elasticsearch + kibana + 分词器（版本7.7.0）

Docker 部署 elasticsearch + kibana + 分词器考虑到版本不能过低/过高，且需要搭配使用，所以采用 7.7.0 版本，若采用别的版本应注意各处版本号细节。相关官方链接： es 7.7 文档 docker 部署 es 7.7 文档 docker 部署 kibana 7.7 文档 elasticsearch jieba elasticsearch_ik 自说自话好像
ElasticSearch学习笔记-插件安装记录

HEAD插件安装官方地址 https://github.com/mobz/elasticsearch-head 2.x.x 版本： bin/plugin install mobz/elasticsearch-head 5.x.x、6.x.x、7.x.x版本： git clone git://github.com/mobz/elasticsearch-head.git cd elasticse
java版jieba分词统计，含1.02版本jar

【实例简介】结巴分词,jieba分词，统计分词出现的频率，按频率统计分词出现的频率。分词器功能，建议参考 elasticsearch的分词器，此分词器为入门级的分词拆分和分词频率统计【实例截图】【核心代码】 TEST └── TEST ├── bin │ ├── date │ │ ├── Date.class │ │ └── DateStringCompare.class
jieba分词自定义词典热加载——elasticsearch

信息安全问题不贴代码 1.jieba插件https://github.com/hongfuli/elasticsearch-analysis-jieba 2.ik插件https://github.com/medcl/elasticsearch-analysis-ik 参考ik分词中的热加载功能修改jieba分词插件的源码步骤： 1.编写线程类，ik中是读服务器上的文件，可修改为读取本地文件 2
Windows下elasticsearch安装jieba分词插件

到github下载插件 https://github.com/huaban/elasticsearch-analysis-jieba 2.将下载得到的插件，如elasticsearch-analysis-jieba-2.3.3-bin.zip直接解压缩到 Es的plugins文件夹，文件夹改名为jieba，重启ES服务在浏览器输入以下地址进行测试（例如先建好一个test索引，如果是国产浏览器需要

elasticsearch-analysis-jieba

使用说明

同类工具

相关阅读

相关文章

相关问答

相关文档