当前位置：首页 > 软件库 > 程序开发 > 中文分词库 >

es-ik

ES上使用IK中文分词器

授权协议 MIT

开发语言 Java

所属分类程序开发、中文分词库

软件类型开源软件

地区国产

投递者郤坚诚

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

IK中文分词器在Elasticsearch上的使用。原生IK中文分词是从文件系统中读取词典，es-ik本身可扩展成从不同的源读取词典。目前提供从sqlite3数据库中读取。es-ik-plugin-sqlite3使用方法：

1. 在elasticsearch.yml中设置你的sqlite3词典的位置：

ik_analysis_db_path: /opt/ik/dictionary.db

我提供了默认的词典：https://github.com/zacker330/es-ik-sqlite3-dictionary

2. 安装（目前是1.0.1版本）

./bin/plugin -i ik-analysis -u https://github.com/zacker330/es-ik-plugin-sqlite3-release/raw/master/es-ik-sqlite3-1.0.1.zip

3. 现在可以测试了：

1. 创建index

curl -X PUT -H "Cache-Control: no-cache" -d '{
    "settings":{
        "index":{
            "number_of_shards":1,
            "number_of_replicas": 1
        }
    }
}' 'http://localhost:9200/songs/'

2. 创建map:

curl -X PUT -H "Cache-Control: no-cache" -d '{
        "song": {
            "_source": {"enabled": true},
            "_all": {
                "indexAnalyzer": "ik_analysis",
                "searchAnalyzer": "ik_analysis",
                "term_vector": "no",
                "store": "true"
            },
            "properties":{
                "title":{
                    "type": "string",
                    "store": "yes",
                    "indexAnalyzer": "ik_analysis",
                    "searchAnalyzer": "ik_analysis",
                    "include_in_all": "true"
                }
            }

        }
}
    ' 'http://localhost:9200/songs/_mapping/song'

curl -X POST  -d '林夕为我们作词' 'http://localhost:9200/songs/_analyze?analyzer=ik_analysis'

response:
{"tokens":[{"token":"林夕","start_offset":0,"end_offset":2,"type":"CN_WORD","position":1},{"token":"作词","start_offset":5,"end_offset":7,"type":"CN_WORD","position":2}]}

使用案例

windows上ES安装ik分词器

1.首先得知道ik分词器的地址 GitHub：GitHub - medcl/elasticsearch-analysis-ik 若github访问较慢，可以访问以下网站 mirrors / medcl / elasticsearch-analysis-ik · GitCode 2.手动安装打开git的命令行 git clone https://github.com/medcl/elasticse
es系列： IK分词器的安装

IK中文分词器的安装 ES默认是没有IK中文分词器的，我们要将IK中文分词器作为一个插件安装到ES中，安装的步骤也很简单 1. 从GitHub上下载适合自己ES版本的IK中文分词器，地址如下：https://github.com/medcl/elasticsearch-analysis-ik/releases。 2. 在我们的ES的插件目录中（${ES_HOME}/plugins）创建ik
es中安装ik分词器

1.下载和es相同版本的ik分词器，elasticsearch-analysis-ik-8.2.0 2.elasticsearch-analysis-ik-8.2.0.zip在es的plugins文件下解析 3.重启es 4.查看分词效果 POST _analyze { "analyzer": "ik_smart", "text": "我爱我的钱" } POST _analyze {

es-ik

同类工具

相关阅读

相关文章

相关问答

相关文档