当前位置：首页 > 软件库 > 程序开发 > 搜索引擎 >

WuKong Search

全文搜索引擎

授权协议 Apache

开发语言 Google Go

所属分类程序开发、搜索引擎

软件类型开源软件

地区国产

投递者丌官嘉勋

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

WuKong 全文搜索引擎。功能特性：

高效索引和搜索（1M条微博500M数据28秒索引完，1.65毫秒搜索响应时间，19K搜索QPS）
支持中文分词（使用sego分词包并发分词，速度27MB/秒）
支持计算关键词在文本中的紧邻距离（token proximity）
支持计算BM25相关度
支持自定义评分字段和评分规则
支持在线添加、删除索引
支持持久存储
可实现分布式索引和搜索
采用对商业应用友好的Apache License v2发布

示例代码：

package main

import (
    "github.com/huichen/wukong/engine"
    "github.com/huichen/wukong/types"
    "log"
)

var (
    // searcher是协程安全的
    searcher = engine.Engine{}
)

func main() {
    // 初始化
    searcher.Init(types.EngineInitOptions{
        SegmenterDictionaries: "github.com/huichen/wukong/data/dictionary.txt"})
    defer searcher.Close()

    // 将文档加入索引
    searcher.IndexDocument(0, types.DocumentIndexData{Content: "此次百度收购将成中国互联网最大并购"})
    searcher.IndexDocument(1, types.DocumentIndexData{Content: "百度宣布拟全资收购91无线业务"})
    searcher.IndexDocument(2, types.DocumentIndexData{Content: "百度是中国最大的搜索引擎"})

    // 等待索引刷新完毕
    searcher.FlushIndex()

    // 搜索输出格式见types.SearchResponse结构体
    log.Print(searcher.Search(types.SearchRequest{Text:"百度中国"}))
}

使用案例

elasticsearch重启过程

在es的维护中少不了要重启节点，毕竟重启可以解决80%的问题，那么你知道怎么正确的重启es节点么？ es版本 6.5.4 1、禁用分片分配执行下面的配置，就可以禁用分片分配 PUT _cluster/settings { "persistent": { "cluster.routing.allocation.enable": "none" } } 我们在重启es的时候一定要知道
1、Elasticsearch集群种类

一、Elasticsearch节点类型 1、master node节点整个集群的管理者、索引管理、分片管理，以及整个集群的状态的管理，master节点是从master候选节点中选出的，成为master候选节点的方式：node.master:true 默认（true） data node：数据节点，存储主要数据，负责索引的数据的检索和聚合等操作，设置data node的方式如下： node.mas
悟空分词的搜索和排序源码分析之——搜索

转自：http://blog.codeg.cn/2016/02/02/wukong-source-code-reading/ 搜索过程分析下面我们来分析一下搜索的过程。首先构造一个SearchRequest对象。一般情况下只需提供SearchRequest.Text即可。 type SearchRequest struct { // 搜索的短语(必须是UTF-8格式)，会被分词 // 当值为空字
悟空分词的搜索和排序源码分析之——索引

转自：http://blog.codeg.cn/2016/02/02/wukong-source-code-reading/ 索引过程分析下面我们来分析索引过程。 // 将文档加入索引 // // 输入参数： // docId标识文档编号，必须唯一 //data见DocumentIndexData注释 // // 注意： // 1. 这个函数是线程安全的，请尽可能并发调用以提高索引速度 // 2
ElasticSearch第十三讲 ES 主要的操作增删查改与分组分页

ES的基本常识关于ES的基本了解，相信大家学习ES都是带着目的来学习，也了解学习ES是为了做什么的，下面只简单说下ES与Lucene的关系。首先Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库（框架）但是想要使用Lucene，必须使用Java来作为开发语言并将其直接集成到你的应用中，并且Lucene的配置及使用非常复杂，你需要深入了解检索的相关知识来理解它是如
【入门】Elasticsearch基本语句

一、概述 Elasticsearch，简称为 ES， ES 是一个开源的高扩展的分布式全文搜索引擎,同时也是面向文档型数据库，在ES中一条数据就是一个文档。在学习ES之前需要先了解一些概念： Index（索引）：不同于Mysql的索引，ES中的索引相当于Mysql的数据库，当我们向ES插入数据的时候，需要指定要插入到哪个索引之下。 Document（文档）：ES中存储的就是一条条文档，ES可以通过
Elasticsearch与springboot结合应用（四）

本文主要介绍Elasticsearch与springboot结合应用一、新建项目并添加依赖 <dependency> <groupId>org.elasticsearch.client</groupId> <artifactId>elasticsearch-rest-high-level-client</artifactId> <version>7.9.0</versio

WuKong Search

同类工具

相关阅读

相关文章

相关问答

相关文档