当前位置：首页 > 软件库 > 程序开发 > 搜索引擎 >

Riot Search

分布式全文搜索引擎

授权协议 Apache

开发语言 Google Go

所属分类程序开发、搜索引擎

软件类型开源软件

地区国产

投递者夏季萌

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

riot 是一个分布式全文搜索引擎, 采用 Go 语言开发。

功能特性：

高效索引和搜索（1M 条微博 500M 数据28秒索引完，1.65毫秒搜索响应时间，19K 搜索 QPS）
支持中文分词（使用 gse 分词包并发分词，速度 27MB/秒）
支持逻辑搜索
支持中文转拼音搜索(使用 gpy 中文转拼音)
支持计算关键词在文本中的紧邻距离（token proximity）
支持计算BM25相关度
支持自定义评分字段和评分规则
支持在线添加、删除索引
支持多种持久存储
支持 heartbeat
支持分布式索引和搜索
可实现分布式索引和搜索
采用对商业应用友好的Apache License v2发布
支持分词规则

安装/更新

go get -u github.com/go-ego/riot

Requirements

需要 Go 版本至少 1.8

Dependencies

Riot 使用 go module 或 dep 管理依赖.

Build-tools

go get -u github.com/go-ego/re

re riot

创建 riot 项目

$ re riot my-riotapp

re run

运行我们创建的 riot 项目, 你可以导航到应用程序文件夹并执行:

$ cd my-riotapp && re run

使用

先看一个例子（来自 simplest_example.go）

package main

import (
	"log"

	"github.com/go-ego/riot"
	"github.com/go-ego/riot/types"
)

var (
	// searcher 是协程安全的
	searcher = riot.Engine{}
)

func main() {
	// 初始化
	searcher.Init(types.EngineOpts{
		Using:             3,
		GseDict: "zh",
		// GseDict: "your gopath"+"/src/github.com/go-ego/riot/data/dict/dictionary.txt",
	})
	defer searcher.Close()

	text := "《复仇者联盟3：无限战争》是全片使用IMAX摄影机拍摄"
	text1 := "在IMAX影院放映时"
	text2 := "全片以上下扩展至IMAX 1.9：1的宽高比来呈现"
	
	// 将文档加入索引，docId 从1开始
	searcher.Index("1", types.DocData{Content: text})
	searcher.Index("2", types.DocData{Content: text1}, false)
	searcher.Index("3", types.DocData{Content: text2}, true)

	// 等待索引刷新完毕
	searcher.Flush()
	// engine.FlushIndex()

	// 搜索输出格式见 types.SearchResp 结构体
	log.Print(searcher.Search(types.SearchReq{Text:"复仇者"}))
}

是不是很简单！

然后看看一个入门教程，教你用不到200行 Go 代码实现一个微博搜索网站。

使用默认引擎:

package main

import (
	"log"

	"github.com/go-ego/riot"
	"github.com/go-ego/riot/types"
)

var (
	searcher = riot.New("zh")
)

func main() {
	data := types.DocData{Content: `I wonder how, I wonder why
		, I wonder where they are`}
	data1 := types.DocData{Content: "所以, 你好, 再见"}
	data2 := types.DocData{Content: "没有理由"}

	searcher.Index("1", data)
	searcher.Index("2", data1)
	searcher.IndexDoc("3", data2)
	searcher.Flush()

	req := types.SearchReq{Text: "你好"}
	search := searcher.Search(req)
	log.Println("search...", search)
}

相关资料

6.4 分布式搜索引擎

在Web一章中，我们提到MySQL很脆弱。数据库系统本身要保证实时和强一致性，所以其功能设计上都是为了满足这种一致性需求。比如write ahead log的设计，基于B+树实现的索引和数据组织，以及基于MVCC实现的事务等等。关系型数据库一般被用于实现OLTP系统，所谓OLTP，援引wikipedia: 在线交易处理（OLTP, Online transaction processing）是指
4.7.分布式搜索

为提高可伸缩性，Sphnix提供了分布式检索能力。分布式检索可以改善查询延迟问题（即缩短查询时间）和提高多服务器、多CPU或多核环境下的吞吐率（即每秒可以完成的查询数）。这对于大量数据（即十亿级的记录数和TB级的文本量）上的搜索应用来说是很关键的。其关键思想是对数据进行水平分区（HP，Horizontally partition），然后并行处理。分区不能自动完成，您需要在不同服务器上设置Sp
全文搜索

回顾在前面的章节(分页)，我们已经加强了数据库查询，因此能够在页面上获取各种查询。今天，我们会继续探讨数据库的话题，只是领域不同。所有存储内容的应用程序必须提供搜索能力。许多其它类型的网站可能使用了谷歌、必应等索引所有的内容并且提供查询结果。这个对于大多数静态页面的网站，像论坛，是很好用。我们应用程序 microblog 的基本单元是用户短小的 blog，不是整个页面。我们希望搜索结果是动态
MongoDB全文和部分文本搜索

带有Mongoose的MongoDB(3.2.0) 收藏：用户 null 查询： =>找到 =>找到（搜索大小写敏感为false) =>找到（使用diacriticSensitive搜索为false) =>找到（部分搜索） =>未找到（部分搜索） =>未找到（部分搜索）你知道为什么我用查询“Leo”或“L”得到0个结果吗？ null
ElasticSearch全文搜索

问题内容：我尝试在elasticsearchJava API上使用正则表达式运行全文搜索。我的过滤器是这样的：但是它只与一个单词匹配，而没有短语匹配。我的意思是，例如：如果soruce中有一个字符串，例如：“ ”，而当我的文本字符串如下：“ ”，“ ”，“ ” …时，它就起作用了。但是，当我的realTimeTextIn字符串为“ ”时，全文搜索将不起作用。我搜索的单词不能超过一个。我在
ElasticSearch全文搜索

我尝试在弹性搜索java api上使用正则表达式运行全文搜索。我的过滤器是这样的：但是它只与一个单词匹配，而不是与短语匹配。我的意思是，例如：如果soruce中有一个字符串，如：“
MySQL全文搜索与部分单词

问题内容： MySQL全文搜索似乎是一种很棒的方法，也是使用SQL进行搜索的最佳方法。但是，我似乎停留在以下事实：它不会搜索部分单词。例如，如果我有一篇标题为“ MySQL Tutorial”的文章并搜索“ MySQL”，它将找不到它。完成一些搜索后，我发现MySQL 4中提供了各种支持该功能的参考（我使用的是5.1.40）。我曾尝试使用“ MySQL ”和“％MySQL％”，但均无效（我发现一
全文搜索引擎的比较-Lucene，Sphinx，Postgresql，MySQL？

问题内容：我正在建立Django网站，并且正在寻找搜索引擎。一些候选人： Lucene / Lucene与指南针/ Solr 狮身人面像 PostgreSQL内置全文本搜索 MySQl内置全文本搜索选择标准：结果相关性和排名搜索和索引速度易于使用，易于与Django集成资源需求-网站将托管在VPS上，因此理想情况下，搜索引擎不需要大量的RAM和CPU 可扩展性其他功能，例如“您的意

Riot Search

安装/更新

Requirements

Dependencies

Build-tools

re riot

re run

使用

使用默认引擎:

同类工具

相关阅读

相关文章

相关问答

相关文档