当前位置: 首页 > 编程笔记 >

基于Lucene的Java搜索服务器Elasticsearch安装使用教程

阴礼骞
2023-03-14
本文向大家介绍基于Lucene的Java搜索服务器Elasticsearch安装使用教程,包括了基于Lucene的Java搜索服务器Elasticsearch安装使用教程的使用技巧和注意事项,需要的朋友参考一下

一、安装Elasticsearch
Elasticsearch下载地址:http://www.elasticsearch.org/download/
·下载后直接解压,进入目录下的bin,在cmd下运行elasticsearch.bat 即可启动Elasticsearch
·用浏览器访问: http://localhost:9200/   ,如果出现类似如下结果则说明安装成功:

{
 "name" : "Benedict Kine",
 "cluster_name" : "elasticsearch",
 "version" : {
 "number" : "2.2.0",
 "build_hash" : "8ff36d139e16f8720f2947ef62c8167a888992fe",
 "build_timestamp" : "2016-01-27T13:32:39Z",
 "build_snapshot" : false,
 "lucene_version" : "5.4.1"
 },
 "tagline" : "You Know, for Search"
}

其中:
·name———Elasticsearch实例的名字,默认情况下它将从名字列表中随机选择一个,其设置是在config/elasticsearch.yml文件中;
·version———版本号,以json格式表示了一组信息,其中:
 number字段代表了当前运行Elasticserch的版本号;
 build_snashot字段代表了当前版本是否是从源代码构建而来;
 lucene_version表示Elasticsearch所基于的Lucene的版本;
·tagline———包含了Elasticsearch的第一个tagline:"You Know, for Search"。

二、RTF版本
初学者可以首先从Elastisearch的RTF版本入手。RTF是Ready To Fly的缩写,这是一个集成了基本插件(如服务封装、中文分词、mapper-attachments、transport-thrift、tools.carrot2等插件)的并带有示例程序的可以直接上手的建议工程版本。
下载地址: https://github.com/medcl/elasticsearch-rtf
解压后会看到其目录结构。Elasticsearch包含的主要文件夹及功能如下(以TF版本为例):
·bin--包含运行Elasticsearch实例和管理插件的一些脚本;
·config--主要是一些设置文件
·lib--包含一些相关的包文件;
·plugins--包含相关的插件文件等;
·logs--日志文件;
·data--Elasticsearch中存放数据的地方;
·works--临时文件。

三、插件介绍及安装
1.Head
Head是一个用来监控Elasticsearch状态的客户端插件。
安装:到bin目录下 plugin install mobz/elasticsearch-head
安装后再浏览器中输入: http://localhost:9200/_plugin/head/   ,会打开如下界面:

图中显示了一个节点Benedict Kine,每个节点拥有不同index的数据,Head提供了HTTP客户端。
2.Marvel
Marvel是Elasticsearch的图形化监控客户端,可以用来查看当前的各项状态。
安装:
marvel 是以 elasticsearch 的插件形式存在的,可以直接通过插件安装:

# ./bin/plugin -i elasticsearch/marvel/latest

如果你是从官网下载的安装包,则运行:

# ./bin/plugin -i marvel file:///path/to/marvel-latest.zip

运行:
在浏览器中输入:http://localhost:9200/_plugin/marvel/    ,会打开如下界面:

二、借助Head构建索引
启动Elasticsearch后,在浏览器中访问:http://localhost:9200/_plugin/head/  打开Head工具。
step1:
单击“新建索引”按钮来创建一个新的索引,在弹出框中输入索引名称,如下图所示。分片数为5依次为0,1,2,3,4。数据副本为1,

在概览中看到如下结果说明成功创建了索引。图中带有粗框的分片副本正是提供的数据副本,

step2:
在Head工具的“复合查询”(Any Request)标签下,打开“查询”(Query)选项,如下图所示。

  • 输入拟提交数据的索引文件名称(这里用刚刚建的索引文件名称myfirstindex)以及type(这里用share)、索引文档唯一标识符(即索引的id号,这里用1);
  • 选择操作方式,这是选择POST,POST为相当于INSERT;
  • 在文本框中输入拟添加的JSON数据;
  • 提交后,就会在索引文件myfirstindex的类型文件share中,写入指定信息。如出现右侧内容则标识写入成功。

三、查询索引

还是在复合查询标签下,选择GET操作类型(相当于SELECT),如下图,就可以看到该索引文件的详细信息。

四、操作说明
Elasticsearch的Head中用到了HTTP协议的4种请求方法,其中:

  • POST是向服务器提交数;
  • GET是发送一个请求来取得服务器上的某一资源;
  • PUT和POST都是向服务器发送数据,但PUT通常指定了资源的存放位置;
  • DELETE是用来删除服务器上的某个资源。

五、Mapping简述

Elasticsearch中的Mapping类似于静态语言中的数据类型。但是映像还有一些其他的含义,例如:执行一系列的指令,将输入的数据转成可搜索的索引项,使用映像可以查询类型文件的各个字段的信息。

六、信息检索
用户可以利用Head工具,通过HTTP传递参数的方式来构造一个简单的信息检索语句。如下图,指定在myfirstindex索引的share中,搜索字段为city_name其值为北京的检索请求构建方式。

图的右侧的hits中可以看到返回的结果,hits表示命中的检索集合,total表示命中2条记录,max_score是其评分。
URL构建查询语句时,_search表示搜索RESTful接口,q后代表查询条件,q后的=是基于Lucene语法的查询表达式。

 类似资料:
  • 为什么需要搜索引擎 首先想一下:在一篇文章里找一个关键词怎么找?字符串匹配是最佳答案。 然后再想一下:找到100篇文章里包含某个关键词的文章列表怎么找?依然是关键词匹配 再继续想:找到100000000000(一千亿)篇文章里包含某个关键词的文章怎么找?如果用关键词匹配,以现在的电脑处理速度,从远古时代到人类灭绝这么长时间都处理不完,这时候搜索引擎要发挥作用了 搜索引擎技术有多么高深? 搜索引擎这

  • 问题内容: 我有三个食物类型索引:“意大利”,“西班牙”,“美国”。当用户搜索“奶酪”时,“意大利”文档似乎出现在顶部。如果我偏爱说“西班牙语”,是否可以“增强”结果?(我仍然应该获得意大利语的结果,但是基于索引类型“ Spanish”的一些数值提升值,结果中返回的文档的顺序将优先使用“ Spanish”索引。在用户输入的lucene和/或ES查询? 问题答案: 添加带有字词查询或字段(或两者都有

  • 这是我想解决的问题: 我有多个Lucene索引,每个索引包含相同数据结构的子集(它们具有相同的字段,但是字段可能存在于文档中,也可能不存在于某个索引中) 索引之间共享一个全局标识符。也就是说,如果有4个索引,最多可能有4个文档共享一个密钥。 我有一个单一的Lucene查询 我使用一起查询所有索引,并且我能够使用找出命中来自哪个子索引。到目前为止还不错,但问题是: 为了执行一个(相当复杂的)合并逻辑

  • 本文向大家介绍Window下安装Tomcat服务器的教程,包括了Window下安装Tomcat服务器的教程的使用技巧和注意事项,需要的朋友参考一下 1 下载并准备 首先,我们需要到官网下载Tomcat。 将Tomcat下载Windows的zip文件下载到本地: 接下来,我们将下载的zip文件解压出来,如下: 2 安装 打开Windows终端,然后进入Tomcat的bin目录中: D:\soft\t

  • 本文向大家介绍Tomcat服务器安装配置教程(win7),包括了Tomcat服务器安装配置教程(win7)的使用技巧和注意事项,需要的朋友参考一下 学习了一个月的java基础,终于要迈向java web领域。学习java web开发就离不开服务器的支持,由于本人是菜鸟,只好求助度娘谷哥。在此,把本人成功配置的步骤分享出来。 工具/原料 jdk-7u45-windows-x64(我的系统是64位系统

  • 我想做一个字段折叠热门点击聚合,正如这里所记录的: https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-metrics-top-hits-aggregation.html#_field_collapse_example 特别是,这一部分是一个问题: 因为生产环境配置有: 这意味着我不