当前位置: 首页 > 工具软件 > URL Snake > 使用案例 >

ES 查询一,基于URL 的查询

范朗
2023-12-01

开始查询

GET {index}								# 1. 查看,索引结构
GET {index}/_search						# 2. 查看,索引的所有数据。(ES 查询使用 _search 关键字)
GET {index}/_doc/08010312012022000094 	# 3. 查看,索引的一条数据。(ID 查询使用 _doc关键字)

一、ES 查询概述

1.1 语法

GET /{index}/_search
POST /{index}/_search

1.2 模式(URL、DSL)

  • URI Search , 基于URL 的查询语法的 GET模式查询。
  • DSL Search , 基于DSL 语言的查询的POST模式查询。( Request Body Search 请求体搜索 )

1.3 目标(index)

查询目标可以是一个索引,也可以是多个索引

命令说明
/_search在所有索引上搜索
/index1/_search在 index1 索引上搜索
/index1,index2/_search在 index1 , index2 索引上搜索
/index*/_search在 index 开头的索引上搜索
/g*,user*/_search在任何以 g 或者 u 开头的索引中搜索所有的类型
/gb/user/_search在 gb 索引中搜索 user 类型
/gb,us/user,tweet/_search在 gb 和 us 索引中搜索 user 和 tweet 类型
/_all/user,tweet/_search在所有的索引中搜索 user 和 tweet 类型

二、URL Search

基于URL 的查询方式

2.1 URL查询,语法

2.1.1 精简

GET /index1/_search?q=2012&df=title&sort=year:desc&from=0&size=10&time1s
{"profile" : true}

# 参数详解
- q ,查询字符串
- df  ,default_field 默认查询那个字段
	-  默认为index.query.default_field,即未指定字段前缀时返回所有字段,索引设置为* 
- sort ,排序。
	- fieldName 可以是实际字段,也可以是特殊_score名称,表示基于分数的排序。
	- 可以有几个sort参数(顺序很重要)。
	- fieldName 
	- fieldName:asc
	- fieldName:desc。
- from  , 分页,位置(默认0)。
- size  , 分页,数量(默认10)。
- {"profile" : true} 查询执行细节(调试用)

2.1.2 详解

// URL 语法 ,注意要用''包起来,否则后面的&会被识别为“后台执行”,即&后面的内容被忽略
curl [ -s][ -g][ -X<REST>][ -H 'Content-Type: application/json'] '<IP>:<Port>/<Index>[/Type][/ID]/_search?pretty&q=<search string>'
  
  -s 不输出查询的时间那些东西
  -g 做转义用  
  <REST> , GET/POST/PUT
  <IP>:<port> ,  IP+端口号,<port> 默认80,ES默认9200
  <Index> , 索引名,支持通配符,power_json*
  <Type>  , 索引类型,由于一个index只有一个type,可不输入
  <ID> , 操作对象的ID号,可不输入
  q  ,查询字符串,前面加&,后跟查询语句

// 常用参数
- _source_include ,查询包含某些source字段的文档。
- _source_exclude , 查询不包含某些source字段的文档。
timeout---搜索超时,将搜索请求限制在指定的时间值内执行,并使用在到期时累积的点击数进行保释。默认为无超时。
- default_operator , 默认查询运算符,未指定时默认为OR。
- analyzer , 用于分析查询字符串的分析器名称。
- _source , 设置为false禁用_source字段检索。
- analyze_wildcard 是否应分析通配符和前缀查询,默认为false


// 常用语法
- status:active , status字段包含 active
	- status 字段名 
	- active 值
	- “:”,代替了“=”
- title:(quick OR brown)
	- where the title field contains quick or brown. If you omit the OR operator the default operator will be used
- author:"John Smith"---where the author field contains the exact phrase "john smith"
_exists_:title---where the field title has any non-null value
- date:[2012-01-01 TO 2012-12-31]---All days in 2012
- count:[10 TO *]---Numbers from 10 upwards
- count:>=10---Numbers from 10 upwards

2.2 单字段、多字段、所有字段

在字段 title 中,查询 “2012“ 关键词

GET /{index}/_search?q=title:2012 		# 单字段
GET /{index}/_search?q=2012&df=title 	# 单字段
GET /{index}/_search?pretty&q=age:14&q=name:c2_59 	# 多字段, SQL 语句: age="14" and name="c2_59" 
GET /index1/_search?q=2012 # 所有字段、泛查询,在所有字段查询“2012“ 关键词.

2.3 逻辑、范围

2.4.1 逻辑

- title:(matrix  NOT reloaded)
- title:(+matrix -reloaded)
修饰符(必须大写)符号写法(说明)URLEncoding
AND&&
OR||
NOT!
+must%2B
-must_not

2.4.2 范围

year: {2019 TO 2018} # 开区间
year:[* TO 2018] # 闭区间
year: >2010
year:(>2010 && <=2018)
year:(+>2010 && +<=2018)
GET /movies/_search?q=year:>=1980  # 电影需要在 1980 年后
区间说明
[]闭区间
{}开区间

2.4 其他

2.4.1 空格

# 在字段 title 中,查询 “Beautiful Mind“ 关键词 
GET /index1/_search?q=title:(Beautiful Mind) 

例:
```URL
GET /index1/_search?q=title:(Beautiful AND Mind) 

在字段 title 中,必须包含“Beautiful” 和 "Mind“ 两个关键词

GET /index1/_search?q=title:(Beautiful NOT Mind) 

在字段 title 中,必须包含“Beautiful” 剔除关键词 ,不能包含 "Mind“

2.4.5 通配符

GET /movies/_search?q=title:b*   # 模糊匹配
	 
GET /movies/_search?q=title:beautifl~1  # 近似查询,可以对单词纠错,并找到结果 

GET /movies/_search?q=title:"Lord Rings"~2 # 可以查询所有包含 ”Lorad .... Rings “ 模式的结果

三 URL Search 例子

curl 'localhost:9200/_cat/indices?v&s=index'    //s=sort排序    
curl 'localhost:9200/_cat/indices/power_json*?v&s=index'  //只查power_json
curl 'localhost:9200/_cat/allocation?v&s=node'  //获取集群的节点列表
curl 'localhost:9200/power_json*?pretty'   //pretty,美观
curl 'localhost:9200/power_json*/_search?pretty&q=_exists_:MULT'     //是否存在
curl 'localhost:9200/power_json*/_search?pretty&q=TESTID:10000000107326732674'   //查指定的字段值
curl 'localhost:9200/power_json*/_search?pretty&q=TESTID:10000000107326732674&size=3' //查指定的字段值,并只显示3个
curl 'localhost:9200/power_json*/_search?pretty&q=TESTID:10000000107326732674&from=2&size=3' //从第3个开始只显示3个,即3/4/5
curl 'localhost:9200/power_json*/_search?pretty&q=TESTID:10000000107326732674&sort=TIME:desc' //按时间排序,desc降序,默认为升序
curl 'localhost:9200/power_json*/_search?pretty&analyze_wildcard&q=TESTID:10000000107326732674'   //模糊查询
curl 'localhost:9200/power_json*/_search?pretty&q=VAL:<200'  //比较大小
curl 'localhost:9200/power_json*/_search?pretty&_source=false'  //是否显示
curl 'localhost:9200/power_json*/_search?pretty&_source_includes=TIME,VAL'  //设置包含的字段
curl -g 'localhost:9200/power_json*/_search?pretty&q=(SOLAR:1%20AND%20CENTRAL:1)'  //组合查询
curl -g 'localhost:9200/power_json*/_search?pretty&q=TIME:[2019-05%20TO%202019-06]' //范围查询

DSL Search

  • https://blog.csdn.net/snake1900/article/details/109897409

其他

查询相关度 Information Retrieval

  • Precision (查准率) - 尽可能返回较少的无关文档
  • Recall(查全率) - 尽量返回较多的相关文档
  • Ranking - 是否能够按照相关读进行排序

参考

  • https://www.jianshu.com/p/46372a2df051
  • https://www.cnblogs.com/daynote/p/11076965.html
 类似资料: