当前位置: 首页 > 工具软件 > PHP-ES > 使用案例 >

php使用es(elasticsearch) 7.x

韩琛
2023-12-01
<?php

require 'vendor/autoload.php';

class MyElasticSearch
{
  private $client;
  // 构造函数
  public function __construct()
  {
    $params = array(
      '127.0.0.1:9200'
    );
    $this->client = ClientBuilder::create()->setHosts($params)->build();
  }

  /**
   * 创建索引
   * */
  public function create_index($index_name) { // 只能创建一次
    $params = [
      'index' => $index_name,  //索引名称
      'body' => [
        'settings' => [ //配置
          'number_of_shards' => 5, // 分片数
          'number_of_replicas' => 0 // 备份数
        ]
      ]
    ];

    try {
      return $this->client->indices()->create($params);
    } catch (\Elasticsearch\Common\Exceptions\BadRequest400Exception $e) {
      $msg = $e->getMessage();
      $msg = json_decode($msg,true);
      return $msg;
    }
  }

  /**
   * 删除索引
   * $index_name 索引名称
   */
  public function delete_index($index_name) {
    $params = ['index' => $index_name];
    try {
      $response = $this->client->indices()->delete($params);

      return ['', $response];
    } catch (\Exception $exception) {
      return ['error',''];
    }
  }

  /**
   * 创建索引
   * properties.type //类型 text、integer、float、double、boolean、date
   */
  public function create_mappings($index_name) {
    $params = [
      'index' => $index_name, //索引名称
      'body' => [
        'properties'=> [  // 配置数据结构与类型
          'name'=> [ // 字段1
            'type'=>'text',
            'index'=> 'true', //是否索引
            'analyzer' => 'ik_max_word' // 分词
          ],
          'age'=> [ // 字段2
            'type'=>'integer',
          ],
          'sex'=> [ // 字段3
            'type'=>'keyword',
            'index'=> 'false',
            ],
          ]
      ],
    ];

    $response = $this->client->indices()->putMapping($params);
    return $response;
  }

  /**
   * 查看映射
   * $index_name 索引名称
   */
  public function get_mapping($index_name) {
    $params = [
      'index' => $index_name,
    ];
    try {
      $response = $this->client->indices()->getMapping($params);
      return ['',$response];
    } catch (\Exception $exception) {
      return ['error',''];
    }
  }

  /**
   * 添加文档
   * $index_name 索引名称
   * $type_name _type 非必填 默认创建
   * $id 非必填 默认创建
   * $doc 添加的内容
   */
  public function add_doc($index_name,$type_name = null,$id,$doc) {
    $params = [
      'index' => $index_name,
      'type' => $type_name,
      'id' => $id,
      'body' => $doc
    ];

    $response = $this->client->index($params);
    return $response;
  }

  /**
   * 批量创建文档
   * $index_name 索引名称
   * $type_name _type 非必填 默认创建
   * $body 内容
   * $body例:[['create' => [    //index 与 create一致都是创建文档'_id' => $i,],'name' => 'PHPerJiang','age' => 1,'sex' => 2,]];
   */
  public function bulk_create_another($index_name, $type_name = null, $body = [])
  {
    $params = [
      'index' => $index_name,
      'type' => $type_name,
      'body' => $body,
    ];
    $response = $this->client->bulk($params);
    return $response;
  }

  /**
   * 判断文档存在
   * $index_name 索引名称
   * $type_name _type 非必填 默认创建
   */
  public function exists_doc($index_name,$id,$type_name = null) {
    $params = [
      'index' => $index_name,
      'type' => $type_name,
      'id' => $id
    ];

    $response = $this->client->exists($params);
    return $response;
  }

  /**
   * 获取文档
   * $index_name 索引名称
   * $type_name _type
   * $id 文档id
   */
  public function get_doc($index_name,$id = null,$type_name = null) {
    $params = [
      'index' => $index_name,
      'type' => $type_name,
      'id' => $id
    ];
    try {
      $response = $this->client->get($params);
    } catch (\Exception $exception) {
      $response = [];
    }
    return $response;
  }

  /**
   * 一次获取多个文档
   * @param $ids
   * @return array
   */
  public function getDocs($index_name, array $ids, $type_name = null) {
    $params = [
      'index' => $index_name,
      'type' => $type_name,
      'body' => ['ids' => $ids]
    ];
    return $this->client->mget($params);
  }

  /**
   * 更新文档
   * $type_name _type 
   * $id 文档id 
   * $doc 更新的内容
   */
  public function update_doc($index_name = null,$id = null,$type_name = null, $doc = []) {

    $redisKey = "es_{$index_name}_{$type_name}_$id";
    if ( ! Redis::setNx($redisKey,1) ) {
      return ["error"=>'正在处理'];
    }

    try {
      $params = [
        'index' => $index_name,
        'type' => $type_name,
        'id' => $id,
        'body' => [
          'doc' => $doc
        ]
      ];
      $response = $this->client->update($params);
      return $response;
    } catch (\Exception $exception) {
      throw $exception;
    } finally {
      Redis::del($redisKey);
    }
  }

  /**
   * 批量更新
   * body = [['update' => ['_id' => $i],'doc'=> ['name' => 'PHPerJiang','age'  => 1,'sex'  => 2,]]];
   */
  public function bulk_update_another($index_name, $type = null,$body = []){
    $params = [
      'index' => $index_name,
      'type'  => $type,
      'body'  => $body
    ];
    $response = $this->client->bulk($params);
    return $response;
  }

  /**
   * 删除文档
   * $id 文档id
   */
  public function delete_doc($index_name,$id,$type_name = null) {
    $params = [
      'index' => $index_name,
      'type' => $type_name,
      'id' => $id
    ];

    $response = $this->client->delete($params);
    return $response;
  }

  /**
   * 批量删除
   * body = [['delete' => ['_id' => $id,]];
   * */
  public function bluk_delete_another($index_name, $type_name = null, $body = []){
    $params = [
      'index' => $index_name,
      'type'  => $type_name,
      'body'  => $body,
    ];

    $response = $this->client->bulk($params);
    return $response;
  }

  /**
   * 查询文档 (分页,排序,权重,过滤)
   * $should = [['should' => [[ 'match' => [ 'name' => ['query' => $keywords,'boost' => 3, // 权重大]]],[ 'match' => [ 'sex' => ['query' => $keywords,'boost' => 2,]]],],]],
   * sort = ['age'=>['order'=>'desc']]
   */
  public function search_doc($index_name,$type_name = null,$search = [], $sort = [],$from = 0, $size = 20) {
    $params = [
      'index' => $index_name,
      'type' => $type_name,
      'body' => [
        'query' => [
          'bool' => $search,
        ],
        'sort' => $sort,
        'from' => $from, 'size' => $size
      ]
    ];

    $results = $this->client->search($params);
    $maxScore  = $results['hits']['max_score'];
    $score = $results['hits']['hits'][0]['_score'];
    $doc   = $results['hits']['hits'][0]['_source'];
    return $results;
  }

}

查询(term、match、bool、filter)区别

一、精准查询term
term是代表完全匹配,即不进行分词器分析,文档中必须包含整个搜索的词汇

1、term单值
字段只有一个值时候,用term关键词查询

查询goods_id值为190的记录

curl -XGET http://127.0.0.1:9200/xyerp/order/_search -H 'Content-Type: application/json' -d '
{
 "query": {
     "term": {
       "goods_id": "190"
      }
 }
}


进一步优化查询,因为是精准查询,不需要查询进行评分计算,只希望对文档进行包括或排除的计算,所以我们会使用 constant_score 查询以非评分模式来执行 term 查询并以一作为统一评分。推荐如下查询

{  
    "query" : {  
        "constant_score" : {  
             "filter" : {  
                "term" : {  
                    "goods_id" : "190"  
                }  
            }  
        }  
    }  
}'


2、terms多值
字段有一多个值时候,用terms关键词查询,后跟数组

{
    "query":{
        "terms":{
            "goods_id":["190"]
        }
    }
}'


 constant_score 以非评分模式查询,推荐如下查询

{  
    "query" : {  
        "constant_score" : {  
             "filter" : {  
                "terms" : {  
                    "goods_id" : ["190","e1909"]  
                }  
            }  
        }  
    }  
}'


3、term多个字段

{
    "query": [{
        "term": {
            "goods_id": "190"
        }
    }, {
        "term": {
            "name": "zhangsan"
        }
    }]
}


 二、匹配查询match
match和term的区别是,match查询的时候,elasticsearch会根据你给定的字段提供合适的分析器,而term查询不会有分析器分析的过程,match查询相当于模糊匹配,只包含其中一部分关键词就行

1、match
进行full text search或者exact value(非string字段或not_analyzed的字段),进行匹配

查询字段merchant_id为2501的值,并按时间倒序

{
   "query": {
     "match": {
       "merchant_id": "2501"
     }
   },
   "sort": [
     {
       "trade_finished_time": {
         "order": "desc"
       }
     }
   ]
}'


2、match_all
{ "match_all": {}} 匹配所有的, 当不给查询条件时,默认全查。

{
    "query": {
        "match_all": {}
    }
}


3、multi_match
同时对查询的关键词,多个字段同时进行匹配,即多个字段是AND的关系

{
    "query":{
        "multi_match":{
            "query":"2501",
            "fields":["merchant_id","_id"]
        }
    }
}


 同时field还支持更为丰富的查询

在在fields中,按brandName(品牌名)、sortName(分类名)、productName(商品名)productKeyword(商品关键字),搜索“牛仔 弹力”关键词,brandName源值、拼音值、关键字值都是100分,sortName源值、拼音值80分,productName源值60分,productKeyword值20分,分值由高到低优先级搜索

{
  "query": {
    "multi_match": {
      "query": "牛仔 弹力",
      "fields": [
        "brandName^100",
        "brandName.brandName_pinyin^100",
        "brandName.brandName_keyword^100",
        "sortName^80",
        "sortName.sortName_pinyin^80",
        "productName^60",
        "productKeyword^20"
      ],
      "type": <multi-match-type>,
      "operator": "AND"
    }
  }
}


4、match_phrase
 match_phrase查询分析文本,并从分析文本中创建短语查询。
类似 match 查询, match_phrase 查询首先将查询字符串解析成一个词项列表,然后对这些词项进行搜索,但只保留那些包含 全部 搜索词项,且 位置与搜索词项相同的文档

如下,查询 quick brown、quick brown fox、 brown fox可以查询到,quick fox 查询不到

{  
      "query": {  
          "match_phrase": {  
              "title": "quick brown fox"  
          }  
      }  
}  


 如下, 查询 a,b,啊和b之间隔3个字符可以查询到,隔不是3个查询不到 

{
    "query":{
        "match_phrase" :{
            "query":"a,b",
            "slop":3
        }
    }
}


三、bool查询
bool查询包含四种操作符,分别是must,should,must_not,query。它们均是一种数组,数组里面是对应的判断条件

must: 必须匹配,与and等价。贡献算分

must_not:必须不匹配,与not等价,常过滤子句用,但不贡献算分

should: 选择性匹配,至少满足一条,与 OR 等价。贡献算分

filter: 过滤子句,必须匹配,但不贡献算分

{  
    "query" : {  
        "filtered" : {  
            "filter" : {  
                "bool" : {  
                    "should" : [  
                        { "term" : {"merchant_id" : 100}},  
                        { "term" : {"pay_type" : "3"}}  
                    ],  
                    "must_not" : {  
                        "term" : {"trade_type" : "2"}  
                    }  
                }  
            }  
        }  
    }  
}'


 四、filter查询
过滤器,会查询对结果进行缓存,不会计算相关度,避免计算分值,执行速度非常快。

如下, 查询出status为active的状态

{
  "query": {
    "bool": {
      "filter": {
        "term": {
          "status": "active"
        }
      }
    }
  }
}


filter也常和range范围查询一起结合使用,range范围可供组合的选项

gt : 大于

lt : 小于

gte : 大于等于

lte :小于等于

如下,查询merchant_id值为2501下的交易数据

{
  "query": {
    "bool": {
      "must": {
        "term": {
          "merchant_id": "2501"
        }
      }, 
      "filter": {
        "range": {
          "trade_finished_time": {
            "from": "2019-09-01T00:00:00", 
            "to": "2019-09-30T23:59:59"
          }
        }
      }
    }
  }
}


如下查询,must下匹配,filter进行过滤,range定义范围

{    
    "query": {    
        "bool": {    
            "must": [    
                {   
                    "match": {   
                        "title": "Search"   
                        }  
                },  
                {   
                    "match": {   
                    "content": "Elasticsearch"   
                    }  
                }  
            ],    
            "filter": [  
                {   
                    "term": {   
                        "status": "1"   
                        }  
                },  
                {   
                    "range": {   
                        "publish_date": {   
                        "gte": "2015-01-01"   
                        }  
                    }  
                }  
            ]  
        }  
     }  
}  


五、常见查询场景
1、查询商户ID为3582,订单号为3601021990030726,按时间范围过滤,按下单时间倒序,每次查询100条

{
    "query": {
        "bool": {
            "must": [{
                "term": {
                    "merchant_id": "3582"
                }
            }, {
                "term": {
                    "order_num": "3601021990030726"
                }
            }],
            "filter": [{
                "range": {
                    "order_time": {
                        "from": "2019-11-01T17:00:00+08:00",
                        "to": "2019-11-01T20:00:00+08:00"
                    }
                }
            }]
        }
    },
    "size": 100,
    "sort": [{
        "order_time": "desc"
    }]
}

 类似资料: