问题描述:在嵌套文档的查询中,使用term查询,结果不准确。
GET my_index/_search
{
"query": {
"nested": {
"path": "bhdl_yx_djsqr",
"query": {
"term": {
"bhdl_yx_djsqr.sqrlx_mc.keyword": {
"value": "辩护人"
}
}
}
}
},
"_source": "bhdl_yx_djsqr.sqrlx_mc"
}
结果部分截图:
"_source" : {
"bhdl_yx_djsqr" : [
{
"sqrlx_mc" : "辩护人"
},
{
"sqrlx_mc" : "辩护人"
},
{
"sqrlx_mc" : "诉讼代理人"
},
{
"sqrlx_mc" : "诉讼代理人"
}
]
}
我们都知道term查询是精确匹配,但是为什么在nested字段中出现结果不准确的情况呢?查询了官网,语法也没有错误,那是为什么???
经过多次实践,发现了问题所在。es的存储为扁平化的设计。嵌套的字段数据,如果没有主键和外层的数据相关联,而是多条数据冗在一条记录里(可以理解为es的一行)或者外层数据与嵌套数据为一对多的关系,那么只要该嵌套数据里任意一条数据被命中,则该记录就会被返回,其中的不匹配数据也被返回。