当前位置: 首页 > 面试题库 >

如何在Python中使用Elasticsearch检索1M文档?

狄雅珺
2023-03-14
问题内容

我如何从Python的Elasticsearch中获得100000个寄存器?MatchAll查询仅检索10000。


问题答案:

就像已经指出的那样,我将使用Scan API来做到这一点。

import elasticsearch
from elasticsearch import Elasticsearch

ES_HOST = {
    "host": "localhost",
    "port": 9200
}
ES_INDEX = "index_name"
ES_TYPE = "type_name"

es = Elasticsearch(hosts=[ES_HOST], )

results_gen = elasticsearch.helpers.scan(
    es,
    query={"query": {"match_all": {}}},
    index=ES_INDEX,
    doc_type=ES_TYPE
)

results = list(results_gen)

您还应该阅读有关Elasticsearch python DSL中的扫描助手的信息,网址为 http://elasticsearch-
py.readthedocs.io/en/master/helpers.html#scan

参考 帮手。



 类似资料:
  • 问题内容: 假设我要搜索一系列嵌入式文档或子文档,但将它们的父母作为我的结果返回,例如“建筑物和单元”: 现在假设我要退回所有单位> = 1000平方英尺的建筑物。我该怎么做? 问题答案: 将单位大小存储为数组: 并搜索:

  • 问题内容: Title解释了问题所在,有些doc和docs文件需要检索其作者信息,以便我可以重组我的文件。 仅返回大小和日期时间,与实际文件相关的信息。 返回许多我无法解析的字符。 有一个用于读取文件的模块。但是,这仍然不允许我阅读或归档。我知道在程序上不容易读取新的Office文件,因此,如果不可能的话,从旧的Office文件中收集信息就足够了。 问题答案: 由于文件只是XML压缩文件,因此您只

  • 我是Elasticsearch的新手,我面临一个问题。我的任务是搜索一组文档。例如,我有这样结构的数据: 但是困难的是,我如何获取所有带有project_id=abc的文档,然后通过与关键字“测试”匹配的任何其他字段(代码、名称、状态)搜索它们(例如)。我如何在Elasticsearch查询中做到这一点,请帮助我! 谢谢

  • 问题内容: 我正在使用Solr进行索引和搜索。现在,我的新的数据被索引上elasticsearch。如何使用来自Elasticsearch的Solr索引进行组合搜索? 由于Solr和elasticsearch都是基于Apache Lucene 构建的,因此必须有一种方法/插件来使用Elasticsearch的Solr索引,对吗? 我的尝试: 我为此找到了一条河,但是elasticsearch从1.

  • 我正试图从一个站点获取一个数字(比特币的价值),使用下面的代码 它应该打印一个数字,但它没有打印。我尝试使用其他模块,如.gettext,但结果总是没有。我可以用什么来获得我想要的值?