当前位置: 首页 > 面试题库 >

Elasticsearch的最大滚动时间

年风华
2023-03-14
问题内容

滚动搜索可以设置的最大滚动时间是多少?

文档:https : //www.elastic.co/guide/zh-
CN/elasticsearch/client/javascript-api/current/api-reference.html#api-
scroll


问题答案:

没有最大滚动时间的所有值。

扫描和滚动旨在以块的形式扫描大量记录。每个块的最大值必须通过增量增加来获得,直到达到突破为止,因为它取决于集群资源,网络延迟和集群负载。

我们进行了3节点测试设置,其中包含约10亿条记录和1
TB数据。我能够滚动整个索引,滚动大小为5000,超时为5m。但是,这些值有很多超时。从我们的分析中,我们观察到滚动超时很大程度上取决于cluster loadnetwork latency。因此,我们最终确定了3500码的大小和4m的超时时间。

因此,我建议以下内容-

  • 逐渐增加大小和超时值以获得网络的最大值。
  • 获得最大值后,将其减小一个档位以适应由于群集负载和延迟而导致的故障


 类似资料:
  • 问题内容: 我对Elasticsearch的滚动功能感到有些困惑。在Elasticsearch中,是否每当用户滚动结果集时都可以调用搜索API?从文档 这是否意味着它将每30秒执行一次搜索并返回所有结果集,直到没有记录为止? 例如,我的ES总共返回500条记录。我从ES获得的数据是两组分别有250条记录的记录。有什么办法可以让我先显示第一组250条记录,当用户滚动时再显示第二组250条记录。 问题

  • 问题内容: 我在Elastic Search中遇到了滚动功能,这看起来很有趣。我浏览了许多文档,但对我而言仍然不清楚以下问题。 如果偏移量已经存在,那么为什么要使用滚动? 那即将到来的记录呢?假设它完成了所有数据的滚动,然后几秒钟后新数据进入了索引,那么它将如何工作?它还会滚动以获取新记录,例如流媒体吗? 假设由于服务器负载或Internet问题导致连接断开,那么它将从头开始滚动数据吗? 所有这些

  • 问题内容: 我有一个含含。该包含一组秒。我正在其中加载很多文本(大约8k-10k个字符)。 尽管滚动有点滞后,但布局工作正常。 真正的问题是,它似乎,和有硬32767大小的限制,所以当任何增长高于,不能滚动任何进一步显示文本的最后1/3。 在下面,您可以看到该问题的最小示例。我使用了NetBeans 设计器,因此它可能有点冗长,但是我从默认设置更改的唯一一件事是s是的直接子级,滚动条策略和稍大的字

  • 问题内容: 我想从索引中获取所有数据。由于项数太大而无法存储,因此我使用了Scroll(很好的功能): 调用时效果很好: 但是,当我多次调用前一个方法时,会得到相同的多次,因此无法并行滚动多次。 我找到了http://elasticsearch-users.115913.n3.nabble.com/Multiple-scrolls- simultanious-td4024191.html ,其中指

  • 问题内容: 我一直在尝试建立一个简单的logback项目,以按日期和文件大小滚动日志文件,到目前为止,我还无法使我的附加程序滚动到另一个文件。而是将其写入 标记指定的日志。 这是我的logback.xml配置文件: 乍看起来,它应该可以工作,对吗?我做错什么了吗?我的整个可构建项目都可以在此处的zip中找到:http://www.mediafire.com/file/2bxokkdyz2i/log

  • 问题内容: 我阅读了有关Lucene限制2Gb文档的说明。在Elasticsearch中可以建立索引的文档大小是否还有其他限制? 问题答案: Lucene内部使用一个字节缓冲区,该缓冲区使用32位整数进行寻址。根据定义,这限制了文档的大小。因此,理论上最大2GB。 在ElasticSearch中: ES GitHub代码中有一个,并将其设置为或。因此,基本上, 2GB是通过HTTP进行批量索引的最