当前位置: 首页 > 面试题库 >

在elasticsearch中找到文档类型的平均存储大小

彭嘉赐
2023-03-14
问题内容

我如何知道特定文档类型(例如,类型1和类型2)的大小(以字节为单位)?

如果我尝试:

curl -XGET 
'http://localhost:9200/my_index/_stats?clear=true&store=true&indexing=true&types=type1,type2'

我只得到索引的总大小(以字节为单位)。

我实际上对某种类型的文档的平均大小感兴趣,但是可以从计数和我猜得出的总大小中得出


问题答案:

使用相同的索引对不同类型的索引进行索引,并共享许多通用结构。因此,在不考虑另一种类型的影响的情况下,真的不可能分辨出一种类型正在消耗多少。



 类似资料:
  • 问题内容: 在Elasticsearch中,还有什么更好的方法(除了发出完全匹配查询并手动对所有返回文档的长度进行平均)以获取特定索引的平均文档长度? 问题答案: 该_size映射场,如果允许,应该给你的每个文件的大小是免费的。将其与聚合结合起来可以得到所需的内容。就像是:

  • 问题内容: 我试图显示最高平均工资;但是,我似乎无法使其正常工作。 我可以得到要显示的平均薪水清单: 但是,当我尝试显示具有以下项的最大平均薪水列表时: 它没有运行。我收到“无效标识符”错误。如何使用每个工人的平均工资来找到每个工人的最高平均工资? 谢谢。 问题答案: 由聚合函数(例如avg)产生的列通常获得任意名称。只需为其使用别名,然后在其上进行选择:

  • 简而言之:如果您有大量不同大小的文档,其中相对较少的文档达到最大对象大小,那么在MongoDB中存储这些文档的最佳实践是什么? 我有一套文件,比如: 值列表的长度因文档而异。对于大多数文档,它将有几个元素,对于少数文档,它将有数千万个元素,我将达到MongoDB中的最大对象大小限制。问题是,我为那些非常大(而且相对较少)的文档提出的任何特殊解决方案都可能会对我存储小文档的方式产生影响,否则,这些小

  • 问题内容: 在我的elasticsearch服务器上:文档总数:300万,总大小:3.6G然后,我删除了约280万文档:文档总数:约13万,总大小:3.6G 我已删除文件,如何释放文件大小? 问题答案: 删除文档只会将其标记为已删除,因此将不会对其进行搜索。要回收磁盘空间,必须优化索引: 文档: http : //www.elasticsearch.org/guide/en/elasticsear

  • 问题内容: 我创建具有指定文档类型“ mytype”的索引“ myindex”。我可以删除索引,但是似乎“ mytype”仍然存在而没有与索引绑定。 如何摆脱“ mytype”? 问题答案: 如果您确实删除了索引,则该索引中的映射将不再存在。集群中是否还有其他具有相似类型名称的索引? 要回答问题:,请使用Delete Mapping API : 编辑 :从elasticsearch 2.0,将不再

  • 问题内容: 我正在尝试检索过去一年的文档,每个文档都放入1个月宽的存储桶中。我将为每个1个月的存储时段提取文档,然后进一步分析它们(超出我的问题范围)。从描述中看来,“桶聚合”似乎是可行的方法,但是在“桶”响应中,我仅获得每个桶中的文档计数,而不是原始文档本身。我想念什么? GET命令 结果输出 问题答案: 您快到了,您只需要添加一个子聚合即可为每个存储桶检索一些文档: