我目前有一个定期修订的文档,我想通过保存文档的每个旧版本来跟踪文档。因此,如果文档A有一个摘要和更新日期,我想在每次更新后,保留以前的版本及其更新数据。
问题是,我不确定该如何有效地做到这一点:
...{
Title: A
Summary: {update_date:content, update_date:content, ...}
}
问题是,如果我将键作为值,那么自动生成的模式将把所有日期作为可能的键。这不是你想要的。
所以我的问题是在ElasticSearch中按日期跟踪所有修订的最有效方法是什么?
就像所有与建立索引相关的事情一样,它在很大程度上取决于您想对数据做什么。
通常,保留过去的修订是为了审计目的,因此这是一个完全不同的查询流。我可能会为活动文档保留一个索引,为修订保留一个单独的索引(带有可能的日期分区)。
每次更新都需要更新live文档,并在修订索引中插入新文档。
还应该注意的是,ElasticSearch对版本控制有一些本机支持,这可能适合您。我个人只将ES用作索引,而不是数据存储,因此我倾向于删除索引并经常重建,这会导致历史丢失。
问题内容: 是否有Elasticsearch插件可以让我对输入索引的文档进行分类? 对我而言,最好的解决方案是对所有最经常出现的术语(/概念)进行分类,以一种用户可以浏览的标签云显示。 有没有办法做到这一点?有什么建议? 谢谢 问题答案: 基本思想是使用聚合,每项将产生一个存储桶。 您将获得的响应将通过减少术语出现次数来排序: 如果您正在使用Kibana,则可以基于这些术语直接创建标签云可视化。
我正在使用elasticsearch并通过NEST驱动程序从C#访问它。我需要通过NEST驱动程序对正在添加和更新的文档进行一些并发控制。这里有一个指向相应elasticsearch特性的链接,但是我找不到关于如何在NEST驱动程序中使用文档版本控制的任何信息。 我试图设置一个映射,希望“_version”属性能够从索引文档反序列化(不序列化),但没有成功。 有人能做我想做的事吗?这可能吗?
Git 允许你通过几种方法来指明特定的或者一定范围内的提交。 了解它们并不是必需的,但是了解一下总没坏处。 单个修订版本 你可以通过 Git 给出的 SHA-1 值来获取一次提交,不过还有很多更人性化的方式来做同样的事情。 本节将会介绍获取单个提交的多种方法。 简短的 SHA-1 Git 十分智能,你只需要提供 SHA-1 的前几个字符就可以获得对应的那次提交,当然你提供的 SHA-1 字符数量不
我有如下elasticsearch文档,其中我需要根据creationtime currentdate更正年龄值 年龄=创建时间-当前日期 : 我想根据每个文档ID进行批量更新,但问题是我需要更正6个月的数据 有没有一种方法可以做到这一点,而不是循环遍历,我遇到的所有使用Pandas数据帧进行更新的示例都是基于已知值的。但是在这里_id我将在代码运行时得到。 我写的逻辑是获取所有文档 谁能给我一些
针对 Subversion 1.4(根据r2866编译) 前言 序言 读者 怎样阅读本书 本书约定 排版习惯 图标 本书的结构 本书是免费的 致谢 来自 Ben Collins-Sussman 来自 Brian W. Fitzpatrick 来自 C. Michael Pilato Subversion是什么? Subversion的历史 Subversion的特性 Subversion的架构 S
Peg和实施修订版本 文件和目录的拷贝、改名和移动能力使你可以创建一个项目,然后删除它,然后在同一个位置添加一个新的—这是在我们的计算机中经常发生的操作,而你的版本控制系统不应该成为你这样操作的障碍。Subversion的文件管理操作是这样的开放,提供了几乎和普通文件一样的操作版本化文件的灵活性,但是灵活意味着在整个版本库的生命周期中,一个给定的版本化的资源可能会出现在许多不同的路径,一个给定的路