嗨,我正在试用带有 Elasticsearch 的 Elastic 企业搜索。我有几个关于数据索引的问题。
在参考 Elasticsearch 文档时,我读到 Elasticsearch 索引可以拥有的字段数量是有限制的。由于 Elasticsearch 与 Elastic Enterprise Search 一起使用,我相信这里同样适用。在这种情况下,假设我有多个具有不同字段的文档类型。例如 Person.json 和 Dog.json,它们都具有不同的属性。因此,在索引时,我在弹性企业搜索中使用一个搜索引擎来索引 Person 和 Dog,这样当我使用 Elastic 企业搜索 API 进行查询时,我会得到的结果都是人和狗取决于搜索词。
这是要走的路,还是应该为每种html" target="_blank">架构类型指定一个单独的搜索引擎?
我假设您的 person.json 和 dog.json 包含不同的字段,如您的标题所建议的那样,以及为这些实体创建单独索引或将它们放在单个索引中的天气,这取决于您在应用程序中的各种用例,您不会发现 elasticsearch 标记一种方法比其他方法更好,主要将根据特定上下文(如相关性, 绩效、管理等)。
请参考我的这个 SO 答案,其中我谈到了该方法和聊天讨论的各种优缺点,以获取更多背景信息,为什么 OP 在了解优缺点后根据他的用例选择一种方法。
我有一个使用MVC模式开发的应用程序,现在我想对它的多个模型进行索引,这意味着每个模型都有不同的数据结构。 > 是使用多个索引更好,每个模型使用一个索引,还是在每个模型的同一索引中使用一个类型?我认为,这两种方法都需要不同的搜索查询。我刚开始做这个。 如果数据集是小的还是大的,这两个概念在性能上是否存在差异? 如果有人能为我推荐一些好的样本数据,我会自己测试第二个问题。
我有大量相同类型的实体,每个实体都有大量属性,并且我只有以下两种选择来存储它们: 将每个项存储在索引中并执行多索引搜索 将所有enties存储在单个索引中,并且只搜索1个索引。 一般而言,我想要一个时间复杂度之间的比较搜索“N”实体与“M”特征在上述每一种情况!
问题内容: 我面临以下问题,我不确定什么是最佳实践。 考虑下表(该表会变大): id PK | Giver_id FK | FK | 日期 我正在使用InnoDB,据我了解,它会自动为两个外键列创建索引。但是,我还将在需要匹配以下特定组合的情况下进行大量查询: 。 每个这样的组合在表中将是唯一的。 在这些列上添加双列索引有什么好处,还是理论上两个单独的索引足够/相同? 问题答案: 如果您有两个单列
我正在学习弹性搜索,还有很多东西我没有得到,但有一件事我不知道(或发现所有的)是什么时候使用一个索引,什么时候使用更多的索引。部分原因是我不知道弹性搜索索引到底是什么。 您能解释一下什么是弹性搜索索引吗?什么时候应该只对所有数据使用一个索引?什么时候应该将数据拆分为多个索引? 奖励点/或者,我如何判断何时需要将我的数据拆分为多个索引,然后,我应该如何决定如何将数据拆分为新的索引?
我刚加入弹性搜索公司。而不知道如何在JSON请求中对索引和an类型发出正确的请求?(所以我不想像localhost:9200/myindex/mytype/_search那样在URL中使用索引和类型,而是向localhost:9200/_search发出JSON请求) 我试过这样的东西。但我得到的结果是'AAA'索引而不是'BBB'索引。如何只从bbb索引得到结果或者根本没有结果?
Elasty/Lucene真的需要在文档中存储所有索引数据吗?您是否可以通过它传递数据,以便Lucene可以将单词索引到它的哈希表中,并为每个文档提供一个单独的字段,该字段具有返回每个文档来自哪里的URL(或任何对您有意义的指针)?
例如,如果一个单词'a'的倒排索引包含10000个文档,在搜索'a'时,如果Lucene搜索了10个结果,那么Lucene会遍历这10000个文档,然后返回10个结果吗?还是当检索到足够的结果时,即使它没有到达倒排索引的末尾,也会返回10个结果?
我已经将弹性搜索1.7.1与spring应用程序集成在一起。我有一个cron作业,它在每次运行时更新弹性搜索的索引。我遵循了github上的各种示例代码来使其工作。首先,我为索引目的自动连接了ElasticSearchOperations: 然后以以下方式执行内部循环索引 当我第一次运行它时,它就像预期的那样工作。我已经在config文件夹中的elasticsearch.yml中将cluster重