Lucene提到-
If The document you are indexing are very large. Lucene by default only indexes the first 10,000 terms of a document to avoid OutOfMemory errors
但是我们可以通过IndexWriter.setMaxFieldLength(int)对其进行配置。
我在ElasticSearch-http://localhost:9200/twitter中创建了一个索引,并发布了一个包含40,000个术语的文档。
映射-
{
"twitter": {
"mappings": {
"tweet": {
"properties": {
"filter": {
"properties": {
"term": {
"properties": {
"message": {
"type": "string"
}
}
}
}
},
"message": {
"type": "string",
"analyzer": "standard"
}
}
}
}
} }
我用message字段索引了一个文档,有40,000个术语-message:“text1text2....text40000”。
自从标准分析器对空间进行分析以来,它已经索引了40,000个术语。
我的观点是,elasticsearch是否对lucene上的索引项设置了数量限制?如果是,限制是多少?
如果没有,我的4万个术语怎么都被索引了,它不应该索引超过10000个术语。
您引用的源代码似乎不是最新的,因为indexwriter.setMaxFieldLength(int)
在Lucene3.4中不推荐使用,现在在ES所基于的Lucene4+中不再可用。它已被LimitTokenCountAnalyzer
所取代。但是,我认为这样的限制不再存在,或者至少在Elasticsearch代码库中没有显式设置。
在索引文档时,您可能遇到的唯一限制与HTTP有效负载大小或Lucene的内部缓冲区大小有关,如本文所述
问题内容: 我正在尝试了解如何在Elasticsearch中更新索引文档。我不明白它是如何工作的?什么是该API指的是在做什么?假设您有一个带有嵌套文档的文档,您需要做什么来更新它? 删除文档然后索引“已更新”版本与普通更新之间有什么区别? 问题答案: 更新请求从Elasticsearch检索源,对其进行修改并将其索引回Elasticsearch。如果您已经具有使用更新的文档副本,则毫无意义。仅索
> 下载了。90.6,解压缩,将弹性搜索移动到/usr/share/elasticsearch(在centosx64 6.4上具有chmod 777-r权限),将集群重命名为somethingdupd,并启动服务器。 根据文档,我应该能够做到这一点。但它也什么也不做:
问题内容: 我是相当新的elasticsearch,使用6.5版。我的数据库包含网站页面及其内容,如下所示: 我已经能够执行一个简单的查询,该查询返回所有内容中包含“汽车”一词的文档(使用Python): 结果看起来像这样: “ _id”指的是一个域,所以我基本上回来了: abc.com def.com jkl.com 但我现在想知道如何往往是搜索关键词(“汽车”)出现 在 每个文档,如: abc
问题内容: 我阅读了有关Lucene限制2Gb文档的说明。在Elasticsearch中可以建立索引的文档大小是否还有其他限制? 问题答案: Lucene内部使用一个字节缓冲区,该缓冲区使用32位整数进行寻址。根据定义,这限制了文档的大小。因此,理论上最大2GB。 在ElasticSearch中: ES GitHub代码中有一个,并将其设置为或。因此,基本上, 2GB是通过HTTP进行批量索引的最
我正在使用liferay 7.3.5并尝试创建elasticSearch。通过我在ElasticSearch的第一次体验,我试图为数据库中的一个实体编制索引。我正确构建了搜索平台,并在特定节点内以远程模式使用。对于索引,我遵循了本教程中的一个接一个步骤 创建留言簿索引器 服务层的索引处理也做到了,它工作正常,在调试模式下,这可以清楚地看到,条目被索引,转换成文档,并存储在Liferay中对应于公司
问题内容: 我用映射创建了一个新索引。其中存储了500 000个文档。 我想更改索引的映射,但是在elasticsearch中是不可能的。所以我用新的新映射创建了另一个索引,现在我正尝试将文档从旧索引复制到新索引。 我正在使用扫描和滚动类型从旧索引中检索文档并将其复制到新索引。复制需要花费更多时间,并且系统运行缓慢。 下面是我正在使用的代码。 问题答案: 您不必编写类似的代码。周围有一些出色的工具