当前位置: 首页 > 知识库问答 >
问题:

Lucene+自定义集群解决方案的ElasticSearch开销

隆选
2023-03-14
    null
  1. 哪些管理费用?正如我所知,您可以黑ElasticSearch通过内部TCP API而不是REST与他通信。还有其他管理费用吗?它们只关于复制(您可以关闭初始加载复制)吗?或者关于索引自动合并?也许是由于ElasticSearch试图自动合并索引,并使它们变得如此之大,以至于不能支持FS缓存?
  2. 为什么Lucene API更灵活?AFAIK,ElasticSearch有所有相同的索引和其他特性,如父子对象或嵌套对象。因为这不是这个项目的案例。(请参见索引/查询架构)
  1. 在HDFS中,您有100-10000个压缩为AVRO的大型字符串文件(总结为千兆字节甚至千兆字节的数据)。您应该以这样的方式对它们进行索引,以便查找包含特定字符串的所有文件。
  2. 使用Hazelcast向每个群集节点提交索引任务
  3. 每个索引任务都使用IndexWriter为仅使用本地文件系统的每个节点编写单独的索引。意味着每个AVRO文件将形成每个节点的一个索引。每个文件行都是单独的StringField
  4. 在所有节点上完成索引后-索引永远不会改变。意味着不再有写负载。索引的数量等于文件的数量。文件很大,它们的数量不是很高--所以没有索引合并。
  5. 使用简单术语查询进行搜索,指定数据可能存在的所有索引的路径。

共有1个答案

宇文峰
2023-03-14

我在本例中使用ES的原因是

>

  • 未来项目需要以更多方式探索数据

    功能丰富的聚合API

  •  类似资料:
    • 本文向大家介绍IONIC自定义subheader的最佳解决方案,包括了IONIC自定义subheader的最佳解决方案的使用技巧和注意事项,需要的朋友参考一下 IONIC subheader是我们常用的一个css 属性,但是这个subheader的高度是固定的,当然也是可以改变的,但是如果改了subheader的告诉,还要更改content的top值,稍微有些麻烦,如果是动态告诉的subheade

    • 问题内容: 在启动时,我正在为我们的数据库考虑扩展解决方案。MySQL至少使我感到困惑(至少对我而言),MySQL具有MySQL群集,复制和MySQL群集复制(来自5.1.6版),它是MySQL群集的异步版本。MySQL手册解释了其集群FAQ中的一些差异,但是很难确定何时使用它们中的一个。 我将不胜感激那些熟悉这些解决方案之间的区别以及优点和缺点以及何时建议使用每种解决方案的人的任何建议。 问题答

    • 本文向大家介绍socket.io与pm2(cluster)集群搭配的解决方案,包括了socket.io与pm2(cluster)集群搭配的解决方案的使用技巧和注意事项,需要的朋友参考一下 socket.io与cluster 在线上系统中,需要使用node的多进程模型,我们可以自己实现简易的基于cluster模式的socket分发模型,也可以使用比较稳定的pm2这样进程管理工具。在常规的http服务

    • 我们有一个与hawtio集成的camel应用程序,并部署在openshift环境中。这个应用程序已经被扩展成两个pod,并通过openshift路由向外界公开。 因此,通过 hawtio 致动器 url,当我们在运行时更改骆驼路由时,它已反映在任一 pod 上,而不是在两者中。我们正在寻找一种解决方案,我们可以通过hawtio url更新两个豆荚上的骆驼路线。 有人面临类似的问题吗?请提供建议。

    • 问题内容: 它允许您从调用中返回子类。 我正在尝试找出使用Swift实现相同功能的最佳方法。 我确实知道,很可能有一种更好的方法可以用Swift实现相同的目的。但是,我的类将由我无法控制的现有Obj- C库初始化。因此,它确实需要以这种方式工作并且可以从Obj-C调用。 任何指针将不胜感激。 问题答案: 我不相信Swift可以直接支持这种模式,因为初始化程序不会像在Objective C中那样返回

    • 对于我的暑期实习项目,我正在尝试在多个节点上分配作业。但是,我想根据谓词(cpu使用情况)以编程方式创建自定义集群组,就像在Apache Ignite中一样。我的公司已经使用Hazelcast IMDG。Hazelcast是否提供类似的功能?我知道我可以根据组名称创建不同的Hazelcast实例,但有没有办法使用cpu指标在Hazelcast中创建自定义集群组?