当前位置: 首页 > 知识库问答 >
问题:

阿帕奇卡珊德拉-如何强调木卫一

缪朝
2023-03-14

我已经和Cassandra合作了一段时间,并遵循了以下链接中的基准测试提示:

http://www.datastax.com/dev/blog/how-not-to-benchmark-cassandra

我有4个节点运行Cassandra,2个不同的节点使用本机基准测试工具“cassandra-stress”为集群提供数据。我知道,由于Cassandra写操作的LSM特性,它们很难绑定到IO,但是在读取操作中,我希望能够对群集施加压力,使其绑定到IO。到目前为止,我还不能让IO成为瓶颈。

我增加了并发写/读的数量;我已经增加了流吞吐量出站兆位每秒,所以它不会节流;我已经将cassandra-stress客户端的数量增加了3倍(这只是使它更多地受到CPU的限制)。

我在每个Cassandra节点上的设置是一个单独的HDD,用于commitLogs,并且我为数据存储设置了10个驱动器的DAS。我用Linux的iostat实用程序监控了IO,我从来没有发现驱动器的利用率接近100%。此外,我还减少了卡珊德拉可用的内存,认为这将迫使它更频繁地刷新。下面是我启动写压力测试的方法:

卡桑德拉应力 -d 192.168.2.1,192.168.2.2 -n 20000000 -t 400 -f 20million_write_1

下面是我如何启动读压力测试的:

卡桑德拉-应力-d192.168.2.1,192.168.2.2-n 20000000-t 400-f20million_read_1-o读

我从2个外部节点执行此操作,这些节点正在为4节点Cassandra集群提供食物。

关于如何有效地强调IO,并使其受IO约束,有什么想法或想法吗?或者我在这里做错了什么?

感谢您的时间和耐心。

-马特

共有1个答案

龚安民
2023-03-14

一个单独的提交日志磁盘和10个数据磁盘…你“做得对”。

你可以试试混合阅读

 类似资料:
  • 请看下面的代码,让我知道我哪里做错了? 使用: DSE版本-5.1.0 172.31.16.45:9042连接到测试群集。[cqlsh 5.0.1|Cassandra3.10.0.1652|DSE 5.1.0|CQL规范3.4.4|本地协议v4]使用HELP寻求帮助。 谢谢 斯卡拉 斯卡拉 斯卡拉 我在这里什么都得不到?甚至没有错误。

  • DSE版本4.8.2 我用数据向集群添加了6个新节点,并将bootstrap:false。他们加入后,我正在对每一个进行重建。我相信1NODE已完成,但控制台上的命令仍在“运行”(例如,我还无法运行另一个命令)。我想确保它完全完成。该单元没有压实,也没有活动的溪流。更新:现在已经4天了,仍然处于命令提示符下。 除了compationstats和netstats,还有什么我可能缺少的吗?我看到它流式

  • 我已经构建了Cassandra Server2.0.3,然后运行它。它开始,然后用消息停止: 我可以改变什么来运行它?

  • 我正在用SparkMaster api 7077执行JettyRun和ClusterMode。我将cassandra驱动程序和spark-cassandra连接器的jar传递给spark conf(setjar) 有些时候,如果我重新启动,它是有效的,但有几次,我不得不尝试和尝试,从来没有工作。 我尝试了一些答案,比如将Spark番石榴罐子重命名为19版本,但总是遇到同样的问题。 怎么回事?

  • 您能说Apache Karaf包括以下内容吗?其中包括: Apache Felix(它是OSGi 4.2框架的实现) Apache Aries(它是Blueprint标准的实现)

  • Apache Kafka:分布式消息传递系统 Apache Storm:实时消息处理 我们如何在实时数据管道中使用这两种技术来处理事件数据? 在实时数据管道方面,我觉得两者做的工作是一样的。如何在数据管道上同时使用这两种技术?