我使用数据斯塔克斯java驱动程序1.0.1和卡桑德拉1.2.6.
将整个代码库从节俭
更改为CQL
。
由于节俭,我从一开始就经常超时,我无法继续...采用CQL,按照我成功设计的表格和更少的超时....
有了这个,我能够插入大量不符合节俭原则的数据…但是经过一个阶段,数据文件夹大约在3.5GB左右。我经常遇到写入超时异常。即使我再次做同样的早期工作用例,现在也会引发超时异常。它的随机曾经工作过,即使在重新设置后也无法再次工作。
CASSADNRA服务器日志
这是卡桑德拉服务器部分日志DEBUG模式,然后当我得到错误时:
http://pastebin.com/rW0B4MD0
客户端例外是 :
Caused by: com.datastax.driver.core.exceptions.WriteTimeoutException: Cassandra timeout during write query at consistency ONE (1 replica were required but only 0 acknowledged the write)
at com.datastax.driver.core.exceptions.WriteTimeoutException.copy(WriteTimeoutException.java:54)
at com.datastax.driver.core.ResultSetFuture.extractCauseFromExecutionException(ResultSetFuture.java:214)
at com.datastax.driver.core.ResultSetFuture.getUninterruptibly(ResultSetFuture.java:169)
at com.datastax.driver.core.Session.execute(Session.java:107)
at com.datastax.driver.core.Session.execute(Session.java:76)
基础设施:16GB机器,8GB堆给cassandra,i7处理器…我正在使用SINGLE节点cassandra,这个yaml调整为超时,其他一切都是默认的:
用例:我正在运行一个用cassandra存储Combinations(我的项目术语)的用例……目前正在测试使用100个并行线程存储250000个组合……每个线程存储一个组合…实际情况下,我需要支持数千万个,但这需要不同的硬件和多节点集群。。。
存储一个组合大约需要2秒,包括:
100 个并行线程并行存储 100 个组合。
我发现写超时的行为随机一段时间它工作到200 000,然后抛出超时,有时甚至不适用于10k组合。随机行为。
从您的日志片段来看,只有4 GB的堆被分配给了Cassandra,而且它正在变满。这很可能是你的问题:
调试 [预定任务:1] 2013-08-07 15:08:09,434 GC检查器.java(第121行) GC用于ParNew:155毫秒用于6个集合,3230372760使用;最大值为4277534720
max是4277534720==4 GB堆。您应该进入cassandra-env.sh并明确设置最大堆和新堆大小。对于您描述的节点,8 GB最大堆和800 MB新堆可能是一个很好的起点。
只是花了一些时间阅读我的开发卡桑德拉节点配置yaml,因为我遇到了类似的问题。当我尝试将大约30亿个sha2哈希加载到我的开发节点时,我的系统停滞并超时,只有600MB RAM;)
我通过减小缓存大小并在刷新之前等待等等来修复它。这使得节点在写入时变慢,但它正在变得稳定。然后,我能够根据需要加载尽可能多的数据。
但很抱歉,我不知道有哪些选择。我记得我读过关于性能调优以及如何基于cpu内核、ram等计算系统的正确值的文档。
我遇到的问题是缓存写入磁盘的速度不够快,所以它开始阻止一切。说完之后,更频繁地编写并让新请求等待,节点变得稳定,我的导入速度变慢了一点。
它接缝的是,cassandra的默认选项是用于在多节点集群中具有大量内核的重型冲压机械,这些机器可以分散负载。若要使其在本地开发环境中运行,请将其搞砸。它的发展环境而不是生活系统,花时间喝一两杯咖啡;)
希望这有助于以正确的方式思考
我发现,在一些cassandra-stress读操作中,如果我将rate threads设置得太高,就会出现CL错误。考虑在测试期间将线程数量降低到您的池能够承受的水平,以战胜
在我看来,在卡桑德拉.yaml中修改它并不总是一个好主意。考虑您的计算机使用的硬件资源。
对于鸡蛋:
cassandra-stress read n=100000 cl=ONE -rate threads=200 -node N1
会给我错误,而
cassandra-stress read n=100000 cl=ONE -rate threads=121 -node N1
会顺利完成这项工作。
希望它能帮助你。
附言。当您进行读取测试时,尝试使用“-pop dist=uniORM(1…1000000)”或您想要多少来分散读取数据。
我对Spring Boot cassandra web应用程序有问题。随着数据的增长,它开始出现,现在它是一个非常常见的场景。 所有查询有时都不起作用,返回。几秒钟后它又开始工作了,几秒钟后它就不工作了。所以web应用程序不断返回或响应。相同的查询始终在中工作。 我正在使用: Spring启动启动程序 sping-boo-starter-data-cassandra#2.1.3 Cassandra
我正在尝试使用python与ndb实现强一致性。看起来我错过了一些东西,因为我的读取表现得好像它们不太一致。 查询是: 关键结构是: 我有许多使用TaskQueue同时执行的任务,并且此查询在每个任务结束时执行。有时我在更新字段时会遇到“过多争用”异常,但我会使用重试来处理它。它会破坏强一致性吗? 预期的行为是,当没有剩余的链接的最后一个\u状态等于无时,调用了。实际行为是不一致的:有时调用两次,
我最近把我的应用上传到了谷歌Playstore。我使用错误报告器跟踪崩溃。应用程序工作正常,但经常出现HttpHostConnectException。在进行每次网络通话之前,我都会检查互联网连接。造成这一例外的原因还有其他原因吗?如何避免? 附言:在测试/调试我的应用程序时,我从来没有遇到过这个异常。
我有cassandra单片应用程序,我想写在高速率从队列中读取一些有效载荷。Cassandra集群有3个节点。当我开始并行处理大量消息(通过生成线程)时,我得到以下异常 我将CQLsession创建为bean 我将此CqlSession注入到映射器和其他类中以运行查询 在我的datastax驱动程序中,我给了3个节点的ip作为联系点,我是否需要在CQLsession创建/或我的cassandra节
问题内容: 我目前正在Linux系统上以python编写程序。目的是在发现特定字符串后读取日志文件并执行bash命令。日志文件正在被另一个程序不断写入。 我的问题 :如果使用该方法打开文件,我的Python文件对象将随着其他程序写入实际文件而更新,还是我必须在一定时间间隔内重新打开文件? 更新 :感谢到目前为止的答案。我也许应该提到,该文件是由Java EE应用程序写入的,所以我无法控制何时将数据
谁能解释一下为什么我的Cassandra集群中每隔4-5分钟就会出现读取超时。我几乎可以始终如一地看到这一点,并能够始终如一地再现这一点。 读取吞吐量保持在每秒 1 个请求,集群中没有发生写入或压缩。读取超时在 cassandra.yaml 文件中配置为 5 秒。我正在使用datastax java驱动程序2.1.14。 超时期间的跟踪不起作用。在cqlsh中第二次手动读取同一行密钥成功。看看这个