Host Monitor和Service Monitor服务无法启动
1.现象描述:将clouderamanager5.4.5 升级到5.5.0 后,服务器正常,而其它节点的agent 无法安装,由于无法升级,最后,只能还原到以前的版本
2.还原过程:
2.1将新版本采用rpm 卸载方式,将3个rpm 进行卸载;
2.2 重新安装5.4.5 版本cm,并启动cm 服务器上cm 服务,ie登录到管理页面正常;
2.3 重新配置cm 管理服务的5个角色,删除后重新加入即可,而需要配置数据库无法增加,因为连接数据库失败,并且其它4个角色启动全失败;
2.4 解决2.3 问题是由于cm 服务器上的agent 没有启动,需要重新配置agent 配置文件后,重新启动。此时2.3 失败的角色增加成功;但是还有2个角色(Host Monitor和 Service Monitor)启动失败信息如下
12月 17, 下午2点29:15.698 ERROR com.cloudera.cmon.firehose.Main
Error creating LevelDB subject record store.
com.cloudera.cmon.tstore.leveldb.LDBPartitionManager$LDBPartitionException: Unexpected partition schema version: 8
at com.cloudera.cmon.tstore.leveldb.LDBSubjectRecordTable.verifySchemaVersion(LDBSubjectRecordTable.java:152)
at com.cloudera.cmon.tstore.leveldb.LDBSubjectRecordTable.<init>(LDBSubjectRecordTable.java:140)
at com.cloudera.cmon.tstore.leveldb.LDBTSSubjectRecordTable.<init>(LDBTSSubjectRecordTable.java:97)
at com.cloudera.cmon.tstore.leveldb.LDBTSSubjectRecordTable.create(LDBTSSubjectRecordTable.java:91)
at com.cloudera.cmon.tstore.leveldb.LDBSubjectRecordStore.create(LDBSubjectRecordStore.java:197)
at com.cloudera.cmon.tstore.leveldb.LDBSubjectRecordStore.create(LDBSubjectRecordStore.java:178)
at com.cloudera.cmon.firehose.Main.main(Main.java:508)
2.5 处理上面问题
看到网上介绍:/var/lib/cloudera-host-monitor 这个文件是自动生成,并且看到该文件是2015.8月,于是猜猜可以是与该文件没有卸载导致,将该文件删除后,启动2个服务正常
参考文献:再次感谢帖子支持http://www.aboutyun.com/thread-12431-1-1.html