当前位置: 首页 > 工具软件 > Katta > 使用案例 >

katta安装遇到的一些问题

巫马松
2023-12-01

安装前提是Hadoop已经配置好

两个节点配置 ubuntu10为主节点 ubuntu12为从节点

1 在home文件夹下创建文件夹katta 
2 将tar.gz文件放在katta文件夹下
3 在命令行中cd到katta文件夹
4 #tar zxvf katta-core-0.6.4.tar.gz
(2 3 4 部分可以直接将文件复制到相应的目录下,最终文件夹路径为/home/katta/katta-core-0.6.4)
5 修改/etc/hostname 为主机名比如ubuntu10  修改/etc/hosts下面的ip地址与主机名的映射,ip地址为内网ip地址 比如说
192.168.2.31 ubuntu12
192.168.2.32 ubuntu10
6 katta的conf下面 将masters改为主节点的名称,比如ubuntu10 将nodes文件改为从节点名称 比如ubuntu12
7 修改 conf/katta.zk.propeties中的两行
zookeeper.embedded=true
zookeeper.servers=ubuntu10:2181
#注意这里ubuntu10即为主节点名称,只能只用主机名,不可以用ip地址
8 修改 conf/katta-env.sh 目的是使从节点跟随主节点自动更新
export JAVA_HOME=/usr/lib/jvm/default-java #与hadoop中的该变量一致,注意路径一定要真实有效
export KATTA_MASTER=ubuntu10:/home/katta-core-0.6.4  #在此ubuntu10是主节点
#报错ssh: connect to host localhost port 22: Connection refused 表明katta使用的默认22端口被关闭,需要重新开启
 开启过程如下:将 /etc/ssh/下的sshd_config文件中原来的Port 8001
 上面一行加上Port 22 然后再运行/etc/init.d/ssh restart 
 然后iptables -A INPUT -p tcp --dport 22 -j ACCEPT 
 最后  iptables -A OUTPUT -p udp --sport 22 -j ACCEPT  
 此时即同时开启了8001和22端口
(上述5,6,7,8步骤在主从节点相同)
9 cd到katta-core-0.6.4目录下
 bin/start-all.sh #启动所有节点,后续需要输入多次密码,需要检查ssh的配置
 bin/stop-all.sh #停止所有节点
10 bin/katta listNodes 可以查看所有节点的状态 connected表明连接成功


如果提示错误信息 比如说 startNode process 19725  时
ps aux|grep bin/start-all.sh  
kill -9 端口号
kill掉所有的进程
或者直接用kill -9 19725
相关的进程一定要kill干净 多试几次




cd ~/katta-tutorial/modules/katta-indexing-sample
ant jar
sh run.sh net.sf.katta.indexing.SequenceFileCreator hdfs://ubuntu12:9000/testkatta  ../../sample-data/texts/alice.txt 1000
运行时报错
Exception in thread "main" java.io.IOException: Call to localhost/127.0.0.1:9000 failed on local exception: java.io.EOFException
报此错说明客户端hadoop版本和服务端hadoop版本不一致。
把hadoop目录下的hadoop-core-1.2.1.jar复制到katta的lib目录下
这样还是会报错,jar包内文件不兼容 只能重装hadoop的0.20.1版本

 类似资料: