分布式Katta的配置

韦智刚

2023-12-01

现在来进行Katta的分布式运行配置，Katta是用来进行分布式索引管理的项目，可以出来大数据量的插入和查询。

我使用的三台机器分别为master，node1，node2，系统都为Centos 5

在下载回来的文件解压后进入conf文件夹，在里面需要改几个文件

masters文件
把localhost改成master（主节点名）

nodes文件
node1
node2（加入你的节点机器的名称）

katta.zk.propeties文件
# comma serperated list of host:port that should run a zookeeper server, # make sure you use hostnames and not ip addresses
zookeeper.servers=<master>:2181 （把localhost改成master）
...

katta-env.sh文件
# Set Katta-specific environment variables here.
...
# The java implementation to use. Required.
export JAVA_HOME=/usr/lib/j2sdk1.5-sun （JDK目录）
...
# host:path where hadoop code should be rsync'd from. Unset by default.
export KATTA_MASTER=server0:/home/$USER/katta-distribution
...

在三台机器上做同样的部署

启动：bin/start-all.sh
关闭：bin/stop-all.sh

接下来部署索引，让Katta来管理索引
部署索引的格式
bin/katta addIndex <name of index> [file:///<path to index>|hdfs://<server name>/<path to index>] <lucene analyzer class name> <replication level>

如果你有装hadoop集群的话，可以把在hadoop上的索引部署到Katta上，让Katta来管理

查找的格式
bin/katta search <index name>[,<index name>,...] “<query>” [count]

然后当然是列出你要查找的数据咯K

分布式Katta的配置

相关阅读

相关文章

相关问答

相关文档