ubuntu下Apache Solr的安装流程

段超
2023-12-01
一、介绍

Apache Solr是一种开放源码的、基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT

和 JSON 格式)。它易于安装和配置,而且附带了一个基于 HTTP 的管理界面。您可以坚持使用 Solr 的表现优异的基本搜索功能,也可以对它进行扩展从而满足企业的需要。

Solr 还拥有一个活跃的开发者群体,如有需要,您可以随时向他们寻求帮助。


二、需要安装的软件

1. jdk1.6或者更高版本

2. servlet 容器, tomcat6或者更高版本(默认端口8080),或者Jetty(默认端口8983)
   sudo tasksel install tomcat-server
   sudo aptitude install solr-tomcat

3. apache-solr 模块 (http://www.apache.org/dyn/closer.cgi/lucene/solr)), 找一个好用的镜像如:http://labs.renren.com/apache-mirror/lucene/solr/3.5.0/   现

在最新的是3.5.0

4. SolrPhpClint 开发包 (http://code.google.com/p/solr-php-client/downloads/list)


三、Solr的安装

1. 下载apache-solr-3.5.0.zip,解压。将apache-solr-3.5.0\dist下的apache-solr-3.5.0.war改名为solr.war并拷贝到tomcat6目录下的webapps目录中。(tomcat6在 /var/lib

下)

2. 将apache-solr-3.5.0\example\ 下的 solr 目录拷贝到任意位置,我是放在:/var/lib/tomcat6/solr

3. 在tomcat目录下的conf\Catalina\localhost 目录中(如果没有则手工创建该目录)创建solr.xml文件,文件内容如下:
<Context docBase="/var/lib/tomcat6/webapps/solr.war" debug="0" crossContext="true" >
   <Environment name="solr/home" type="java.lang.String" value="/var/lib/tomcat6/solr" override="true" />
</Context>

4. 修改tomcat的server.xml文件,找到<Connector port="8080" … 项(假设tomcat监听8080端口),添加编码方式,修改后如下<Connector port="8080" URIEncoding="UTF-8"

5. Solr重要文件的简单说明(详细信息tosee solr wiki)

solrconfig.xml是solr的基础文件,里面配置了各种web请求处理器、请求响应处理器、日志、缓存等。

schema.xml配置映射了各种数据类型的索引方案。分词器的配置、索引文档中包含的字段也在此配置。

6. 启动tomcat(/etc/init.d/tomcat6 start)。在浏览器中输入http://localhost:8080/solr/,出现“Welcom to Solr”页面,说明安装成功。


四、 drupal模块的安装

1. apachesolr模块:http://drupal.org/project/apachesolr

2. apachesolr_attachments模块:可用于附件的搜索,http://drupal.org/project/apachesolr_attachments

3. 下载SolrPhpClient,解压后可将其放入apachesolr文件夹内

4. 最主要的:修改apachesolr文件夹内的schema.xml,可修改一些参数增加filter,具体操作方式见配置文档;
    再修改solrconfig.xml的 <dataDir>${solr.data.dir:./solr/data}</dataDir>,此选项一定要打开,原先可能是被屏蔽的,作用是告诉solr将index数据放在哪里,配置中可见路径是/var/lib/tomcat6/solr/data(若无data文件,可自行创建,权限可暂时设置为777)。
   将此文件夹内的schema.xml和solrconfig.xml拷到/var/lib/tomcat6/solr/conf内。


5. 在我们自己的drupal网站上需要进行一些配置,主要是Solr path,需要设置为/solr,这个是根据你对solr路径的配置而定的


6. 我们的drupal网站会定时运行cron任务去set search index,也可以手动cron之,在Search index目录下


7. 重启tomcat(/etc/init.d/tomcat6 restart)


 类似资料: