scws 中文分词官方文档地址 :http://www.xunsearch.com/scws/docs.php
取得 scws-1.2.3 的代码
wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2
解开压缩包
tar xvjf scws-1.2.3.tar.bz2
进入解压程序目录执行配置脚本和编译
cd scws-1.2.3
./configure --prefix=/usr/local/scws && make && make install
顺利的话已经编译并安装成功到 /usr/local/scws 中了,执行下面命令看看文件是否存在
ls -al /usr/local/scws/lib/libscws.la
试试执行 scws-cli 文件
/usr/local/scws/bin/scws -h
出现以下信息则编译安装成功
scws (scws-cli/1.2.3)
Simple Chinese Word Segmentation - Command line usage.
Copyright (C)2007 by hightman.
6 用 wget 下载并解压词典,或从主页下载然后自行解压再将 *.xdb 放入 /usr/local/scws/etc 目录中
cd /usr/local/scws/etc #切换到词典存储目录
wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2 #下载词典
wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2 #下载词典
tar xvjf scws-dict-chs-gbk.tar.bz2#解压词典
tar xvjf scws-dict-chs-utf8.tar.bz2#解压词典
7.若要php 使用分词,必须安装 php 扩展。
1)进入源码目录的 phpext/ 目录 ( 确定当前路径为下载的scws-1.2.3路径下,cd scws-1.2.3 /phpext/)
这里出现
-bash: /www/server/bin/php7.1/scripts/phpize: Permission denied
解决办法:
cd ./scws-1.2.3 /phpext/
locate phpize
2)执行 phpize (在PHP安装目录的bin/目录下)
/www/server/bin/php7.1//bin/phpize
3)执行
./configure --with-php-config=/www/server/bin/php7.1//bin/php-config --with-scws=/usr/local/scws
注意:/www/server/bin/php7.1//bin/php-config 看您自己的php-config文件位置
4)用 root 身份执行 make install
make && make install
安装成功后 扩展共享目录:/www/server/bin/php7.1/lib/php/extensions/no-debug-non-zts-20131226/
5)在 php.ini 中加入以下几行
我的地址:/www/server/bin/php7.1/etc/php.ini
[scws]
;
; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
; 再把 extension = scws.so 指定绝对路径。
;
extension = scws.so
scws.default.charset = utf8
scws.default.fpath = /usr/local/scws/etc
6)命令行下执行 php -m 就能看到 scws 了或者在 phpinfo() 中看看关于 scws 的部分,记得要重启 web 服务器才能使新的 php.ini 生效。
注意:可能有的php 客户端版本比较低, 使用 php -m 显示的是客户端的版本 并不是实际安装的版本
那么可以通过 程序中的 phpinfo() 在浏览器上访问查看
重启脚本如下
service php-fpm restart
service nginx restart
7)这样就算安装完成了,余下的工作只是PHP代码编写问题了。
作者:@(T_T)
本文章如有错误,欢迎评论提出!
也可加入Q群一起学习:149325477
以上就是PHP使用scws-1.2.3 进行中文分词的详细内容!