最近准备一些文本处理的东西,
发现还有很多朋友纠结于nlpir (ictclas 2015) python 接口,
(必要的注释:ICTCLAS 已经更名为 NLPIR 了)
想起13年的时候通过python调用nlpir确实有些蛋疼,
虽然网上教程很多,但几乎没几个系统使用的,
GITHUB上,
国际友人@tsroten 提供了nlpir 的python接口包, pynlpir
安装使用也非常简单
如果有pip 的话,直接
pip install pynlpir #最新版本在4.0
项目地址在
https://github.com/tsroten/pynlpir;
有问题可以在
https://github.com/tsroten/pynlpir/issues
向tsroten提, 他也会中文的,所以写中文的问题也没有关系。
最好先查看下已经closed的问题中,有没有相关的问题。
tsroten一直在维护这个包,目前已经很成熟了。
---------------------------------------------------------------------
pynlpir 3.x 版本没有在pypi中提供nlpir的库文件,
最近上传的4.0版本已经包含了各个平台的库,
需要注意 pynlpir 只是nlpir 的接口,并没有任何实现,如果需要新功能、移植到新平台,
还是需要到nlpir的主页,向张教授提。
----------------------------------------------------------------------
一些常见的问题:
1. 基本使用请参考教程http://pynlpir.rtfd.org/
import pynlpir #加载包
pynlpir.open() #加载nlpir的库,这步是必须的
#否则会出现 段错误/段转储 segment fault的错误
在上一步的open() 函数执行后,如果出现
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "pynlpir/__init__.py", line 99, in open
raise RuntimeError("NLPIR function 'NLPIR_Init' failed.")
RuntimeError: NLPIR function 'NLPIR_Init' failed.
并且检查 pynlpir/Data/NLPIR.user文件内容,有
[...]pynlpir/pynlpir/Data/NLPIR.user Not valid license or your license expired! Please feel free to contact pipy_zhang@msn.com!
`
```
说明 pynlpir的library的授权过期了,
这个只能等张教授更新授权后才能使用了(我猜改日期可能可以用,可惜手头的过期版本已经删掉了)
```
3. pynlpir init failed, 找不到library
这个问题出现多在3.x版本,pypi上这些版本都没有包含nlpir的库,
到上述github 地址中下载最新版本安装就好了/或者直接下载对应平台的库,放在pynlpir的安装目录的lib目录下
4. 其它bug,须在github 上向tsroten 提交
---------------------------------------------------------------------------
python2 常出现编码问题,
还是改用python3吧
pynlpir支持python3的。