中科院NLPIR授权
使用中科院NLPIR进行分词:
import pynlpir
pynlpir.open() # 打开分词器
sentence = '前一段时间在使用张华平博士的NLPIR中文分词系统'
for i in pynlpir.segment(sentence):
print i[0], ' ', i[1]
发现报错了:
初始化失败!fail reason is /usr/local/lib/python2.7/dist-packages/pynlpir/Data/NLPIR.user Not valid license or your license expired! Please feel free to contact pipy_zhang@msn.com!
根据报错信息,就是说“/usr/local…../Data/”下面的NLPIR.user过期了,需要重新去下载新的认证。
项目Github链接:https://github.com/NLPIR-team/NLPIR/tree/master/License
”license for a month“是一个月可用的授权。
把更新包download下来后找到我的”/usr/local/…/pynlpir/Data/”目录,如果是只需要使用分词,可以只把下载包中 NLPIR-ICTCLAS分词系统授权 文件夹下的 NLPIR.user 拿出来替换Data 里原有的就可以了。如果还需要使用NLPIR其他功能,操作也一样。重启pycharm,成功分词。
前 noun of locality
一 numeral
段 classifier
时间 noun
在 preposition
使用 verb
张华平 noun
博士 noun
的 particle
NLPIR noun
中文 noun
分词 verb
系统 noun
使用tagging=False
可以不要词性标注结果:
line = " ".join(pynlpir.segment(sentence, pos_tagging=False))
# 前 一 段 时间 在 使用 张华平 博士 的 NLPIR 中文 分词 系统