之前的spacy库官方一般提供有英文模型,安装的方法如下所示
python -m spacy download en
一般在spacy2.3.0版本库上可以使用中文模型,官网上提供有三个中文模型zh_core_web_sm,zh_core_web_md,zh_core_web_lg,下载的方式如下所示
python -m spacy download zh_core_web_sm
python -m spacy download zh_core_web_md
python -m spacy download zh_core_web_lg
中文多任务CNN在OntoNotes上进行了训练。用于分配单词向量,POS标注,依存句法分析和命名体识别。在Wikipedia和OSCAR(通用抓取)上使用FastText CBOW训练的单词向量。使用的时候可以使用以下命令进行加载模型文件:
spacy.load('zh_core_web_md')
spacy库的使用方法在后续博文中详细讲述。
[1]spacy中文模型官网
[2]spacy官网