当前位置：首页 > 软件库 > 神经网络/人工智能 > 自然语言处理 >

Stanza

斯坦福自然语言处理 Python 库

授权协议 Apache-2.0

开发语言 Python

所属分类神经网络/人工智能、自然语言处理

软件类型开源软件

地区不详

投递者陶泳

操作系统跨平台

开源组织无

适用人群未知

软件概览

Stanza 是斯坦福 NLP 组的官方 Python NLP（自然语言处理）库。它支持在 60 多种语言上运行各种准确的自然语言处理工具，并支持从 Python 访问 Java Stanford CoreNLP 软

安装

pip

Stanza 支持 Python 3.6 或更高版本。建议通过 Python 包管理器 pip 安装 Stanza

pip install stanza

如果当前安装了以前的版本stanza，请使用：

pip install stanza -U

Anaconda

要通过 Anaconda 安装 Stanza，请使用以下 conda 命令：

conda install -c stanfordnlp stanza

请注意，目前已通过 Anaconda 安装 Stanza 不适用于 Python 3.8。对于 Python 3.8，请使用 pip 安装。

从源代码

也可以从这个 git 仓库的源代码安装：

git clone https://github.com/stanfordnlp/stanza.git
cd stanza
pip install -e .

运行 Stanza

要运行您的第一个 Stanza 管道，只需在您的 Python 交互式解释器中执行以下步骤：

>>> import stanza
>>> stanza.download('en')       # This downloads the English models for the neural pipeline
>>> nlp = stanza.Pipeline('en') # This sets up a default neural pipeline in English
>>> doc = nlp("Barack Obama was born in Hawaii.  He was elected president in 2008.")
>>> doc.sentences[0].print_dependencies()

如果遇到requests.exceptions.ConnectionError，请尝试使用代理：

>>> import stanza
>>> proxies = {'http': 'http://ip:port', 'https': 'http://ip:port'}
>>> stanza.download('en', proxies=proxies)  # This downloads the English models for the neural pipeline
>>> nlp = stanza.Pipeline('en')             # This sets up a default neural pipeline in English
>>> doc = nlp("Barack Obama was born in Hawaii.  He was elected president in 2008.")
>>> doc.sentences[0].print_dependencies()

使用案例

斯坦福大学Stanza的使用

斯坦福大学自然语言处理组最新上线了新的Stanza系统，以Python包的方式发布，提供预先训练好的66种自然语言的模型。介绍在这里：https://stanfordnlp.github.io/stanza/index.html#about Stanza没有提供直接的语言模型下载通道，本文说明如何解决使用download()下载异常的问题。 ========================= S
jieba、HanLP、Stanza实现中文文本处理的基本任务

因为课程需要跑通NLP的基本任务，这里记录一下安装使用的过程、参考的官方文档以及我遇到的坑英文文本见我的另一篇文章：NLTK+StanfordCoreNLP实现英文文本处理的基本任务一、jieba jieba官方文档：https://github.com/fxsjy/jieba 完成以下任务：分词自定义词典停用词关键词提取词性标注 import jieba import colle
NLP工具——Stanza设置GPU device

1. 简介这篇博客介绍如何在stanza工具中修改设置device。由于stanza模型代码中只预留了设置cpu还是cuda，但是没有给出设置device的选项，这导致我们在多卡的情况下调用模型时不够灵活。所以本文对这一内容进行介绍。原理很简单，把所有的.cuda()修改为.to(device)即可。此方法同样适用于其他开源项目。 2. 修改 pipeline/core.py中，修改： cla
xml stanza_使用stanza nlp软件包探索文学

xml stanza The Stanford NLP Group has long been an active player in natural language processing, particularly through their well-known CoreNLP Java toolkit. Until recently though, Stanford NLP has bee

Stanza

安装

pip

Anaconda

从源代码

运行 Stanza

同类工具

相关阅读

相关文章

相关问答

相关文档