当前位置: 首页 > 面试题库 >

如何使用Stanford NLP Tagger和NLTK提高速度

罗睿识
2023-03-14
问题内容

有什么方法可以以更高性能的方式使用Standford Tagger?

每次调用NLTK的包装器时,每个分析的字符串都会启动一个新的Java实例,这非常慢,尤其是在使用较大的外语模型时。

http://www.nltk.org/api/nltk.tag.html#module-
nltk.tag.stanford


问题答案:

找到了解决方案。可以在servlet模式下运行POS Tagger,然后通过HTTP连接到它。完善。

http://nlp.stanford.edu/software/pos-tagger-
faq.shtml#d

在后台启动服务器

nohup java -mx1000m -cp /var/stanford-postagger-full-2014-01-04/stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTaggerServer -model /var/stanford-postagger-full-2014-01-04/models/german-dewac.tagger -port 2020 >& /dev/null &

调整防火墙以限制仅从本地主机访问端口2020

iptables -A INPUT -p tcp -s localhost --dport 2020 -j ACCEPT
iptables -A INPUT -p tcp --dport 2020 -j DROP

用wget测试

wget http://localhost:2020/?die welt ist schön

关闭服务器

pkill -f stanford

恢复iptable设置

iptables -D INPUT -p tcp -s localhost --dport 2020 -j ACCEPT
iptables -D INPUT -p tcp --dport 2020 -j DROP


 类似资料:
  • 本文向大家介绍如何提高javascript加载速度,包括了如何提高javascript加载速度的使用技巧和注意事项,需要的朋友参考一下 方法如下: 1、将所有<script>标签放在尽可能接近<body>标签底部的位置,以保证页面在脚本运行之前完成解析尽量减少对整个页面下载的影响 2、限制页面的<script>总数也可以改善性能。每当页面解析碰到一个<script>标签时, 紧接着有一段时间用于代

  • 我正在用fps参数提取mp4视频(video fps:25)中的所有帧,使用FFMPEG。 线程计数已更改,但速度未更改, ,使用和,也没有。

  • 我需要一个“列表”或“地图”,。。。此列表将从另一个ArrayList中添加。当A的参数等于时,对象A被视为等于另一个对象。 我的问题是我只想添加一个列表中不存在的对象。我想知道这两种实施方案之间的区别。使用ArrayList或HashMap 哪种方法可以更快地添加大量对象(超过1000个对象,或更多对象)有更好的模式解决我的问题吗???

  • 问题内容: 在不知道原因的情况下,脚本执行期间的测试速度非常慢。 这是我的脚本: 有什么建议可以使测试更快吗? 问题答案: 一个使脚本/程序更快的简单步骤是: 删除所有 ImplicitWait 实例为: 您正在广泛使用 WebDriverWait 即 显式等待 根据 显式和隐式等待 的文档: 警告 :请勿混合使用隐式和显式等待。这样做可能导致无法预测的等待时间。例如,将隐式等待设置为10秒,将显

  • 我是Apache Hbase的新手,我使用的是hbase-0.98.13,并且我已经创建了一个表示例,其列族为sample_family。并且我已经将pig脚本的输出加载到hbase表中。当我尝试基于列族中的一个列扫描表时,它需要超过2分钟。 是否为此进行任何配置更改?有人能帮我吗?

  • 嗨,有没有什么方法可以提高滚动速度。我找到了一些解决方案,但都不适合我。这就是我尝试的: 或者使用css: 还有别的办法吗?编辑:上面的解决方案都不起作用,我试图使用大得离谱的数字,但滚动速度还是一样