当前位置: 首页 > 知识库问答 >
问题:

如何从Stanford NLP工具中获得增强的依赖解析?

夹谷茂
2023-03-14

共有1个答案

濮阳景天
2023-03-14

这里有关于如何训练模型的信息:

https://stanfordnlp.github.io/corenlp/depparse.html

示例命令:

java -Xmx12g edu.stanford.nlp.parser.nndep.DependencyParser -trainFile fr-ud-train.conllu -devFile fr-ud-dev.conllu -model new-french-UD-model.txt.gz -embedFile wiki.fr.vec -embeddingSize 300 -tlp edu.stanford.nlp.trees.international.french.FrenchTreebankLanguagePack -cPOS
java -mx1g edu.stanford.nlp.tagger.maxent.MaxentTagger -props myPropertiesFile.props 

示例文件:


## tagger training invoked at Sun Sep 23 19:24:37 PST 2018 with arguments:
                   model = english-left3words-distsim.tagger
                    arch = left3words,naacl2003unknowns,wordshapes(-1,1),distsim(/u/nlp/data/pos_tags_are_useless/egw4-reut.512.clusters,-1,1),distsimconjunction(/u/nlp/data/pos_tags_are_useless/egw4-reut.512.clusters,-1,1)
            wordFunction = edu.stanford.nlp.process.AmericanizeFunction
               trainFile = /path/to/training-data
         closedClassTags = 
 closedClassTagThreshold = 40
 curWordMinFeatureThresh = 2
                   debug = false
             debugPrefix = 
            tagSeparator = _
                encoding = UTF-8
              iterations = 100
                    lang = english
    learnClosedClassTags = false
        minFeatureThresh = 2
           openClassTags = 
rareWordMinFeatureThresh = 10
          rareWordThresh = 5
                  search = owlqn
                    sgml = false
            sigmaSquared = 0.0
                   regL1 = 0.75
               tagInside = 
                tokenize = true
        tokenizerFactory = 
        tokenizerOptions = 
                 verbose = false
          verboseResults = true
    veryCommonWordThresh = 250
                xmlInput = 
              outputFile = 
            outputFormat = slashTags
     outputFormatOptions = 
                nthreads = 1

这里有一个详尽的示例训练属性文件列表:

https://github.com/stanfordnlp/corenlp/tree/master/scripts/pos-tagger

 类似资料:
  • 我正在使用Stanford coreNLP解析器,我遇到了一个小问题,我认为这只是由于我缺乏经验而错过的一些愚蠢的东西。我目前使用的是Node.js stanford-corenlp包装器模块和Stanford Corenlp的最新完整Java版本。 如果有人能给我提供一些线索,甚至只是什么方向我需要更多的研究,这将是非常有帮助的。目前,谷歌在具体的“增强”结果方面没有提供太多帮助,我只是试图找出

  • 我正在逐个迭代字符串对象列表中的元素: 在这里,每次我调用list上的get()时,列表都会从其一端一直迭代到第i个元素——因此上面循环的复杂性是O(n^2)。 是a.)对于增强型for循环,与上面相同,还是b.)对于循环,将指针保持在最后一个指针所在的位置,因此下面循环的复杂性是O(n)? 如果上面的情况(b)——我想是这样的——在列表上使用迭代器有什么好处吗。这是简单的迭代--没有回头路 蒂亚

  • Composer php 软件包依赖管理器 composer list #显示所有命令 composer show #显示所有包信息 composer install #在 composer.json 配置中添加依赖库之后运行此命令安装 composer create-project laravel/laravel Laravel --prefer-dist 5.1.* #创建项目 com

  • 铅笔工具已经过改进,便于更好地进行曲线拟合、路径自动关闭、绘制受控与不受控直线段。 铅笔工具 预设 双击“工具箱”中的“铅笔”工具图标,以打开“铅笔工具选项”对话框。“保真度”滑块具有四个预设可供选择。最左侧的滑块预设(精确)用于绘制最精确的路径。最右侧的滑块预设(平滑)用于创建最平滑的路径。选择最适合您绘图需要的预设。<b>(左图)</b> Illustrator CC (v17.x) <br/

  • Windsor 中的组件很少是独立的。毕竟,Windsor 最主要的任务是查找和管理依赖。如果组件有一些依赖,Windsor 通过几个步骤来解析它们。 依赖解析器(Dependency Resolver) Windsor 使用依赖解析器(实现 IDependencyResolver 接口的类型)解析组件的依赖。默认依赖解析器 (DefaultDependencyResolver 类)检查以下几个地

  • cytoscape.org/nexus/的链接是:http://code.cytoscape.org/nexus/content/repositories/releases/org/cytoscape/vizmap-api/3.6.0/