当前位置: 首页 > 知识库问答 >
问题:

制作solr来理解英语

梁丘赞
2023-03-14

我试图设置solr应该理解英语。例如,我索引了我们公司的网站(www.biginfolabs.com),也可以是任何其他网站或我们自己的数据

    null
  • 集成了UIMA、Mahout和solr(完成了人名、城市名提取)。
  • 我读了一本名为《驯服文本》的书,并实现了https://github.com/tamingtext/book。但没有得到我想要的。

谁能告诉我怎么走得更远。它可以是我们团队准备做的任何事情。

共有1个答案

容俊豪
2023-03-14

这项任务称为命名实体识别。您可以查阅本教程,了解他们如何使用Solr将文本中的原子元素提取到预定义的类别中,如人名、组织、位置、时间表达式、数量、货币值、百分比等,然后学习回答查询的模型

也可以看看斯坦福NLP,了解更多关于你可以使用的算法的想法。

 类似资料:
  • 本文向大家介绍CTS、CLS、CLR分别作何解释(*)把英文全称背过来。相关面试题,主要包含被问及CTS、CLS、CLR分别作何解释(*)把英文全称背过来。时的应答技巧和注意事项,需要的朋友参考一下 CTS:Common Type System 通用类型系统。Int32、Int16→int、String→string、Boolean→bool。每种语言都定义了自己的类型,.Net通过CTS提供了公

  • 我试图在db数据配置中使用jndiName属性。xml。这在tomcat中非常有效。然而,在websphere中存在问题。 引发以下异常 确保J2EE应用程序不会在静态代码块内或该J2EE应用程序创建的线程中对“java:”名称执行JNDI操作。此类代码不一定在服务器应用程序请求的线程上运行,因此“java:”名称上的JNDI操作不支持这些代码。[根异常是javax.naming.NameNotF

  • 这是我用来立即激发job的代码:

  • 问题: 如何为整个网站设计一个URL控制方案 / 调度模式 解决: web.py的URL控制模式是简单的、强大的、灵活的。在每个应用的最顶部,你通常会看到整个URL调度模式被定义在元组中: urls = ( "/tasks/?", "signin", "/tasks/list", "listing", "/tasks/post", "post", "/tasks/c

  • 本文向大家介绍由ArrayList来深入理解Java中的fail-fast机制,包括了由ArrayList来深入理解Java中的fail-fast机制的使用技巧和注意事项,需要的朋友参考一下 1. fail-fast简介 “快速失败”也就是fail-fast,它是Java集合的一种错误检测机制。某个线程在对collection进行迭代时,不允许其他线程对该collection进行结构上的修改。 例

  • 我正在阅读Scala Cookbook(http://shop.oreilly.com/product/0636920026914.do) 有一个与未来使用相关的例子,涉及理解。 到目前为止,我对理解的理解是,当与一个集合一起使用时,它会产生另一个相同类型的集合。例如,如果每个< code>futureX的类型为< code>Future[Int],则以下内容也应为< code>Future[In