当前位置: 首页 > 知识库问答 >
问题:

需要为包含JSON/XML字符串的列创建索引。如何在solr中使用jsonTokenizerFactory在cassandra中进行分析

曾翰飞
2023-03-14

我是卡桑德拉的新手,我正在使用DSE 4.1.3,我将获取JSON文档/文件作为源,我必须将其作为json字符串存储在卡桑德拉表列之一中,我必须对其进行分析。任何人都可以告诉我如何使用jsonTonkenFactory类创建索引DSE搜索(solr)。

最近,我开始了解SIREN插件对solr的API扩展。SIREn 提供了在 JSON 文档上进行索引的示例

 <fieldType name="json" class="org.sindice.siren.solr.schema.SirenField"
           omitNorms="true"
           datatypeConfig="datatypes.xml">

  <analyzer type="index">

    <tokenizer class="org.sindice.siren.solr.analysis.JsonTokenizerFactory"/>

  </analyzer>

</fieldType>

和菲尔兹

    <schema name="example" version="1.5">

 <fields>

 <!-- _version_ and update log are required for SolrCloud -->
 <field name="_version_" type="long" indexed="true" stored="true"/>

 <!-- The ID of the document -->
 <field name="id" type="string" indexed="true" stored="true"/>

<!-- json indexing scheme -->
<field name="json" type="json" indexed="true" stored="false"/>

 </fields>

我试着把SIREn插件Jar文件放在Solr jar文件/etc/share/dse/solr/中

更多信息:http://sirendb.com/docs/getting-started/

有人知道在这种情况下该怎么做吗?

谢谢

共有1个答案

孟福
2023-03-14

按照文档为Solr放置定制罐子的位置:http://www.datastax.com/documentation/datastax_enterprise/4.0/datastax_enterprise/srch/srchConfLibPath.html

打包安装:/usr/share/dse

二进制安装:install_location/资源/dse/库

 类似资料:
  • 问题内容: 我有一个包含3列的表格:一个列表ID,名称和数字值。目的是使用该表来检索和更新各种列表中名称的数字值。 问题是sql拒绝使用name列创建索引,因为它是可变长度的字符串列。 如果没有索引,则使用名称进行选择将效率低下,并且使用静态长度文本列的选项将浪费大量存储空间,因为名称可能会很长。 建立该表及其索引的最佳方法是什么? (运行sql server 2008) 问题答案: 无法在或列上

  • 有人能帮我找到解决这个问题的办法吗,因为这会很有帮助。 谢谢

  • 问题内容: 有一个node.js应用程序正在接收包含文字NaN的JSON数据字符串,例如 这在Node.js中崩溃。如果可以,我想解析它。 我知道这不是JSON规范的一部分。大多数SO链接(在json中发送NaN812/sending- nan-in-json))建议修复输出。 在这里,尽管数据是在我无法控制的服务器中生成的,但是它是由一个商业Java库提供的,我可以在其中查看源代码。它是由Goo

  • 我已经阅读了这个类似问题的答案:YAML中的字符串是否需要引号? 然而,对于是否可以用包含正斜杠的字符串转义引号,没有答案。 例如,我们是否需要将引号添加到以下eslint规则“react/no deprecated”:off?

  • 我希望我能找到一些帮助。我是solr的新手,有机会参加一个关于它的讨论。对于以下情况,即使是主持讲座的顾问也不确定,因此我希望有人也有同样的问题。 我有一个由特定键标识的对象列表。例如:有50万名员工通过id(1-500000)标识。这些人中的每个人都必须在接下来的两年里工作。这些年的每一天都由一个字符标识(员工将工作——“A”,员工将不在工作——“B”)。所以每个员工都有一个最多包含730个字符

  • 问题内容: 我正在尝试对字符串列( 包含数字 )进行排序。 您会看到Mysql的自然排序算法放在后面( 对于大多数应用程序来说都可以 ),但是我有独特的需求,因此我希望结果应该像这样排序。 仅使用SQL 是否可能,或者我必须在应用程序级别操纵结果集? 问题答案: 继续 假设 它始终为WORD_space_NUMBER,这应该可行: 使用POSITION查找空间,使用SUBSTRING捕获其后的数字