3.8.xmlpipe 数据源

优质

小牛编辑

137浏览

2023-12-01

xmlpipe 数据源是处于让用户能够将现有数据嵌入Sphinx而无需开发新的数据源驱动的目的被设计和提供的。它将每篇文档限制为只能包括两个可全文索引的字段，以及只能包括两个属性。xmlpipe数据源已经被废弃，在Section3.9, “xmlpipe2 数据源”中描述了xmlpipe的替代品xmlpipe2数据源。对于新的数据，建议采用xmlpipe2。

为了使用xmlpipe，需要将配置文件改为类似如下的样子：

source example_xmlpipe_source
{
type = xmlpipe
xmlpipe_command = perl /www/mysite.com/bin/sphinxpipe.pl
}

indexer实用程序将要运行xmlpipe_command, 所指定的命令，而后读取其向标准输出stdout上输出的数据，并对之进行解析并建立索引。严格的说，是索引系统打开了一个与指定命令相连的管道，并从这个管道读取数据。

indexer 实用程序假定在从标准输入读入的XML格式的数据中中存在一个或更多的文档。下面是一个包括两个文档的文档数据流的例子：

Example2.XMLpipe 文档数据流

<document>
<id>123</id>
<group>45</group>
<timestamp>1132223498</timestamp>
<title>test title</title>
<body>
this is my document body
</body>
</document>
<document>
<id>124</id>
<group>46</group>
<timestamp>1132223498</timestamp>
<title>another test</title>
<body>
this is another document
</body>
</document>

遗留的xmlpipe数据驱动使用内置的解析器来解析xml文档，这个解析器的速度非常快，但是并没有提供对XML格式完整支持。这个解析器需要文档中必须包括全部的字段，并且严格按照例子中给出的格式给出，而且字段的出现顺序需要严格按照例子中给出的顺序。仅有一个字段timestamp是可选的，它的缺省值为1。