5.4.spelldump命令参考
优质
小牛编辑
131浏览
2023-12-01
spelldump
是Sphinx的一个辅助程序。
用于从ispell
或者MySpell
格式的字典文件中可用来辅助建立词形列表(wordforms)的内容——词的全部可能变化都预先构造好。
一般用法如下:
spelldump [options] <dictionary> <affix> [result] [locale-name]
两个主要参数是词典的主文件([language-prefix].dict
)和词缀文件([language-prefix].aff
);通常这两种文件被命名为[语言简写].dict和[语言简写].aff,大多数常见的Linux发行版中都有这些文件,网上也到处找得到。
[result]
指定的是字典数据的输出位置,而[locale-name]
指定了具体使用的区域设置(locale)
还有一个-c [file]
选项,用来指定一个包含大小写转换方面细节的文件。
用法示例:
spelldump en.dict en.aff spelldump ru.dict ru.aff ru.txt ru_RU.CP1251 spelldump ru.dict ru.aff ru.txt .1251
结果文件会包含字典中包含的全部词,字典序排列,wordforms文件格式。可以根据具体的使用环境定制这些文件。结果文件的一个例子:
zone > zone zoned > zoned zoning > zoning