5.4.spelldump命令参考

优质
小牛编辑
131浏览
2023-12-01

spelldump是Sphinx的一个辅助程序。

用于从ispell或者MySpell格式的字典文件中可用来辅助建立词形列表(wordforms)的内容——词的全部可能变化都预先构造好。

一般用法如下:

spelldump [options] <dictionary> <affix> [result] [locale-name]

两个主要参数是词典的主文件([language-prefix].dict)和词缀文件([language-prefix].aff);通常这两种文件被命名为[语言简写].dict和[语言简写].aff,大多数常见的Linux发行版中都有这些文件,网上也到处找得到。

[result]指定的是字典数据的输出位置,而[locale-name]指定了具体使用的区域设置(locale)

还有一个-c [file]选项,用来指定一个包含大小写转换方面细节的文件。

用法示例:

spelldump en.dict en.aff
spelldump ru.dict ru.aff ru.txt ru_RU.CP1251
spelldump ru.dict ru.aff ru.txt .1251

结果文件会包含字典中包含的全部词,字典序排列,wordforms文件格式。可以根据具体的使用环境定制这些文件。结果文件的一个例子:

zone > zone
zoned > zoned
zoning > zoning