当前位置: 首页 > 工具软件 > Jcseg > 使用案例 >

jcseg 配置详解

柯清野
2023-12-01

Jcseg function

最大匹配长度. (5-7)
jcseg.maxlen = 4

认出了中国人的名字.(1 to open and 0 to close it)
jcseg.icnname = 1

对标点符号文本的最大长度。
jcseg.pptmaxlen = 7

中文姓氏的最大长度
jcseg.cnmaxlnadron = 1

是否清除停止语。.(set 1 to clear stopwords and 0 to close it)
jcseg.clearstopword = 1

是否将中文数字转换为阿拉伯数字。 (set to 1 open it and 0 to close it)
jcseg.cnnumtoarabic = 1

是否将中文分式转换为阿拉伯分式
jcseg.cnfratoarabic = 0

#是否保留未识别的单词. (设置1保留无法识别的单词,设置0清除它)
jcseg.keepunregword = 1

#是否对复杂英语单词进行二次切分.
jcseg.ensencondseg = 1

#次要简单令牌的最小长度. (better greater than 1)
jcseg.stokenminlen = 2

在你知道你在做什么之前最好不要改变它
jcseg.nsthreshold = 1000000

#将保留在标记中的标点符号集.(Not the end of the token).
jcseg.keeppunctuations = @#%.&+

默认加载类路径中的词典
lexicon.path = /mnt/elasticsearch/elasticsearch-7.6.1/plugins/jcseg/lexicon

是否自动加载修改后的词典文件
lexicon.autoload = 1

自动加载的轮询时间(秒)
lexicon.polltime = 300

是否加载条目的词性。
jcseg.loadpos = 1

是否加载条目的拼音
jcseg.loadpinyin = 0

是否加载条目的同义词
jcseg.loadsyn = 1

#是否加载条目的实体
jcseg.loadentity = 1

 类似资料: