当前位置: 首页 > 工具软件 > TextGrocery > 使用案例 >

短文本分类工具 TextGrocery

夏兴生
2023-12-01
>>>  from  tgrocery  import  Grocery
# 新开张一个杂货铺,别忘了取名!
>>> grocery  Grocery( 'sample' )
# 训练文本可以用列表传入
>>> train_src  = [
     ( 'education' '名师指导托福语法技巧:名词的复数形式' ),
     ( 'education' '中国高考成绩海外认可 是“狼来了”吗?' ),
     ( 'sports' '图文:法网孟菲尔斯苦战进16强 孟菲尔斯怒吼' ),
     ( 'sports' '四川丹棱举行全国长距登山挑战赛 近万人参与' )
]
>>> grocery.train(train_src)
# 也可以用文件传入
>>> grocery.train( 'train_ch.txt' )
# 保存模型
>>> grocery.save()
# 加载模型(名字和保存的一样)
>>> new_grocery  = Grocery( 'sample' )
>>> new_grocery.load()
# 预测
>>> new_grocery.predict( '考生必读:新托福写作考试评分标准' )
education
# 测试
>>> test_src  = [
     ( 'education' '福建春季公务员考试报名18日截止 2月6日考试' ),
     ( 'sports' '意甲首轮补赛交战记录:米兰客场8战不败国米10年连胜' ),
]
>>> new_grocery.test(test_src)
# 准确率
0.5
# 同样可以用文本传入
>>> new_grocery.test( 'test_ch.txt' )
# 自定义分词器
>>> custom_grocery  = Grocery( 'custom' , custom_tokenize = list )

 类似资料: