当前位置：首页 > 软件库 > 程序开发 > 中文分词库 >

TextGrocery

短文本分类工具

授权协议 GPL

开发语言 C/C++ Python

所属分类程序开发、中文分词库

软件类型开源软件

地区国产

投递者闾丘英悟

操作系统 Windows

开源组织无

适用人群未知

软件概览

TextGrocery 是一个基于SVM算法的短文本分类工具，内置了结巴分词，让文本分类变得简单。

示例代码：

>>> from tgrocery import Grocery
# 新开张一个杂货铺，别忘了取名！
>>> grocery = Grocery('sample')
# 训练文本可以用列表传入
>>> train_src = [
    ('education', '名师指导托福语法技巧：名词的复数形式'),
    ('education', '中国高考成绩海外认可 是“狼来了”吗？'),
    ('sports', '图文：法网孟菲尔斯苦战进16强 孟菲尔斯怒吼'),
    ('sports', '四川丹棱举行全国长距登山挑战赛 近万人参与')
]
>>> grocery.train(train_src)
# 也可以用文件传入
>>> grocery.train('train_ch.txt')
# 保存模型
>>> grocery.save()
# 加载模型（名字和保存的一样）
>>> new_grocery = Grocery('sample')
>>> new_grocery.load()
# 预测
>>> new_grocery.predict('考生必读：新托福写作考试评分标准')
education
# 测试
>>> test_src = [
    ('education', '福建春季公务员考试报名18日截止 2月6日考试'),
    ('sports', '意甲首轮补赛交战记录:米兰客场8战不败国米10年连胜'),
]
>>> new_grocery.test(test_src)
# 准确率
0.5
# 同样可以用文本传入
>>> new_grocery.test('test_ch.txt')
# 自定义分词器
>>> custom_grocery = Grocery('custom', custom_tokenize=list)

使用案例

TextGrocery短文本分类使用

TextGrocery是一个基于LibLinear和结巴分词的短文本分类工具，特点是高效易用，同时支持中文和英文语料。 GitHub项目链接具体的使用可以参考：文档 1、安装通过GitHub（最新版本） git clone https://github.com/2shou/TextGrocery.git --depth=1 cd TextGrocery make 2、通过pip（更稳定） pi
python3下使用TextGrocery的一系列问题,掉在OSError: [WinError 126] 找不到指定的模块坑里

TextGrocery是一款高效的短文本分类工具，该封装包集成了对文本的一些处理，但是该项目作者目前已不再维护此项目，最新版本只支持python2 。虽然anaconda创建一个新的python2环境很容易，但是我已经习惯了用pyhon3，因此需要做些修改。那该如何修改呢？当然是问度娘了，找了一会发现简书上的一篇文章说得相对比较全，我就在此记录一下，如何在python3下使用TextGrocer
短文本分类工具 TextGrocery

>>> from tgrocery import Grocery # 新开张一个杂货铺，别忘了取名！ >>> grocery = Grocery( 'sample' ) # 训练文本可以用列表传入 >>> train_src = [ ( 'education' , '名师指导托福语法技巧：名词的复数形式' ), ( 'education' , '中国高考成绩海
nlp 短文本分类 tgrocery & TextGrocery 安装出现错误总结 No module named 'converter'

在安装tgrocery的时候会报错，而且会一直出现错误，看以前也没有具体写tgrocery安装报错如何处置的文章，写一下自己在安装tgrocery过程中遇到的问题。可能这篇文章有点长，因为遇到的问题很多。两点说明据说这个包只能在linux下跑本人也是在linux环境下跑的在windows环境下没有实际测试过这个包是用python2 写的所以和python3有些兼容的问题但是按照下面
如何解决TextGrocery的python3兼容问题

最近在学习文本分类相关内容，看到了有资料用TextGrocery来做，所以想上手试一试。因为我用惯了python3，所以想在python3上做，但是发现了很多问题。下面我们对这些问题进行解决。温馨提示：如果你是python2，完全可以直接用2做，真的没有必要用3（哭了，本人强迫症吧可能*~*）。确认安装好相应包首先我们要知道这个包只能在Linux环境下运行，我在windows下试过，安装包时
TextGrocery中文文本分类处理

详细使用说明：http://textgrocery.readthedocs.io/zh/latest/index.html TextGrocery是一个基于LibLinear和结巴分词的短文本分类工具，特点是高效易用，同时支持中文和英文语料。 GitHub项目链接需要安装： pip install classifier 过程： >>> from tgrocery import Grocery
TextGrocery，更好用的文本分类Python库

古龙说，无论什么东西，最好的都只有一种。经历半年的文本分类实践，我们基本已断定，最好的文本分类算法就是SVM – 支持向量机。但是纵然知道了天机，新手做文本分类仍然需要学习不少东西，例如算法原理、分词、向量化等等。如果用上scikit-learn这样的庞然大物，更有种高射炮打蚊子的异样感。有没有可能把最好的文本分类算法，包装成一个超级简单的工具提供给大家？这是我开发TextGrocery的初
短文本Python库TextGrocery

http://textgrocery.readthedocs.io/zh/latest/index.html http://www.jianshu.com/p/9d6bf22eb4bb

TextGrocery

同类工具

相关阅读

相关文章

相关问答

相关文档