项目地址:(但基本无法下载)
https://github.com/mhjabreel/CharCNN/tree/master/data/ag_news_csv
AG是由ComeToMyHead超过一年的努力,从2000多不同的新闻来源搜集的超过1百万的新闻文章
ComeToMyHead是一个学术新闻搜索引擎,开始于2004年7月
csv的数据
每一条数据有三列,第一列为标签,第二列为title,第三列为content:
AG News Dataset 拥有超过 100 万篇新闻文章,其中包含 496,835 条 AG 新闻语料库中超过 2000 个新闻源的文章,该数据集仅采用了标题和描述字段,每种类别均拥有 30,000 个训练样本和 1900 个测试样本。
下载地址:https://hyper.ai/datasets/5475
智一面算法工程师的面试题提供在线GPU加速训练可直接使用数据集