-
Github
-
https://github.com/sebastianruder/NLP-progress
-
-
官方网址
-
https://nlpprogress.com/
-
NLP-Progress 同时涵盖了传统的NLP任务,如依赖解析和词性标注,和一些新的任务,如阅读理解和自然语言推理。它的不仅为读者提供这些任务的 baseline 和 标准数据集,还记录了这些问题的state-of-the-art。
下面小编简单列举了几个NLP-Progress 记录的任务:
-
Coreference resolution 共指消解
-
Dependency parsing 依存分析
-
Dialogue 对话
-
Domain Adaption 领域迁移
-
Entity Linking 实体链接
-
Information extraction 信息抽取
-
Language modeling 语言模型
-
Machine translation 机器翻译
-
Multi-task learning 多任务学习
-
Multi-modal 多模态
-
Named entity recognition 命名实体识别
-
Natural language inference 自然语言推理
-
Part-of-speech tagging 词性标注
-
Question answering 问答
-
Relation prediction 关系预测
-
Relationship extraction 关系抽取
-
Semantic textual similarity 语义文本相似性
-
Semantic parsing 语义分析
-
Semantic role labeling 语义角色标注
-
Sentiment analysis 情感分析
-
Summarization 文本摘要
-
Taxonomy learning 分类结构学习
-
Temporal processing 时序分析
-
Text classification 文本分类
-
Word sense disambiguation 词义消岐
对于每一个任务,NLP-Progress都会简单介绍一下这个任务是做什么的,并详细列出公开的标准数据集,以及在该数据集上各个模型目前的排名情况。比如,比较火的Question answering 问答系统任务,它的组织形式如下:
具体到某一个开放数据集,如 Quasar, 贡献者会简单介绍该数据集的组成,然后列出论文排行榜,其中每一行都包括:模型,效果,文章名和链接,以及代码链接。