我正在寻找一些关于自然语言处理的建议。我想做一些研究,但我不确定我在研究什么。听起来很尴尬,但是...想象一下我有一篇关于动物的文章。它包含这样的句子
“狗住在北极。它们大约有1-3米长。”
诸如此类。不仅是关于狗,还有一堆用文字描述动物的文字。现在,我正在寻找一种能够分析文本并识别“关键字”
”的东西,比如“live”
或“long”
,然后收集数据并为购买新打印机时得到的动物提供数据表之类的东西。
所以我不是在寻找一个工具或类似的东西(但不介意)我需要更多关于关键字的建议,我可以做一些研究。
一旦你知道了你所谈论的动物(这可以通过训练模型在给定的文本中找到动物来完成),你需要做的就是使用“共同参考”并找出关于动物的信息。我不明白你想做什么研究,但这就是我要做的。
我将使用Opennlp训练一个动物模型,然后使用coreference找出动物的特征,然后将其放入表格中。
一些支持:这里
本篇故事纯属酒后性情大作,如有巧合,纯属雷同 话说天下大事,分久必合,合久必分。 之前谈到中文分词把文本切分成一个一个词语,现在我们要反过来,把该拼一起的词再拼到一起,找到一个命名实体,比如:“亚太经合组织” 条件随机场的用武之地 上回书说到,概率图模型中的条件随机场适用于在一定观测值条件下决定的随机变量有有限个取值的情况,它特殊就特殊在给定观察序列X时某个特定的标记序列Y的概率是一个指数函数ex
先来一段前戏 机器学习的过程是训练模型和使用模型的过程,训练就是基于已知数据做统计学习,使用就是用统计学习好的模型来计算未知的数据。 机器学习分为有监督学习和无监督学习,文本分类也分为有监督的分类和无监督的分类。有监督就是训练的样本数据有了确定的判断,基于这些已有的判断来断定新的数据,无监督就是训练的样本数据没有什么判断,完全自发的生成结论。 无论监督学习还是无监督学习,都是通过某种算法来实现,而
主要内容 前言 课程列表 推荐学习路线 数学基础初级 程序语言能力 机器学习简介 自然语言学习初级 数学和机器学习知识补充 自然语言处理中级 自然语言处理专项领域学习 前言 我们要求把这些课程的所有Notes,Slides以及作者强烈推荐的论文看懂看明白,并完成所有的老师布置的习题,而推荐的书籍是不做要求的,如果有些书籍是需要看完的,我们会进行额外的说明。 课程列表 课程 机构 参考书 Notes
知识图谱 接口: nlp_ownthink 目标地址: https://ownthink.com/ 描述: 获取思知-知识图谱的接口, 以此来查询知识图谱数据 限量: 单次返回查询的数据结果 输入参数 名称 类型 必选 描述 word str Y word="人工智能" indicator str Y indicator="entity"; Please refer Indicator Info
PyTorch 自然语言处理(Natural Language Processing with PyTorch 中文版)
这是一本关于自然语言处理的书。所谓“自然语言”,是指人们日常交流使用的语言,如英语,印地语,葡萄牙语等。