当前位置: 首页 > 知识库问答 >
问题:

不确定如何开始使用NLP分析用户反馈

邢同
2023-03-14

我有138k的用户反馈记录,我想对这些记录进行分析,以了解用户最常说的话的大致模式。每一个都有1-5颗星的评级,所以我不需要做任何情绪分析。我最感兴趣的是将数据集拆分为

我遇到的一个关键问题是,我希望看到很多n-gram。我知道其中一些,如“HOV车道”、“拼车车道”、“绕道时间”、“让路”等,但我也希望通过编程来检测常见的双向和三向图。我一直在玩弄Spacy,但它似乎没有任何能力在语料库级别上进行分析,只能在文档级别上进行分析。

理想情况下,我的管道应该是这样的(我认为):

>

  • 将已知n-gram的列表导入标记器

    将每个字符串处理成一个标记化文档,删除标点符号、停止词等,同时在标记化过程中遵守已知的n-gram(即,“HOV-lane”应为单个名词标记)

    找出语料库中我遗漏的最常见的双图和三角图

    使用找到的n-gram重新标记

    按等级划分(

    为语料库中的每个数据分割找到最常见的主题

    我似乎找不到一个工具,甚至找不到一组工具,可以让我在这里做我想做的事情。我是不是走错了路?任何关于如何开始的建议都将不胜感激!

  • 共有2个答案

    白越
    2023-03-14

    维德工具是完美的情感分析和NLP为基础的应用程序。

    我认为提议的工作流程与本案例研究很好。密切配合您的特征提取,因为它非常重要。大多数情况下,trig在这些用例上都有很好的意义。

    使用Spacy将是一个更好的决定,因为SpaCy基于规则的匹配引擎和组件不仅可以帮助您找到术语和句子正在搜索的内容,还可以让您访问文本中的令牌及其与正则表达式相比的关系。

    夹谷衡
    2023-03-14

    宾果最先进的结果为您的问题!

    它被称为零短学习。用于无注释数据的文本分类的最新NLP模型。

    有关代码和详细信息,请阅读博客-https://joeddav.github.io/blog/2020/05/29/ZSL.html

    让我知道它是否对您或任何其他帮助有效。

     类似资料:
    • Proxy 组件是整个 Burp 的工作流的核心。它使得整个测试流程变为您使用浏览器浏览 Web 应用程序的同时 Burp 自动捕获所有相关信息,并让您选择进一步的操作。在测试中,侦测和分析阶段包括以下任务: 手动映射应用程序 - 使用浏览器通过 Burp Proxy 工作,通过手动映射应用程序,提交表单并逐步执行多步骤过程。此过程将使用请求的所有内容填充到代理组件(Proxy)的历史记录和目标组

    • 问题内容: 我已经下载了最新版本的JFreeChart(1.0.14),并想开始使用它。我只像以前一样导入标准Java程序包,并且从未处理过第三方库。我需要告诉jGRASP哪些信息,使其了解并可以访问JFreeChart库?我试图这样导入它,但收到以下错误。 问题答案: 您必须将库的jar文件添加到编译时和运行时CLASSPATH中。在jGRASP中,您可以通过“设置> PATH / CLASSP

    • 我以前从未使用过任何第三方库。下载了后该怎么办? 我不知道我是否做对了这些事情: 1。放置与我的源代码位于同一目录中 2。在源代码中导入所需的类(例如,) 许多文章告诉您如何在IDE中做到这一点。但是我用vim编写代码,自己编译,而不是IDE。那么,假设我没有做错任何事情,我应该如何用编译源代码,用运行代码? 编辑: 这是我的文件布局: /src |-测试。java /lib |-jcommon-

    • 问题内容: 有什么好的资源可以开始使用Node.JS?有没有好的教程,博客或书籍? 当然,我已经访问了它的官方网站http://nodejs.org/,但是我认为他们拥有的文档不是一个很好的起点。 问题答案: 讲解 NodeSchool.io交互式课程 节点的艺术(Node.js简介) 你好,世界 Node.js指南 使用Node.js,Express和MongoDB构建博客 适用于初学者的Nod

    • 问题内容: 我在这里和那里读过,我们现在 应该 使用Selenium 2(如果我的理解正确的话,请使用WebDriver)。我不是在谈论Selenium IDE,它确实很容易使用。 我已经阅读了Selenium网站上的文档(该文档声称不完整,因为Selenium 2不稳定,可以)。我的问题是:我无法开始使用Selenium。 我的意思是,如上所述,我已经下载并启动了它。我到处都找到了测试用例的样本

    • 问题内容: 我的代码有最后一个问题,涉及反射包中的.Call函数。 所以我在打这样的电话: 我正在执行.Call的方法如下: 我不太了解的是如何操作“ in”变量,以便将需要的映射正确传递到函数中。我看到make()中的第二个参数是参数的长度吗?但是我不太了解如何格式化var以正确传递参数。我递归地遇到错误消息: 任何帮助将非常感激! 问题答案: 来自: 呼叫调用函数与输入参数。例如,如果,代表去