当前位置：首页 > 面试题库 >

计算Dataframe Pandas中句子中最常见的100个单词

诸嘉澍

2023-03-14

问题内容：

我在Pandas数据框的一栏中有文字评论，我想用频率计数来计算N个最频繁出现的单词（整列-
不在单个单元格中）。一种方法是使用计数器，通过遍历每一行来对单词进行计数。有更好的选择吗？

代表性数据。

0    a heartening tale of small victories and endu
1    no sophomore slump for director sam mendes  w
2    if you are an actor who can relate to the sea
3    it's this memory-as-identity obviation that g
4    boyd's screenplay ( co-written with guardian

问题答案：

from collections import Counter
Counter(" ".join(df["text"]).split()).most_common(100)

我很确定会给您您想要的东西（您可能必须在调用most_common之前从计数器结果中删除一些非单词）

类似资料：

用Java计算句子中每个单词的频率

问题内容：我正在编写一个非常基本的Java程序，该程序可以计算句子中每个单词的频率，到目前为止，我设法做到了这一点我已经提取了每个字符串并将其存储在数组中，现在的问题实际上是如何计算每个“单词”重复出现的次数以及如何显示以使重复的单词不会多次显示，您能帮我这个忙吗？一个？问题答案：使用以单词为键的地图并将其计为值，像这样如果不允许使用java.util，则可以使用一些排序算法对arr进行
计算句子中每个单词的元音[重复]

给定一个句子，我希望能够数出每个单词中有多少个元音。示例输入：示例输出: 我最初的想法是有2个同时循环。第一个循环直到满足EOF以结束程序，第二个（嵌套的）同时循环将运行直到满足空格 (" ") ，同时还对当前单词中的元音求和。一旦遇到空格，它将打印出元音的当前值，第二个同时循环将结束并重新开始（元音计数器重置回0）。这是我为此编写的代码: 然而，这导致语法错误，我不能找出我的错误。第6行
计算句子第一个单词中的字母数

我在大学上Java入门课程。我的作业是写一个程序来显示一个句子中1个字母单词的数量，一个句子中2个字母单词的数量...等等。句子是用户输入的。我应该使用一个循环，但不允许使用数组。然而，现在只是开始，我只是想找出句子第一个单词的字母数。我得到的结果要么是字母数不正确，要么是字符串索引超出范围。例如，当我输入“这是一个句子”时，它会给我“字符串索引超出范围：4”对此的任何帮助都将不胜感激。
计算句子每个单词中的元音和字符

我一直在试图弄清楚如何计算句子每个单词中的元音和字符。例如在句子 < code>hello : 5个字符，2个元音 <代码>有:5个字符，2个元音。我见过完整句子做同样事情的代码。但不是一个字一个字地。下面是我一直在做的编码输入将全部。我很难弄清楚这一点。在运行代码时，我没有得到元音计数。我能把句子分开。但元音计数没有发生。
Java初学者-计算句子中的单词数

问题内容：我想使用方法来计算一个句子中的单词数。我写了这段代码，但我不太确定为什么它不起作用。无论我写什么，我都只会收到一个单词的数。如果您能告诉我如何修正我写的内容，而不是给我一个完全不同的主意，那就更好了：问题答案：您需要阅读整行。代替使用。
计算句子中重复单词的总数[重复]

我想计算一个句子中重复单词或重复单词的总数。这里我可以打印单词，但不能计算这些单词。我期望输出：- 给定字符串中的重复单词：大黑色给定字符串中的重复单词总数：2 输出如下：给定字符串中的重复单词：大黑色给定字符串中的重复单词总数：10 总计数显示为10，而不是2。

计算Dataframe Pandas中句子中最常见的100个单词

相关阅读

相关文章

相关问答

相关工具

相关文档