当前位置: 首页 > 知识库问答 >
问题:

从tweet中删除常用词时,在索引id处获取序列“object has no attribute‘split’”

陆子航
2023-03-14

我正在尝试推特帖子的情感分析。我是情绪分析的新手。在文本预处理阶段,我遇到了从twit中删除频繁单词的问题。我想从twit中删除最频繁的单词,所以我通过以下方式计算了twit中最频繁的术语

freq=pd.Series(''.join(traindata['tweet']).split()).value_counts()[:10]

然后我将freq系列转换为list

freq=list(freq.index)

通过删除常用词来过滤我的twitter_单词栏。我使用了下面的代码

traindata['tweet']=traindata.apply(lambda x:" ".join(x for x in x.split() if x not in freq))

我得到了下面的错误

文件“C:\Users\codeman\Anaconda3\lib\site packages\pandas\core\generic.py”,第3614行,在返回对象中__getattribute(self,name)AttributeError:(“'Series'对象没有属性'split','发生在索引id')

请帮我解决这个问题。谢谢你们

共有1个答案

姬翰林
2023-03-14

我相信你需要指定列应用,否则循环所有列的DataFrame

f = lambda x:" ".join(x for x in x.split() if x not in freq)
traindata['tweet'] = traindata['tweet'].apply(f)
 类似资料:
  • 我正在尝试编写一种方法,删除每组4个元素中的第一个、第二个和第三个元素。它似乎根本不起作用。有人能帮忙吗?

  • 问题内容: 是否可以在Redis列表中的特定索引处删除元素?没有真正找到我想要的。有修剪可以让您选择一组特定的元素,LREM可以让您按值删除列表中的项目,但是我没有值。 我发现了一个黑客,您在其中使用LSET将元素的值更改为UID或字符串,例如“ DELETED”,然后您对该值调用LREM。不过,这感觉有点脏。 问题答案: 因此,完成我想要的操作的唯一方法是将索引处的值设置为预定字符串,然后按值进

  • 我的任务:我必须从jsp视图中删除对表“testtable”的每一行操作。 后端MySQL:=我有两个表一个“userinfo”用于aurtherntication,另一个表“testtable”。 对于两个表连接,我使用了jsp中的隐藏字段输入,而不是使用外键关系。 在控制台打印中,我们可以在单击delete按钮后看到com.mysql.jdbc.jdbc4PreparedStatement@1

  • 问题内容: 我正在尝试使用pandas创建一个,但是当我将数据导出到它时,我得到了一个额外的列 因此,我的结果是: 但是,预期结果是: 问题答案: 您所看到的是索引列。刚刚设置:

  • 在R中,当需要根据可以执行的列名称检索列索引时 有没有一种方法可以对熊猫数据帧执行相同的操作?

  • 它返回-1,因为它在ArrayList中找不到ID,我只需要获取ID号并删除带有该ID号的整个ArrayList