我在读取R中的txt文件时遇到了一些问题,我认为该文件是由行尾问题创建的。我有一个包含两列的数据帧:第一列包含格式为__label__1234的标签,第二列是一个文本字符串(出于隐私原因,我无法共享实际文本,但它可能类似于“我在麦道工作”)。我首先使用write。表将此信息存储在文本文件中
write.table(test,"test.txt",sep="\t",quote=FALSE,row.names=FALSE,col.names=FALSE
然后我稍后尝试将该文本文件读回R,我得到了不希望的结果。
data<-read.table("test.txt",header=FALSE,sep="\t")
数据出来看起来类似于
V1 V2
1 __label__001 I WORK AT WENDYS
2 __label__002 I WORK AT BK
3 __label__001 I WORK AT WENDYS\n__label__002\tI WORK AT BK\n__label__003\tI WORK AT FIVE GUYS
当我渴望的是
V1 V2
1 __label__001 I WORK AT WENDYS
2 __label__002 I WORK AT BK
3 __label__001 I WORK AT WENDYS
4 __label__002 I WORK AT BK
5 __label__003 I WORK AT FIVE GUYS
知道我可以在读或写中改变什么来解决这个问题吗?
必须有数据原因。我模拟了您的示例数据集
V1 = paste0("__label__00",c(1,2,1,2,3))
V2 = paste("I WORK AT",c("WENDYS","BK","WENDYS","BK","FIVE GUYS"))
test = data.frame(V1,V2)
并执行写入/读取命令
write.table(test,"test.txt",sep="\t",quote=FALSE,row.names=FALSE,col.names=FALSE)
data = read.table("test.txt",header=FALSE,sep="\t")
这给了我你想要的输出。我无法重现你不想要的输出。所以我建议你在你的数据中寻找与我的数据的差异。
我正在尝试读取1500 csv文件,但我收到以下错误。 读取时出错。表(file=file,header=header,sep=sep,quote=quote,:不允许重复的“row.names” 代码: 但当单独打开并保存文件时,我可以读取文件。但由于有1500个文件,我需要手动完成。如有任何帮助,我将不胜感激?
问题内容: 我会尽量保持清楚,但如果我的问题不完美,请原谅我。我有一个包含多行数据的txt文件。例: 123拉尔夫·玻色20000 200 1 2 256 ed shane 30000 100 2 4 … 我需要按顺序读取每一行,并将其传递回单独类中的方法进行处理。我知道如何通过使用StringTokenizer将每一行分解为元素。 但是,我不确定如何一次读取一行,将元素传递回另一类,然后在完成处
我正在试着阅读我的文件的每一行,其中包含一个用户名列表,并用它创建一个登录系统。我正在尝试实现一个基本的登录系统,它的用户名存储在.txt文件中,但我的代码不工作,我不知道为什么。我认为问题出在检查用户名的循环中。 这是我的代码,但它不起作用,只是打印总是失败: 有什么想法吗?
本文向大家介绍iOS读取txt文件出现中文乱码的解决方法,包括了iOS读取txt文件出现中文乱码的解决方法的使用技巧和注意事项,需要的朋友参考一下 一、情景描述: 后台给一个txt文件,编码是utf-8,在Mac电脑Xcode开发环境下读取txt文件内容,汉字会出现乱码,英文没有乱码这种情况。 二、尝试解决方法: 修改编码格式,尝试了NSUTF16StringEncoding,NSUTF8St
我一直在互联网上寻找帮助,但我找不到,所以我求助于发帖。 我有一个txt文件,格式如下 1/2 0 1/6 6/11 1/6 2/10 我需要读取这些单独的分数,并输入分子和分母的函数称为BigFraction(num,denom)。 我调用读取器并将其作为字符串输出。然后,我在空格上进行拆分,以获得作为字符串的各个分数,并将它们输入到我的助手方法strToBF中,该方法在正斜杠上进行拆分,并输入
本文向大家介绍Python3 解决读取中文文件txt编码的问题,包括了Python3 解决读取中文文件txt编码的问题的使用技巧和注意事项,需要的朋友参考一下 问题描述 尝试用Python写一个Wordcloud的时候,出现了编码问题。 照着网上某些博客的说法添添改改后,结果是变成了“UnicodeDecodeError: ‘utf-8' codec can't decode byte…”这个错误