我正在尝试合并多个CSV文件。我的初始功能旨在:
因此,例如,如果我要从看起来像这样的三个CSV文件开始。
CSV 1
[]
[['Title'],['Date'],['etc']]
[]
[['Spam'],['01/01/2013'],['Spam is the spammiest spam']]
[['Ham'],['01/04/2013'],['ham is ok']]
[['Lamb'],['04/01/2013'],['Welsh like lamb']]
[['Sam'],['01/12/2013'],["Sam doesn't taste as good and the last three"]]
CSV 2
[]
[['Title'],['Date'],['etc']]
[]
[['Dolphin'],['01/01/2013'],['People might get angry if you eat it']]
[['Bear'],['01/04/2013'],['Best of Luck']]
CSV 3
[]
[['Title'],['Date'],['etc']]
[]
[['Spinach'],['04/01/2013'],['Spinach has lots of iron']]
[['Melon'],['02/06/2013'],['Not a big fan of melon']]
最后我会回家得到类似…
CSV输出
[['Spam'],['01/01/2013'],['Spam is the spammiest spam']]
[['Ham'],['01/04/2013'],['ham is ok']]
[['Lamb'],['04/01/2013'],['Welsh like lamb']]
[['Sam'],['01/12/2013'],["Sam doesn't taste as good and the last three"]]
[['Dolphin'],['01/01/2013'],['People might get angry if you eat it']]
[['Bear'],['01/04/2013'],['Best of Luck']]
[['Spinach'],['04/01/2013'],['Spinach has lots of iron']]
[['Melon'],['02/06/2013'],['Not a big fan of melon']]
所以…我开始写这个:
import os
import csv
path = './Path/further/into/file/structure'
directory_list = os.listdir(path)
directory_list.sort()
archive = []
for file_name in directory_list:
temp_storage = []
path_to = path + '/' + file_name
file_data = open(path_to, 'r')
file_CSV = csv.reader(file_data)
for row in file_CSV:
temp_storage.append(row)
for row in temp_storage[3:-1]:
archive.append(row)
archive_file = open("./Path/elsewhere/in/file/structure/archive.csv", 'wb')
wr = csv.writer(archive_file)
for row in range(len(archive)):
lastrow = row
wr.writerow(archive[row])
print row
这似乎可行…除了当我检查输出文件时,它似乎已停止在结尾处的一个奇怪的位置进行写操作。”
例如:
[['Spam'],['01/01/2013'],['Spam is the spammiest spam']]
[['Ham'],['01/04/2013'],['ham is ok']]
[['Lamb'],['04/01/2013'],['Welsh like lamb']]
[['Sam'],['01/12/2013'],['Sam doesn't taste as good and the last three']]
[['Dolphin],['01/01/2013'],['People might get angry if you eat it']]
[['Bear'],['01/04/2013'],['Best of Luck']]
[['Spinach'],['04/0
真的很奇怪,我无法解决出了什么问题。看起来写得不错,但已决定甚至停止列表条目的一半。追溯一下,我可以确定这与我上次写的“ for
loop”有关,但是我对csv方法不太熟悉。通读了文档,仍然很困惑。
谁能指出我出了问题的地方,如何解决这个问题,以及是否有更好的方法解决所有这些问题!
非常感谢-哇
在脚本结束之前,关闭文件句柄。关闭文件句柄还将刷新所有等待写入的字符串。如果您不刷新并且脚本结束,则可能永远不会写入某些输出。
使用with open(...) as f
语法很有用,因为当Python离开with
-suite时它将为您关闭文件。使用with
,您将永远不会忽略再次关闭文件。
with open("./Path/elsewhere/in/file/structure/archive.csv", 'wb') as archive_file:
wr = csv.writer(archive_file)
for row in archive:
wr.writerow(row)
print row
我对火花有点陌生。在我的spark calc完成后,我目前在amazon s3上看到一些奇怪的缓慢的拼花。 写一个小文件需要1.8小时(写时有2个分区) 我用一个不同的更大的文件(更多行更多列)运行了相同的spark calc(编写时有3个分区) 写入调用本身:
我有一个长长的列表,列表的形式如下--- i、 列表中的值有不同的类型——float、int、string。如何将其写入csv文件,使输出的csv文件看起来像
问题内容: 我有5个长度相同的列表,我想将它们写到CSV的5列中。到目前为止,我只能使用以下代码将一个代码写入一列: 如果我添加另一个循环,它只会将该列表写入同一列。有人知道获得五个单独列的好方法吗? 问题答案: 将它们更改为行 然后就
我有5个相同长度的列表,我想把它们写在CSV的5列中。到目前为止,我只能用以下代码在一列中写一个: 如果我为循环添加另一个
我正在构建的仪表板上实现jQuery sortable,以便用户可以自定义其仪表板视图。 单击控制柄时,仪表板左侧和中心的元素行为正常。然而,当我尝试拖动最右边的元素时,它们表现出奇怪的行为。我仍然可以在网格周围拖放它们,但鼠标不会停留在手柄上。。。盒子在屏幕上跳跃。 这是怎么回事?为什么它只发生在边缘框上,有没有办法解决这个问题? 这是实时仪表板。查看源代码。 这是正确行为的截图。鼠标在移动符号
问题内容: 我有一长串以下形式的清单- 即列表中的值是不同的类型-浮点数,整数,字符串。如何将其写入csv文件,以便输出的csv文件看起来像 问题答案: Python的内置CSV模块可以轻松处理此问题: 假设您的问题中的清单定义为。您可以通过各种可选参数来调整输出CSV的确切格式,如上面链接的库参考页中所述。 Python 3更新