循环浏览一个csv文件的行以在另一个csv文件中查找对应的数据

浦德明

2023-03-14

问题内容：

我遇到一个有趣的问题：

file1.csv有几百行，例如：

Code,DTime
1,2010-12-26 17:01
2,2010-12-26 17:07
2,2010-12-26 17:15

file2.csv大约有1100万行，例如：

id,D,Sym,DateTime,Bid,Ask
1375022797,D,USD,2010-12-26 17:00:15,1.311400,1.311700
1375022965,D,USD,2010-12-26 17:00:56,1.311200,1.311500
1375022984,D,USD,2010-12-26 17:00:56,1.311300,1.311600
1375023013,D,USD,2010-12-26 17:01:01,1.311200,1.311500
1375023039,D,USD,2010-12-26 17:01:02,1.311100,1.311400
1375023055,D,USD,2010-12-26 17:01:03,1.311200,1.311500
1375023063,D,USD,2010-12-26 17:01:03,1.311300,1.311600

我想做的是编写一个脚本，该脚本接受file1.csv中的每个DTime值，并在file2.csv的DateTime列中找到部分匹配的第一个实例，并输出DateTime，Bid，Ask询问该行。部分匹配位于前16个字符上。

这两个文件都是按照从最早到最新的顺序排序的，因此，如果file1.csv中的“ 2010-12-26
17:01”与file2.csv中的4个条目匹配，我只需要提取第一个文件：“ 2010-12-26 17： 01:01“

不知道如何进行..我尝试了字典，但是值的顺序很重要，所以我不确定是否可以使用。也许将file1的DTime列放入列表中，并为该列表中的每个条目搜索file2中的DateTime？

多谢你们

问题答案：

如果没有重复的DTime值，这应该可以工作：

import csv

file1reader = csv.reader(open("file1.csv"), delimiter=",")
file2reader = csv.reader(open("file2.csv"), delimiter=",")

header1 = file1reader.next() #header
header2 = file2reader.next() #header

for Code, DTime in file1reader:
    for id_, D, Sym, DateTime, Bid, Ask in file2reader:
        if DateTime.startswith(DTime): # found it
            print DateTime, Bid, Ask   # output data
            break                      # break and continue where we left next time

编辑

import csv
from datetime import datetime

file1reader = csv.reader(open("file1.csv"), delimiter=",")
file2reader = csv.reader(open("file2.csv"), delimiter=",")

header1 = file1reader.next() #header
header2 = file2reader.next() #header

for Code, DTime in file1reader:
    DTime = datetime.strptime(DTime, "%Y-%m-%d %H:%M")
    for id_, D, Sym, DateTime, Bid, Ask in file2reader:
        DateTime = datetime.strptime(DateTime, "%Y-%m-%d %H:%M:%S")
        if DateTime>=DTime: # found it
            print DateTime, Bid, Ask   # output data
            break                      # break and continue where we left next time

循环浏览一个csv文件的行以在另一个csv文件中查找对应的数据

相关阅读

相关文章

相关问答

相关工具

相关文档