问题：

分析来自多个数据库的数据。熊猫中的txt文件

姬旭

2023-03-14

我有1000个文本文件。每个都有日期（我做了索引）和股票价格（列0）。我已经创建了代码来查找单个文件的价格的移动平均线，以及价格和移动平均线之间的滚动差异。我想为每个文件创建这样的代码。我必须在组中上传它们，因为它需要太多的内存来一次性上传它们。

我想我必须使用for循环来遍历文件并找到每个文件的度量。但我该怎么做呢？我如何将所有文件上传到一个组中，然后将它们分组到一个变量中，然后创建一个循环来查找每个文件的移动平均值和价格差异？

编辑：我正在使用numpy、pandas和matplotlib。我还希望能够找到与移动平均线差异最大的股票。

任何帮助都将不胜感激

共有2个答案

楚建柏

2023-03-14

这1000个文件有多大？如果它们是一对夫妇MB，只是猜测，将所有文件合并到一个文件中，你可以用它做任何你想做的事情。

import pandas as pd
import csv
import glob
import os

#os.chdir("C:\\Users\\Excel\\Desktop\\test\\")
results = pd.DataFrame([])
filelist = glob.glob("C:\\your_path\\*.csv")
#dfList=[]
for filename in filelist:
    print(filename)  
    namedf = pd.read_csv(filename, skiprows=0, index_col=0)
    results = results.append(namedf)

results.to_csv('C:\\your_path\\CombinedFile.csv')

穆俊哲

2023-03-14

如果您希望只迭代给定文件夹中的所有输入文件，您可能希望尝试os。listdir（）获取文件名列表，然后可以按顺序处理。如果您的文件分布在文件夹的各个层上，您可以使用os。walk（）遍历目录。您可以在此处找到有关这些方法的信息：https://docs.python.org/3/library/os.html

类似资料：

组合熊猫中的多个数据列

我有下面的数据框- 我需要一个全新的数据帧，，有3列：1.0、2.0（结合2.0和4.0）和3.0（结合3.0和5.0）。结果将是- 您可以预期合并列中不会有重叠的值；如果一行中的一列具有有效值，那么其他列将具有NaN值。我试过了- 而且它并没有按预期的那样工作。有没有简单有效的方法来做到这一点？
从。txt文件创建带有熊猫的数据文件

我在用Pandas将。txt文件转换为浮动值的数据目录时遇到了麻烦。我需要创建两列数据的散点图，但我一直得到错误“TypeError：Empty'DataFrame':no numeric data to plot”，所以我认为它是以字符串的形式读取数据。下面是我运行df.info时得到的结果列u_Vmag和u_B-V中没有任何测量值。我觉得我只是错过了一些显而易见的东西。有人有什么建议吗？
来自熊猫数据帧的成对矩阵

问题内容：我有一个熊猫数据框，看起来像这样：一千行左右，六列。大多数单元格为空（NaN）。考虑到不同的列中包含文本，我想知道每列中文本的概率是多少。例如，这里的小片段将产生如下内容：也就是说，Al01栏中有4个匹配项；在这4个匹配中，BBR60列中没有匹配，CA07列中也没有匹配，NL219列中有3个匹配。等等。我可以遍历每一列并使用值构建字典，但这似乎很笨拙。有没有更简单的方法？问题答
来自多个数据库表的JSF数据表列

问题内容：我有一个JSF数据表，它有三列，分别是：Work_Type_Desc，Project_Phase和Activity_Desc。这些列来自2个不同的数据库表，这两个表之间的关系是一对多的。第一个表的名称为Work_Type。它具有1）Work_Type_Cd，2）Work_Type_Desc，3）Created_By_Name，4）Created_DT，5）Updated_By_Nam
使用熊猫从txt加载数据

问题内容：我正在加载一个包含浮点和字符串数据混合的txt文件。我想将它们存储在可以访问每个元素的数组中。现在我正在做这是输入文件的结构：。现在，数据将作为唯一列导入。我如何划分它，以便分别存储不同的元素（所以我可以调用）？以及如何定义标题？问题答案：您可以使用：添加您的代码，在引号之间留一个空格。因此，熊猫可以检测值之间的空格并按列排序。数据列用于命名您的列。
Python，熊猫连接多个数据帧

我有一个csv文件列表，我使用我目前正在尝试遍历csv列表，并使用方法将axis参数设置为1，以按列将所有数据帧添加到一起。它是工作的希望，但我遇到的问题，因为所有的数据帧都有相同的冒号名称，当我连接他们我得到例如10列都与关键"日期" 不管怎样，我能给哥伦布起个独一无二的名字吗？比如伦敦约会，柏林约会？显然，这些名称基于数据帧的名称。

分析来自多个数据库的数据。熊猫中的txt文件

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档