当前位置: 首页 > 知识库问答 >
问题:

如何在不覆盖现有索引的情况下向索引2处的数据帧添加额外的行

皇甫喜
2023-03-14

在将输出数据框写入excel文件之前,我需要在数据框中添加一行。下面是我的示例数据帧:

    -----------------------------
    | Col1 | Col2 | Col3 | Col4 |
    -----------------------------
0   | CA1  | CB1  | CC2  | CD1  |
1   | CA5  | CB5  | CC5  | CD5  |
2   | CA3  | CB3  | CC3  | CD3  |
    -----------------------------

mydict={'Col1':'P','Col2':'Q','Col3':'R','Col4':'S'}

现在我需要添加一个额外的行,在这个行中,应该从对应于列标题的mydict中选择新行值。

期望输出:

    -----------------------------
    | Col1 | Col2 | Col3 | Col4 |
    -----------------------------
    |  P   |  Q   |  R   | S    |
0   | CA1  | CB1  | CC2  | CD1  |
1   | CA5  | CB5  | CC5  | CD5  |
2   | CA3  | CB3  | CC3  | CD3  |
    -----------------------------

谁能帮忙吗。

共有1个答案

史昱
2023-03-14

这对你有用吗?首先,将mydict转换为数据帧,然后使用pd。concat

mydict = mydict= {'Col1': 'P', 'Col2': 'Q', 'Col3': 'R', 'Col4': 'S'}
df1 = pd.DataFrame(data=mydict, index=[0])

data = np.array([['CA1', 'CB1', 'CC2', 'CD1'],
                 ['CA5', 'CB5', 'CC5', 'CD5'],
                 ['CA3', 'CB3', 'CC3', 'CD3']])
df2 = pd.DataFrame(data, columns=['Col1', 'Col2', 'Col3', 'Col4'])

new_df = pd.concat([df1, df2])

然后,new_df

In [58]: new_df
Out[58]: 
  Col1 Col2 Col3 Col4
0    P    Q    R    S
0  CA1  CB1  CC2  CD1
1  CA5  CB5  CC5  CD5
2  CA3  CB3  CC3  CD3
 类似资料:
  • 我有两个形状相同的python数据帧,例如: 我想使用df2中的值作为行索引来选择df1中的值,并创建一个形状相等的新数据帧。预期结果: 我已尝试使用.loc,它在单个列中运行良好: 但是我不能同时在所有列上使用. loc或. iloc。我想避免循环来优化性能,因为我正在处理一个大数据帧。有什么想法吗?

  • 主要内容:1 索引扫描排序,2 索引下推,3 压缩(前缀压缩)索引,4 重复、冗余索引和未使用的索引,5 常见索引失效情况,6 三星索引详细介绍了各种高性能的索引使用策略,比如索引排序、索引下推、压缩索引等等,以及常见索引失效的情况。 前面我们已经介绍了各种类型的索引结构及其对应的优缺点: BTREE索引的数据结构以及具体实现原理深入解析 哈希索引的数据结构以及索引的优缺点 正确的创建和使用索引是实现高性能查询的基础。我们通常会看到一些查询不当的使用索引,或者使用MySQL无法使用已有的索引,下

  • 问题内容: 我有两个活动,我分别从这两个活动向Firestore添加数据。但是,每当我向Firestore添加第二个活动数据时,它就会覆盖第一个活动数据。我在以下两个活动中使用了以下代码: 如何停止覆盖?我想将两个“活动”数据保存在同一文件夹中。 问题答案: 我建议您再添加一个文档或集合,以便它可以为单个用户存储多个数据值。 您可以为两个活动创建文档参考: 或者,您可以为其创建一个子集合: 更多关

  • 我正在编写一个从站点中抓取信息的python代码,但我必须首先去掉一些cookies弹出窗口。要单击右侧按钮,我需要它们的XPath(据我所知)。问题是XPath的一部分每次都发生变化,我不知道如何找到它们,因为它们实际上没有任何属性,比如ID之类的。 这是按钮的HTML: 这是我现在使用的命令: 这是XPath: 变量每次都变,所以我改变了14。

  • 问题内容: 我使用pandas以以下方式写入excel文件: Masterfile.xlsx已经包含许多不同的选项卡。但是,它尚未包含“ Main”。 熊猫正确地写到“主要”表,不幸的是,它也删除了所有其他标签。 问题答案: Pandas文档说,它对xlsx文件使用openpyxl。快速浏览一下其中的代码ExcelWriter可以提示可能会发生以下情况:

  • 我目前有一个pyspark数据帧,其中一列包含一些数字行,我想使用我编写的函数来查找这些数字行,以返回一个信息字符串。我知道简单的方法是使用withCoulmn并定义一个UDF来从旧列创建一个新列,但是我的函数的某些方式使它不能注册为UDF。我可以根据旧列的值用新列创建一个新的数据框架,而不创建UDF吗?