当前位置: 首页 > 面试题库 >

如果熊猫数据框具有超过10行,则将其分成两部分

方嘉志
2023-03-14
问题内容

我有一个巨大的CSV文件,其中包含许多行很多的表。我想简单地将每个数据框拆分成2个(如果包含10行以上)。

如果为true,我希望第一个数据框包含前10个,其​​余的包含在第二个数据框中。

有便利的功能吗?我环顾四周,但发现没有什么用处…

split_dataframe(df, 2(if > 10))


问题答案:

如果满足条件,这将返回拆分的DataFrames,否则返回原始的和None(然后您将需要分别处理)。请注意,这假设拆分仅需每次进行一次,df并且拆分的第二部分(如果长度超过10行(意味着原始长度超过20行))是可以的。

df_new1, df_new2 = df[:10, :], df[10:, :] if len(df) > 10 else df, None

请注意,您也可以根据需要使用df.head(10)df.tail(len(df) - 10)获取正面和背面。您还可以使用各种索引方法:如果需要,您可以仅提供第一个维度索引,例如,df[:10]而不是df[:10, :](尽管我想明确地编写有关所采用的维度的代码)。您也可以以类似的方式使用df.ilocdf.ix编制索引。

df.loc但是,使用时要小心,因为它是基于标签的,并且输入永远不会被解释为整数position。.loc仅当您碰巧索引索引是从0开始且没有间隔的整数时,才“偶然地”工作。

但是,您还应该考虑pandas提供的各种选项,这些选项可将DataFrame的内容转储到HTML中,还可以考虑将LaTeX转储到LaTeX中,以便为演示文稿设计更好的表(而不仅仅是复制和粘贴)。只是简单地使用Google搜索方法将DataFrame转换为这些格式,就可以得到很多有关此应用程序的教程和建议。



 类似资料:
  • 问题内容: 我有从构成的DataFrame 。一行包含96个值,我想将DataFrame与值72分开。 以便将行的前72个值存储在Dataframe1中,并将行的后24个值存储在Dataframe2中。 我按如下方式创建我的DF: 问题是:如何拆分它们?:) 问题答案: (iloc文档)

  • 我正在使用熊猫进行一些数据清理,我有一个很长的正则表达式,我想将其分成多行。下面的作品在熊猫很好,因为它是所有在一行: 然而,这是很难管理的。我尝试了以下在常规Python中工作的详细方法: 不过,这在熊猫身上不起作用。知道我错过了什么吗? 以下是一些用于测试的示例文本: GR, MDT, CMR, HLDS, NEXT, NGI@25273, COMPTG 在9-7/8 LNR、LWD[GR、R

  • 问题内容: 我有两个,都被索引。我需要将元素添加在一起以形成一个new ,但前提是索引和列相同。如果该项不存在于之一,则应将其视为零。 我试过使用,但这无论索引和列如何。还尝试了一个简单的方法,但是如果两个数据框都没有该元素,则给出a 。 有什么建议? 问题答案: 怎么样

  • 这是为了俄罗斯方块。玻璃(蓝色)位于左侧,控制(红色面板)位于右侧。换句话说,现在我只想有一个框架分成两部分:左边(较宽)部分是蓝色,右边部分是红色。没别的了。但我似乎没能做到这一点。 所以,我的逻辑是:让框架有FlowLayout。然后,我添加了两个面板,这意味着它们将被放在一个行中。

  • 问题内容: 我有很多行的python pandas数据框。从这些行中,我想切出并且仅使用“ body”列中包含单词“ ball”的行。为此,我可以这样做: 问题是,我希望它不区分大小写,这意味着如果出现Ball或bAll一词,我也希望它们。进行不区分大小写的搜索的一种方法是将字符串转换为小写,然后以这种方式搜索。我想知道如何去做。我试过了 但这是行不通的。我不确定是否应该在此等性质上使用lambd

  • 问题内容: 我可以从python连接到本地mysql数据库,并且可以创建,选择并插入单个行。 我的问题是:我可以直接指示mysqldb提取整个数据帧并将其插入到现有表中,还是需要遍历行? 在这两种情况下,对于具有ID和两个数据列以及匹配的数据帧的非常简单的表,python脚本的外观如何? 问题答案: 更新: 现在有一种方法,而不是: 另请注意:语法可能会在熊猫0.14中更改… 您可以使用MySQL