df.column_one
df[['column_one', 'column_two']]
我如何获得所有列没有一个特定的?
示例:如果我有一个包含n列的dataframecol_1
、col_2
、...col_n
,如何获得没有col_n
的所有列?
试试这个:
df.drop(['col_n'], axis=1)
或
df.loc[:, df.columns != 'col_n']
或
df.loc[:, df.columns - ['col_n']]
df[df.columns.difference('col_n')]
df.filter(regex=r'^((?!col_n).*)$')
我的问题是如何将一列拆分为多个列。我不知道为什么 不起作用。 例如,我想将“df_test”更改为“df_test2”。我看到了很多使用熊猫模块的例子。还有别的办法吗?提前感谢您。 df_test2
问题内容: 我有一个数据框,其中包含一列ID,其他所有列都是我要为其计算z分数的数值。这是它的一个小节: 我的某些列包含不希望包含在z分数计算中的NaN值,因此我打算使用提供给此问题的解决方案:如何使用nans将zscore归一化熊猫列? 我有兴趣将此解决方案应用于除ID列之外的所有列,以生成新的数据框,我可以使用以下格式将其另存为Excel文件: 所以基本上 如何计算每列的z分数(忽略NaN值)
我有一份可能有出口问题的项目清单。我想得到一个重复项目的列表,这样我就可以手动比较它们。当我尝试使用熊猫复制方法时,它只返回第一个副本。有没有办法得到所有的副本,而不仅仅是第一个? 我的数据集的一小部分如下所示: 我的代码目前看起来像这样: 有两个重复的项目。但是,当我使用上面的代码时,我只得到第一项。在API参考中,我看到了如何获得最后一项,但我希望获得所有这些项,以便我可以直观地检查它们,以了
我正在从数据库中获取数据,我怀疑其中的所有数据都被简单地设置为string,而不是float、int等。当我将数据导入到pandas dataframe中时,所有数据都显示为字符串。 或 我试过str.isNumeric,但所有内容都显示为非数字。 我能做些什么来检测数值吗?
我有一个这样的数据帧 已经服用了12天,60毫克百忧解4年 然后我想把它们连接在一个数组中。问题是可能有一些句子重复,但我仍然想保留所有句子,因此结果将是: 我尝试了这个链接和这个都在r。 我也尝试过这种方法: 但是由于我的数据帧中的一些行是重复的,它只给我其中的一个。在我的例子中,返回我这个: 提前感谢:)
我肯定这是以前问过的,如果重复,对不起。假设我有以下数据框: 在“key”上执行groupby,我知道我们可以执行以下操作: 获取数组中所有'拆分'数据的最简单方法是什么?: 我不一定只按一个键进行分组,而是使用其他几个索引(例如“年”和“月”),这就是为什么我想使用groupby函数,但保留数组中所有分组的值。