当前位置: 首页 > 知识库问答 >
问题:

熊猫的轴是什么意思?

狄旭
2023-03-14

以下是生成数据帧的代码:

import pandas as pd
import numpy as np

dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB'))

然后我得到了数据帧:

+------------+---------+--------+
|            |  A      |  B     |
+------------+---------+---------
|      0     | 0.626386| 1.52325|
+------------+---------+--------+

当我键入命令时:

dff.mean(axis=1)

我得到:

0    1.074821
dtype: float64

根据pandas的引用,axis=1表示列,我希望命令的结果是

A    0.626386
B    1.523255
dtype: float64

所以我的问题是:熊猫的轴是什么意思?

共有3个答案

孔正文
2023-03-14

大熊猫:

  1. 轴=0表示沿“索引”。这是一个按行操作

假设,对dataframe1执行concat()操作

基本上,将dataframe2堆叠在dataframe1之上,反之亦然。

例如在桌子或地板上堆一堆书

假设,对dataframe1执行concat()操作

把书放在书架上。

更重要的是,与矩阵相比,数组更能表示嵌套的n维结构!因此,下面可以帮助您更直观地了解当您概括到多个维度时,axis是如何发挥重要作用的。此外,您实际上可以打印/写入/绘制/可视化任何n-dim数组,但在三维以上的纸张上不可能在矩阵表示(3-dim)中写入或可视化相同的数组。

范高刚
2023-03-14

这些答案确实有助于解释这一点,但对于非程序员(例如,像我这样第一次在数据科学课程背景下学习Python的人)来说,这仍然不是非常直观的。我仍然发现,在行和列中使用术语“沿”或“for each”wrt是令人困惑的。

对我来说更有意义的是这样说:

  • 轴0将作用于每个列中的所有行
  • 轴1将作用于每个行中的所有列

因此,轴0上的平均值将是每列中所有行的平均值,轴1上的平均值将是每行中所有列的平均值。

归根结底,这是在说和张晓晨和迈克尔一样的事情,但以一种对我来说更容易内化的方式。

程冥夜
2023-03-14

它指定计算平均值的轴。默认情况下,轴=0。这与显式指定时的numpy.mean用法一致(在numpy.mean中,默认情况下,轴==无,它计算扁平数组上的平均值),在其中沿行(即熊猫中的索引)的轴=0,沿列的轴=1。为了增加清晰度,可以选择指定轴='index'(而不是轴=0)或轴='列'(而不是轴=1)。

+------------+---------+--------+
|            |  A      |  B     |
+------------+---------+---------
|      0     | 0.626386| 1.52325|----axis=1----->
+------------+---------+--------+
             |         |
             | axis=0  |
             ↓         ↓
 类似资料:
  • 有人能给我指一个链接或解释熊猫索引的好处吗?我经常处理表,并根据列将它们连接起来,而这个连接/合并过程似乎无论如何都要对事物重新编制索引,所以考虑到我认为我不需要这样做,应用索引标准有点麻烦。 关于索引的最佳实践有什么想法吗?

  • 问题内容: 这是我的生成数据框的代码: 然后我得到了数据框: 当我输入命令时: 我有 : 根据熊猫的参考,代表列,我希望命令的结果是 所以这是我的问题:大熊猫轴是什么意思? 问题答案: 它指定轴沿其的装置被计算的。默认情况下。这与显式指定时的用法一致(默认情况下为,轴,该值将计算扁平化数组的平均值),沿行(即,以pandas为索引)和沿列。为了更加清楚起见,可以选择指定(代替)或(代替)。

  • 问题内容: 我在pandas中有一个数据框,我试图找出其值的类型。我不确定column的类型是什么。但是,当我跑步时,我得到了; 这是什么意思? 问题答案: 它的意思是: 来源。 第一个字符指定数据的类型,其余字符指定每个项目的字节数,Unicode除外,Unicode将其解释为字符数。项目大小必须与现有类型相对应,否则将引发错误。支持的类型为现有类型,否则将引发错误。支持的种类有:

  • 问题内容: in Pandas中in的功能到底是什么? 问题答案: 当你什么都不懂的时候是你的朋友。它清除了很多次疑问。 看一看: 输出: 当您使用的键将成为新数据框中的索引时。 将列设置为索引时,将获得以下好处: 速度。 当您基于索引列过滤值时,例如 ,因为索引列的散列会更快。不必遍历整个列即可找到。它将只计算的哈希值,并在1 go内找到它。 缓解。 当您可以使用较短和较快的语法,而不是较长和较

  • 对于熊猫,有人知道,除了 (i) ,(以及的其他变体,如,等) (ii) (iii), 例如字符串列,总是有一个的? 或者,我想知道,在上面的列表中,除了(I)、(ii)和(iii)之外,是否有任何数据类型不使其成为对象?

  • 问题内容: 对于大熊猫,有人会知道,除了 (i), (以及like等的其他变体,等等) (ii) (iii), 如字符串列,总有一个的? 另外,我想知道,如果有来自任何数据类型分开(I),(II)和(iii)在上面的列表中不会使这是一个? 问题答案: pandas1.0.0发布后,于2020年2月编辑 熊猫通常为每个Series使用NumPy数组和dtype(数据帧是Series的集合,每个都有自