以下是生成数据帧的代码:
import pandas as pd
import numpy as np
dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB'))
然后我得到了数据帧:
+------------+---------+--------+
| | A | B |
+------------+---------+---------
| 0 | 0.626386| 1.52325|
+------------+---------+--------+
当我键入命令时:
dff.mean(axis=1)
我得到:
0 1.074821
dtype: float64
根据pandas的引用,axis=1表示列,我希望命令的结果是
A 0.626386
B 1.523255
dtype: float64
所以我的问题是:熊猫的轴是什么意思?
大熊猫:
假设,对dataframe1执行concat()操作
基本上,将dataframe2堆叠在dataframe1之上,反之亦然。
例如在桌子或地板上堆一堆书
假设,对dataframe1执行concat()操作
把书放在书架上。
更重要的是,与矩阵相比,数组更能表示嵌套的n维结构!因此,下面可以帮助您更直观地了解当您概括到多个维度时,axis是如何发挥重要作用的。此外,您实际上可以打印/写入/绘制/可视化任何n-dim数组,但在三维以上的纸张上不可能在矩阵表示(3-dim)中写入或可视化相同的数组。
这些答案确实有助于解释这一点,但对于非程序员(例如,像我这样第一次在数据科学课程背景下学习Python的人)来说,这仍然不是非常直观的。我仍然发现,在行和列中使用术语“沿”或“for each”wrt是令人困惑的。
对我来说更有意义的是这样说:
因此,轴0上的平均值将是每列中所有行的平均值,轴1上的平均值将是每行中所有列的平均值。
归根结底,这是在说和张晓晨和迈克尔一样的事情,但以一种对我来说更容易内化的方式。
它指定计算平均值的轴。默认情况下,轴=0。这与显式指定轴
时的numpy.mean
用法一致(在numpy.mean
中,默认情况下,轴==无,它计算扁平数组上的平均值),在其中沿行(即熊猫中的索引)的轴=0
,沿列的轴=1
。为了增加清晰度,可以选择指定轴='index'
(而不是轴=0
)或轴='列'
(而不是轴=1
)。
+------------+---------+--------+
| | A | B |
+------------+---------+---------
| 0 | 0.626386| 1.52325|----axis=1----->
+------------+---------+--------+
| |
| axis=0 |
↓ ↓
有人能给我指一个链接或解释熊猫索引的好处吗?我经常处理表,并根据列将它们连接起来,而这个连接/合并过程似乎无论如何都要对事物重新编制索引,所以考虑到我认为我不需要这样做,应用索引标准有点麻烦。 关于索引的最佳实践有什么想法吗?
问题内容: 这是我的生成数据框的代码: 然后我得到了数据框: 当我输入命令时: 我有 : 根据熊猫的参考,代表列,我希望命令的结果是 所以这是我的问题:大熊猫轴是什么意思? 问题答案: 它指定轴沿其的装置被计算的。默认情况下。这与显式指定时的用法一致(默认情况下为,轴,该值将计算扁平化数组的平均值),沿行(即,以pandas为索引)和沿列。为了更加清楚起见,可以选择指定(代替)或(代替)。
问题内容: 我在pandas中有一个数据框,我试图找出其值的类型。我不确定column的类型是什么。但是,当我跑步时,我得到了; 这是什么意思? 问题答案: 它的意思是: 来源。 第一个字符指定数据的类型,其余字符指定每个项目的字节数,Unicode除外,Unicode将其解释为字符数。项目大小必须与现有类型相对应,否则将引发错误。支持的类型为现有类型,否则将引发错误。支持的种类有:
问题内容: in Pandas中in的功能到底是什么? 问题答案: 当你什么都不懂的时候是你的朋友。它清除了很多次疑问。 看一看: 输出: 当您使用的键将成为新数据框中的索引时。 将列设置为索引时,将获得以下好处: 速度。 当您基于索引列过滤值时,例如 ,因为索引列的散列会更快。不必遍历整个列即可找到。它将只计算的哈希值,并在1 go内找到它。 缓解。 当您可以使用较短和较快的语法,而不是较长和较
对于熊猫,有人知道,除了 (i) ,(以及的其他变体,如,等) (ii) (iii), 例如字符串列,总是有一个的? 或者,我想知道,在上面的列表中,除了(I)、(ii)和(iii)之外,是否有任何数据类型不使其成为对象?
问题内容: 对于大熊猫,有人会知道,除了 (i), (以及like等的其他变体,等等) (ii) (iii), 如字符串列,总有一个的? 另外,我想知道,如果有来自任何数据类型分开(I),(II)和(iii)在上面的列表中不会使这是一个? 问题答案: pandas1.0.0发布后,于2020年2月编辑 熊猫通常为每个Series使用NumPy数组和dtype(数据帧是Series的集合,每个都有自