当前位置: 首页 > 编程笔记 >

pandas 描述性统计

池宸
2023-03-14
本文向大家介绍pandas 描述性统计,包括了pandas 描述性统计的使用技巧和注意事项,需要的朋友参考一下

示例

可以使用该方法计算数字列的描述性统计信息(平均值,标准差,观察数,最小值,最大值和四分位数),该方法将返回描述性统计数据的熊猫数据框。.describe()

In [1]: df = pd.DataFrame({'A': [1, 2, 1, 4, 3, 5, 2, 3, 4, 1], 
                           'B': [12, 14, 11, 16, 18, 18, 22, 13, 21, 17], 
                           'C': ['a', 'a', 'b', 'a', 'b', 'c', 'b', 'a', 'b', 'a']})

In [2]: df
Out[2]: 
   A   B  C
0  1  12  a
1  2  14  a
2  1  11  b
3  4  16  a
4  3  18  b
5  5  18  c
6  2  22  b
7  3  13  a
8  4  21  b
9  1  17  a

In [3]: df.describe()
Out[3]:
               A          B
count  10.000000  10.000000
mean    2.600000  16.200000
std     1.429841   3.705851
min     1.000000  11.000000
25%     1.250000  13.250000
50%     2.500000  16.500000
75%     3.750000  18.000000
max     5.000000  22.000000

请注意,由于C不是数字列,因此将其从输出中排除。

In [4]: df['C'].describe()
Out[4]:
count     10
unique     3
freq       5
Name: C, dtype: object

在这种情况下,该方法通过观察次数,唯一元素数量,模式和模式频率来汇总分类数据。

 类似资料:
  • 主要内容:sum()求和,mean()求均值,std()求标准差,数据汇总描述描述统计学(descriptive statistics)是一门统计学领域的学科,主要研究如何取得反映客观现象的数据,并以图表形式对所搜集的数据进行处理和显示,最终对数据的规律、特征做出综合性的描述分析。Pandas 库正是对描述统计学知识完美应用的体现,可以说如果没有“描述统计学”作为理论基奠,那么 Pandas 是否存在犹未可知。下列表格对 Pandas 常用的统计学函数做了简单的总结: 函数

  • 大量方法共同计算DataFrame上的描述性统计和其他相关操作。 其中大多数是sum(), mean(),等聚合sum(), mean(),但其中一些(如sumsum()生成相同大小的对象。 一般来说,这些方法采用axis参数,就像ndarray.{sum, std, ...},但轴可以通过名称或整数指定 DataFrame - “index”(axis = 0,默认值),“columns”(ax

  • 问题内容: 我有一个测试成绩的频率表: 我想显示基本统计数据和箱图,该图由频率表汇总。(例如,上面示例的平均值为79.16,中位数为80。) 熊猫有办法做到这一点吗?我所看到的所有示例均假设有个别案例的表格。 我想我可以生成一个个人分数列表,像这样- -但我希望避免这种情况;真实的非玩具数据集中的总频率高达十亿。 任何帮助表示赞赏。 (我认为这与对带加权数据使用describe()的问题不同,后者

  • 概述 JavaScript 提供了一个内部数据结构,用来描述对象的属性,控制它的行为,比如该属性是否可写、可遍历等等。这个内部数据结构称为“属性描述对象”(attributes object)。每个属性都有自己对应的属性描述对象,保存该属性的一些元信息。 下面是属性描述对象的一个例子。 { value: 123, writable: false, enumerable: true,

  • 我们知道,对象可以存储属性。 到目前为止,属性对我们来说只是一个简单的“键值”对。但对象属性实际上是更灵活且更强大的东西。 在本章中,我们将学习其他配置选项,在下一章中,我们将学习如何将它们无形地转换为 getter/setter 函数。 属性标志 对象属性(properties),除 value 外,还有三个特殊的特性(attributes),也就是所谓的“标志”: writable — 如果为

  • 一、 描述 Nmap (“Network Mapper(网络映射器)”) 是一款开放源代码的 网络探测和安全审核的工具。 它的设计目标是快速地扫描大型网络,当然用它扫描单个 主机也没有问题。Nmap 以新颖的方式 使用原始 IP 报文来发现网络上有哪些主机,那些 主机提供什么服务(应用程序名和版本),那 些服务运行在什么操作系统(包括版本信息), 它们使用什么类型的报文过滤器/防火墙,以及一堆其它