当前位置：首页 > 面试题库 >

标准化大熊猫中的数据

储修谨

2023-03-14

问题内容：

假设我有一个熊猫数据框df：

我想计算数据框的列均值。

这很简单：

df.apply(average)

然后按列范围max（col）-min（col）。这又很容易：

df.apply(max) - df.apply(min)

现在，对于每个元素，我要减去其列的均值并除以其列的范围。我不确定该怎么做

任何帮助/指针将不胜感激。

问题答案：

In [92]: df
Out[92]:
           a         b          c         d
A  -0.488816  0.863769   4.325608 -4.721202
B -11.937097  2.993993 -12.916784 -1.086236
C  -5.569493  4.672679  -2.168464 -9.315900
D   8.892368  0.932785   4.535396  0.598124

In [93]: df_norm = (df - df.mean()) / (df.max() - df.min())

In [94]: df_norm
Out[94]:
          a         b         c         d
A  0.085789 -0.394348  0.337016 -0.109935
B -0.463830  0.164926 -0.650963  0.256714
C -0.158129  0.605652 -0.035090 -0.573389
D  0.536170 -0.376229  0.349037  0.426611

In [95]: df_norm.mean()
Out[95]:
a   -2.081668e-17
b    4.857226e-17
c    1.734723e-17
d   -1.040834e-17

In [96]: df_norm.max() - df_norm.min()
Out[96]:
a    1
b    1
c    1
d    1

类似资料：

大熊猫

我有一个数据帧，如：所以我想通过两个“for循环”添加一些列，如：新的类似数据帧的图片：我的代码不起作用：如何编写代码来获得像第二张图片这样的数据帧？
大熊猫read_csv

我正在读取一个包含多个datetime列的csv文件。我需要在读取文件时设置数据类型，但datetimes似乎是个问题。例如：运行时出现错误：不理解数据类型"datetime" 通过pandas在事实之后转换列。to_datetime（）不是一个选项，我不知道哪些列将成为datetime对象。这些信息可以更改，并且来自于通知我的数据类型列表的任何信息。或者，我尝试用numpy.genfrom
熊猫最大值指数

问题内容：我有一个包含屏幕名称，tweet，收藏夹等的Pandas DataFrame。我想找到“ favcount”（我已经做过）的最大值，并返回该“ tweet”的屏幕名称我似乎找不到任何东西，任何人都可以帮助我朝正确的方向发展吗？问题答案：使用来获取最大价值的指标。那你可以用编辑：现已弃用，切换为
熊猫：如何解决“错误标记化数据”？

关于这个话题，人们已经提出了很多问题。（和许多其他人）。在众多的答案中，到目前为止，没有一个对我真正有帮助。如果我错过了有用的，请告诉我。我只想将带有熊猫的CSV文件读入数据框。听起来很简单。我的文件我的代码：我的错误：我对这个问题的猜测是，Pandas看第一行，并期望在下面的行中有相同数量的代币。如果不是这样，它将以错误停止。在众多答案中，使用选项的建议包括，例如：或或以及更多无帮助
在熊猫数据框中规范化列

我有一个熊猫数据框，它有语料库的术语频率，术语为行，年份为列，就像这样：我希望能够通过将每个单词的值除以给定年份的总单词数来标准化它们——有些年份包含两倍多的文本，所以我试图按年缩放（像谷歌图书一样）。我已经看了如何缩放单个列的例子，克里斯·阿尔邦和我在SO上看到了缩放所有列的例子，但是每次我试图将这个数据框转换为一个数组来缩放时，事情都会窒息列这个词不是数字。（我尝试将术语列设置为索引，但不太
熊猫：设置最大行数

查看以下：问题是它不会在ipython笔记本中按默认值打印所有行，但我必须切片才能查看结果行。即使以下选项也不会更改输出：有人知道如何显示整个阵列吗？

相关阅读

熊猫：数事标准化一个很大的表更新大熊猫的价值在熊猫数据帧上的向量化查找抑制大熊猫的科学计数法吗？

相关文章

熊猫优选交互设计师面经 C语言标准库中的字符串 Thymeleaf标准方言屡败屡战的大数据秋招之英文面试准备 Thymeleaf标准URL语法

相关问答

熊猫：根据更复杂的标准选择和修改数据帧使用熊猫的“大数据”工作流 mongoplate中大小数的标准查询熊猫数据框中的列到行使用熊猫的“大数据”工作流[已关闭]

相关工具

熊猫Flash播放器标准TVL格式数据解析猫国建设者红猫软路由 TOM猫学说话demo

相关文档

C 标准库中文版 PHP 标准规范 Go 语言标准库 Go 语言标准库中文文档 JavaScript 标准参考手册