当前位置: 首页 > 面试题库 >

为什么numpy std()与matlab std()给出不同的结果?

梁丘缪文
2023-03-14
问题内容

我尝试将matlab代码转换为numpy,并发现numpy与std函数的结果不同。

在matlab中

std([1,3,4,6])
ans =  2.0817

在numpy中

np.std([1,3,4,6])
1.8027756377319946

这正常吗?我应该如何处理呢?


问题答案:

NumPy函数np.std采用一个可选参数ddof:“自由度增量”。默认情况下是0。对其进行设置1以获取MATLAB结果:

>>> np.std([1,3,4,6], ddof=1)
2.0816659994661326

要添加更多上下文,在计算方差(标准偏差为平方根)时,通常将其除以我们拥有的值的数量。

但是,如果我们N从较大的分布中选择元素的随机样本并计算方差,则除以N可能导致实际方差的低估。为了解决这个问题,我们可以将除以(自由度)的数字降低为小于N(通常为N-1)的数字。该ddof参数允许我们按指定的数量更改除数。

除非另有说明,否则NumPy将计算方差(,除以)的 有偏
估计量。如果要使用整个分布(而不是从较大的分布中随机选择的值的子集),这就是您想要的。如果给定参数,则NumPy除以。ddof=0``N``ddof``N - ddof

MATLAB的默认行为std是通过除以校正样本方差的偏差N-1。这消除了标准偏差中的某些(但可能不是全部)偏差。如果您在较大分布的随机样本上使用该函数,则可能正是您想要的。

@hbaderts的不错回答给出了进一步的数学细节。



 类似资料:
  • 这是一个优化问题,我正试图用我使用的opl代码来解决(稍微有点扭曲)。 opl代码为我提供了两种解决方案,即:{Product12,Product31} 当我使用docplex将此代码翻译为python语言时,我使用以下代码: 我明白了: ***问题没有解决方案 我不明白为什么我有不同的结果,有人能帮我吗? 先谢谢你。 当做

  • 当我在本文中使用<code>dplyr::case_when<code>而不是<code>if<code>时,我注意到了下面的这种行为。如果第二个分支的输出是一个显式字符串,它将按预期工作,但如果指定了<code>x</code>本身,结果将发生变化。 为什么只有< code>case_when给出不同的结果? 由reprex软件包(v2.0.1)于2022年8月16日创建

  • 我已经阅读了这个问题的答案,但是我仍然不知道它如何返回以及为什么第二行中的代码返回。

  • 问题内容: 为什么这两个操作(分别)给出不同的结果? 在最后一种情况下,实际上存在无限递归。和一样。为什么与操作不同? 问题答案: 解释“为什么”: 该操作将数组元素添加到原始数组。该操作将数组(或任何对象)插入原始数组的末尾,从而导致对该点的 self引用 (因此无限递归)。 此处的区别在于,通过连接元素来添加数组时,+操作的作用是特定的(与其他数组一样重载,请参见本章的序列)。但是,appen

  • 问题内容: 情况一: 输出: 2005年7月8日星期五00:00:00 GMT-0700(PST) 案例二: 输出: Thu Jul 07 2005 17:00:00 GMT-0700(PST) 为什么第二次解析不正确? 问题答案: 在第5版规范发布之前,该Date.parse方法完全依赖于实现(除后者返回数字而不是a之外,其他方法new Date(string)等效)。在第5版规范中,添加了该要

  • 问题内容: 这是一个有关使用haversine公式计算地球上两个纬度和经度之间的距离的问题,用于需要“查找我最近的”功能的项目中。 haversine公式很好地讨论并在MySQL解决了这个帖子。 然后,我问了一个有关将其转换为存储函数的问题,这样它就可以在以后的项目中使用,而不必查找,记住或重新键入长格式的公式。 都很好。除了我的函数的结果(略有不同)以外,其他条件相同时,直接在查询中直接键入公式