当前位置: 首页 > 面试题库 >

pandasT检验

何高旻
2023-03-14
问题内容

如果要计算熊猫中两个类别的平均值,可以这样进行:

data = {'Category': ['cat2','cat1','cat2','cat1','cat2','cat1','cat2','cat1','cat1','cat1','cat2'],
        'values': [1,2,3,1,2,3,1,2,3,5,1]}
my_data = DataFrame(data)
my_data.groupby('Category').mean()

Category:     values:   
cat1     2.666667
cat2     1.600000

我有很多这样格式化的数据,现在我需要做一个 T 检验,看看 cat1cat2的均值 在统计上是否不同。我怎样才能做到这一点?


问题答案:

它取决于您要进行哪种t检验(单侧或双侧相关或独立),但是它应该很简单:

from scipy.stats import ttest_ind

cat1 = my_data[my_data['Category']=='cat1']
cat2 = my_data[my_data['Category']=='cat2']

ttest_ind(cat1['values'], cat2['values'])
>>> (1.4927289925706944, 0.16970867501294376)

它返回一个带有t统计量和p值的元组

有关其他t检验,请参见此处http://docs.scipy.org/doc/scipy/reference/stats.html



 类似资料:
  • Junit方法的返回类型是什么。所以我总是看到返回类型使用Void,所以我们可以改变返回类型吗? 现在,有时会出现这样的问题,比如我是否可以使用JUnit测试私有方法。因此,据我所知,Junit默认调用以test开头的方法,它应该是公共的,然后只有它才能使用Junit在类外部调用。因此,如果我声明一个测试方法为私有的,Junit将如何调用它或在类外测试它。

  • 检验历史 你的版本库就像是一台时间机器,它记录了所有提交的修改,允许你检查文件或目录以及相关元数据的历史。通过一个Subversion命令你可以根据时间或修订号取出一个过去的版本(或者恢复现在的工作拷贝),然而,有时候我们只是想看看历史而不想回到历史。 有许多命令可以为你提供版本库历史: svn log 展示给你主要信息:每个版本附加在版本上的作者与日期信息和所有路径修改。 svn diff 显示

  • 你可能有疑问,在 .vue 文件中你怎么检验你的代码,因为它不是 JavaScript。我们假设你使用 ESLint (如果你没有使用话,你应该去使用!)。 你还需要官方的 eslint-plugin-vue,它支持同时检查你 .vue 文件中的模板和脚本。 请确保在你的 ESLint 配置中使用了该插件自身的配置: { "extends": [ "plugin:vue/essenti

  • CheckList 对于 PWA 站点是否完善,Google 通过 PWA 所需要具备的一些特性和最佳实践给出了一个 Checklist, 该 Checklist 从多个方面来提供 PWA 站点检测的标准。如果我们对 PWA 工程的检测要求集成到持续集成系统的话(类似后面所提到的 Lighthouse),我们可以参照 Checklist 进行一系列的检测。 Checklist: https://d

  • CheckList 对于 PWA 站点是否完善,Google 通过 PWA 所需要具备的一些特性和最佳实践给出了一个 Checklist, 该 Checklist 从多个方面来提供 PWA 站点检测的标准。如果我们对 PWA 工程的检测要求集成到持续集成系统的话(类似后面所提到的 Lighthouse),我们可以参照 Checklist 进行一系列的检测。 Checklist: https://d

  • 数据科学家们经常面对世界的是或不是的问题。你在这个课程中看到了一些这样的问题的例子: 巧克力对你有好处吗? Broad Street 水泵的水是否会导致霍乱? 加州的人口统计在过去的十年中有所改变吗? 我们是否回答这些问题取决于我们的数据。加州的人口普查数据可以解决人口统计的问题,而答案几乎没有任何不确定性。我们知道 Broad Street 水泵的水源受到霍乱病人的污染,所以我们可以很好地猜测它