当前位置：首页 > 专题 >

《pandas》专题

按名称列表对Pandas中的多个列进行切片
问题内容：我正在尝试通过两种不同的方法在Pandas数据框中选择多个列： 1）通过列号，例如1-3列和6列起。和 2）通过列名列表，例如：然后， years_month 将产生以下内容：也就是说，在两种方法中，仅加载名称在 Years_month 列表中的列的最佳（或正确）方法是什么？问题答案：我认为您需要合并列的位置，然后用于选择：对于第二种方法子集，通过：样品：您也可以总结的
比较两个Python Pandas数据框的2列并获取公共行
问题内容：我有2个数据框，如下所示：最后，我想得到的是：因此，我想比较两个数据帧，我想查看第一数据帧（对于列A和B）的哪些行与第二数据帧（列K和L）相同，并在第一数据帧的列D上分配1。我可以使用for循环，但是输入大量条目会很慢。任何线索或建议将不胜感激。问题答案：这是我解决的方法：
在Pandas中以均值转换组的更快方法
问题内容：我有一个Pandas数据框，在这里我试图用组的平均值替换每个组中的值。在我的机器上，该行大约需要10秒钟才能运行，并设置为以下数字。有没有更快的方法来达到相同的结果？问题答案：受Jeff的回答启发。这是我机器上最快的方法：
从上一次在Pandas DataFrame中发生以来，还剩下几天吗？
问题内容：假设我有一个Pandas DataFrame ：对于每一行，我想有效地计算自上次出现以来的天数。这样：我可以做一个循环：但是，对于庞大的数据集而言，效率似乎很低，而且可能还是不正确。问题答案：这是NumPy的方法- 很少有关于数组数据的示例来展示涉及触发器和起始值的各种场景的用法：用它来解决我们的情况：样本输出- 运行时测试方法- 时间-
子类化Pandas DataFrame，可以更新吗？
问题内容：继承还是不继承？关于Pandas子类化问题的最新消息是什么？（其他大多数线程都使用3-4年）。我希望做类似… 问题答案：这就是我的方法。我遵循了发现的建议：子类化熊猫数据结构修复完成问题以下示例仅显示了构造的新子类的用法。如果您按照我的第一个链接中的建议进行操作，则也可以考虑使用子类化，以考虑获取子类的一维切片。示范陷阱这种方法很烂 last) in () ---->
如果所有行的列中只有一个值，则在Pandas数据框中折叠行
问题内容：我有以下DF 我想将行折叠成一个如下我不想遍历列，但想使用熊猫来实现这一点。问题答案：选项0 超级简单每列可以处理多个值吗？我们当然可以！选项1 使用像外科医生一样的通用解决方案选项2 制作null然后摆脱它们否则我们可以
Python Pandas-如何通过一个值过滤多列
问题内容：我正在做熊猫分析。我的表有700万行* 30列。单元格值的范围从-1到3随机。现在，我想根据列的值过滤掉行。我了解如何根据多个条件进行选择，写下条件并通过“＆”“ |”组合。但是我有30列要过滤，并按相同的值过滤。例如，需要选择最后12列的值等于-1 上面的代码给了我一个布尔值。我需要实际的数据框。这里的逻辑是“或”，表示如果任何列的值为-1，则需要选择该行。另外，很高兴知道我
将Python pandas数据框中的每个数字四舍五入为两位小数
问题内容：这有效但是没有小数位文件说我尝试了这个但是得到这个错误：如何将数据框中的所有元素四舍五入到小数点后两位？ [编辑]弄清楚了。问题答案：
达到最大值后重置Python Pandas cumsum（）
问题内容：我有一个带有timedeltas的pandas DataFrame，作为在单独的列中以毫秒表示的这些delta的累积和。下面提供了一个示例：我希望能够提供CumSum [ms]的最大值，之后，累积总和将再次从0开始。例如，如果在上面的示例中最大值为3000，结果将如下所示：我已经探索过使用模运算符，但是只有当结果的总和等于所提供的限制时（即500％500的cum [ms]等于零），
使用Python Pandas从数据框中获取总values_count
问题内容：我有一个带有几列的Python pandas数据框。现在，我想将所有值复制到一个列中，以获取一个values_count结果alle值。最后，我需要string1，string2，n的总数。最好的方法是什么？问题答案：如果性能是一个问题，请尝试：或者它变成一个再使用对于具有少量列的较大（长）DataFrame，循环可能比堆栈快：此外，还有一个numpy解决方案：小长
get_dummies（Pandas）和OneHotEncoder（Scikit-learn）之间的优缺点是什么？
问题内容：我正在学习将机器学习分类器将分类变量转换为数字的不同方法。我遇到了这种方法，我想看看它们在性能和用法上有何不同。我发现关于如何使用教程上https://xgdgsc.wordpress.com/2015/03/20/note-on- using-onehotencoder-in-scikit-learn-to-work-on-categorical- features/ 自该文档对该
将许多python pandas数据帧放入一个Excel工作表
问题内容：只要工作表不同，就可以很容易地将许多熊猫数据框添加到excel工作簿中。但是，如果要使用内置的df.to_excel功能的熊猫，将许多数据帧放入一个工作表中有些棘手。上面的代码不起作用。您将得到错误现在，我已经进行了足够的实验，以至于找到了使之工作的方法。这会起作用。因此，我将这个问题发布在stackoverflow上的目的是双重的。首先，我希望这对某人在excel中将多个数据框
在Pandas中为Python创建虚拟变量
问题内容：我正在尝试使用python中的pandas从类别变量中创建一系列虚拟变量。我遇到过该函数，但是每当我尝试调用该函数时，都会收到一个错误，提示您未定义名称。创建虚拟变量的任何想法或其他方式将不胜感激。编辑：由于其他人似乎遇到了这种情况，因此熊猫中的函数现在可以正常工作了。这意味着以下应该起作用：有关更多信息，请参见http://blog.yhathq.com/posts/logi
像Qlik一样在pandas数据框中的列中计算唯一值？
问题内容：如果我有这样的表：我可以在Qlik中提出5个唯一的hID。我该如何在Python中使用Pandas数据框？还是一个numpy数组？同样，如果这样做，我将在Qlik中得到8。在大熊猫中做这件事的等效方法是什么？问题答案：计算不同的值，使用：仅计算非空值，请使用：计算包括空值在内的总值，请使用属性：使用布尔索引：或使用：输出：
获取跨列的值计数-Pandas DataFrame
问题内容：我有一个如下所示的Pandas DataFrame：我想跨列获取某个值的计数。所以我的预期输出是这样的：我知道如何跨行执行此操作，但是对列执行此操作有点奇怪？请帮助我解决这个问题吗？谢谢。问题答案：首先将其堆叠，然后使用value_counts：

首页

49

50

51

52

53

54

55

56

57

尾页

最新发布

双非实习8个月不能转正，如何秋招上岸美团经纬恒润项目经理-速通oc 摩尔线程GPU编译—面经星宸科技一面中兴通讯凉经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

android - Flutter 3.24.5 卡在 Gradle assembleDebug，如何更改 Maven 镜像配置？webpack - ERROR in ./src/data.yaml Module parse failed: Cannot parse JSON: Unable to parse.为啥报错？mvn exec:java 报错说找不到类？前端 - ant-design-vue 1.7.8版本a-select多选模式mode表单验证不通过怎么解决？vue.js - 如何在乾坤框架中保持Cesium地图组件状态？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

P4A Fixed-Header-Table LoadingProgress-Android cookies SabreAMF machine-learning-collection jBubbleBreaker Code Maat

文档资料

Markdown Preview Enhanced 中文文档 Neo4j 中文使用手册以及例子笨办法学 Prolog Java.io 入门教程 Python 正则表达式操作指南