当前位置：首页 > 面试题库 >

根据范围与大熊猫的Bin值

庄经国

2023-03-14

问题内容：

我的文件夹中有多个CSV文件，其值如下：

GroupID.csv是文件名。像这样有多个文件，但是值范围是在同一XML文件中定义的。我正在尝试将他们分组。该怎么办？

UPDATE1：基于BobHaffner的评论，我已经做到了

import pandas as pd 
import glob path =r'path/to/files' 
allFiles = glob.glob(path + "/*.csv")
frame = pd.DataFrame()
list_ = []
for file_ in allFiles:
    df = pd.read_csv(file_,index_col=None, header=None)
    df['file'] = os.path.basename('path/to/files/'+file_)
    list_.append(df)
frame = pd.concat(list_)
print frame

得到这样的事情：

我需要根据XML文件中的bin对值进行分组。我真的很感谢您的帮助。

问题答案：

为了你的桶系列，你应该使用的pd.cut()功能，就像这样：

df['bin'] = pd.cut(df['1'], [0, 50, 100,200])

         0    1        file         bin
0  person1   24     age.csv     (0, 50]
1  person2   17     age.csv     (0, 50]
2  person3   98     age.csv   (50, 100]
3  person4    6     age.csv     (0, 50]
4  person2  166  Height.csv  (100, 200]
5  person3  125  Height.csv  (100, 200]
6  person5  172  Height.csv  (100, 200]

如果要自己命名垃圾箱，可以使用如下labels=参数：

df['bin'] = pd.cut(df['1'], [0, 50, 100,200], labels=['0-50', '50-100', '100-200'])

         0    1        file      bin
0  person1   24     age.csv     0-50
1  person2   17     age.csv     0-50
2  person3   98     age.csv   50-100
3  person4    6     age.csv     0-50
4  person2  166  Height.csv  100-200
5  person3  125  Height.csv  100-200
6  person5  172  Height.csv  100-200

类似资料：

熊猫groupby与bin计数

问题内容：我有一个看起来像这样的DataFrame：我想将其转换为对属于某些bin的视图进行计数，如下所示：我试过了：但它仅提供汇总计数，而不提供用户计数。如何获得用户的垃圾箱计数？总计计数（使用我的真实数据）如下所示：问题答案：您可以按垃圾箱和用户名分组，计算分组大小，然后使用：
熊猫数据框内值的映射范围

问题内容：抱歉，是否曾有人问过这个问题，但我进行了广泛调查，没有结果。我想创建一个新列，该列根据某些规则映射的多个值，例如a = [1,2,3]为1，a = [4,5,6,7]为2，a = [8 ，9,10]为3。一对一映射对我来说很清楚，但是如果我想按值列表或范围进行映射怎么办？我遵循这些原则… 问题答案：有几种选择。熊猫通过/ NumPy通过 NumPy通过的元素是布尔级数，因此对
如何获取熊猫数据帧索引的范围

获取相应列内容满足条件的索引范围的最有效方法是什么。。类似于以标记开始并以“body”标记结束的行。例如，数据框如下所示我要得到行索引1-3 有人能提出最具蟒蛇风格的方法来实现这一点吗？
熊猫：日期范围和取消的假日

我有一个关于日期范围的问题。我用板条箱装了这样的东西：结果: 我需要删除3个日期：2017-12-25, 2017-12-27和2018-01-04。我在寻找能帮助我的公式，但我没有找到正确的。我也试图将所有这些更改为列表，但后来我无法使用删除公式，因为它没有找到列表中的值...有人知道怎么修吗？谢谢大家！
大熊猫

我有一个数据帧，如：所以我想通过两个“for循环”添加一些列，如：新的类似数据帧的图片：我的代码不起作用：如何编写代码来获得像第二张图片这样的数据帧？
大熊猫：按二级索引范围对MultiIndex进行切片

问题内容：我有一个类似MultiIndex的系列：我想获得s [‘b’]值，其中第二个索引（’ ‘）在2到10之间。在第一个索引上切片可以正常工作：但不是第二种，至少从似乎是两种最明显的方式来看： 1）这将返回元素1至4，与索引值无关但是，如果我反转索引，并且第一个索引是整数，第二个索引是字符串，则可以正常工作：问题答案：正如Robbie-Clarken回答的那样，从0.14开始，您

相关阅读

标准化大熊猫中的数据 Angular使用根范围与服务共享数据更新大熊猫的价值根据熊猫中的列名删除多个列熊猫最大值指数

相关文章

JSF验证浮点数值范围熊猫优选交互设计师面经 Apache服务器范围配置 Matplotlib设置坐标轴范围人工智能与大数据

相关问答

熊猫：根据阈值条件删除列如何根据数值筛选熊猫数据帧？获得熊猫设置与放大权在熊猫数据框中规范化列根据另一列熊猫数据帧提取列值

相关工具

熊猫Flash播放器 BIN Framework JS Bin get-bin-path 大象与猩猩

相关文档

大数据实验手册大数据入门指南大数据学习指南数据挖掘十大算法 CIO 面临大数据架构的选择困境