分类
优质
小牛编辑
131浏览
2023-12-01
函数 | 说明 |
---|---|
Pandas 定义自定义数据类型,用于表示只能接受有限的固定值集的数据。类别的 dtype 可以由 pandas.api.types.CategoricalDtype 得到 | |
api.types.CategoricalDtype([categories, ordered]) | 具有类别和有序性的分类数据类型 |
api.types.CategoricalDtype.categories | 包含允许的唯一类别的索引。 |
api.types.CategoricalDtype.ordered | 类别是否有有序关系 |
类型可以 pandas.Categorical 得到 | |
Categorical(values[, categories, ordered, …]) | 代表经典 R / S + 样式中的分类变量 |
当您已经有类别和整数代码时,可以使用 alternational . from _ code ( ) 构造函数: | |
Categorical.from_codes(codes, categories[, …]) | 从代码和类别数组中创建类别类型。 |
dtype 信息可从分类中获得 | |
Categorical.dtype | 此实例的类别类型 |
Categorical.categories | 这个范畴。 |
Categorical.ordered | 类别是否有有序关系 |
Categorical.codes | 此类别的类别代码。 |
NP . asarray (分类) 通过实现数组接口工作。请注意,这将类别转换回 NumPy 数组,因此不会保留类别和顺序信息! | |
Categorical.array([dtype]) | numpy 数组接口。 |
类别可以存储在 Series 或 DataFrame 中。要创建一 Seriesdtype 类别,请使用 cat = s . astype (dtype) 或 Series (...,dtype = dtype ),其中 dtype 为 | |
字符串 “类别” | |
类别类型的实例。 | |
如果该 Series 属于 dtype CategoricalDtype,则可以使用 Series . cat 更改分类数据。此访问器类似于 series . dt 或 series . str,具有以下可用的方法和属性: | |
Series.cat.categories | 这个范畴。 |
Series.cat.ordered | 类别是否有有序关系 |
Series.cat.codes | - |
Series.cat.rename_categories(args, *kwargs) | 重命名类别。 |
Series.cat.reorder_categories(args, *kwargs) | 按照 new _ categories 中的指定重新排序类别。 |
Series.cat.add_categories(args, *kwargs) | 添加新类别。 |
Series.cat.remove_categories(args, *kwargs) | 删除指定的类别。 |
Series.cat.remove_unused_categories(*args, …) | 删除未使用的类别。 |
Series.cat.set_categories(args, *kwargs) | 将类别设置为指定的 new _ categories。 |
Series.cat.as_ordered(args, *kwargs) | 设置要排序的分类 |
Series.cat.as_unordered(args, *kwargs) | 将分类设置为无序 |