当前位置: 首页 > 文档资料 > Pandas 函数手册 >

分类

优质
小牛编辑
131浏览
2023-12-01
函数说明
Pandas 定义自定义数据类型,用于表示只能接受有限的固定值集的数据。类别的 dtype 可以由 pandas.api.types.CategoricalDtype 得到
api.types.CategoricalDtype([categories, ordered])具有类别和有序性的分类数据类型
api.types.CategoricalDtype.categories包含允许的唯一类别的索引。
api.types.CategoricalDtype.ordered类别是否有有序关系
类型可以 pandas.Categorical 得到
Categorical(values[, categories, ordered, …])代表经典 R / S + 样式中的分类变量
当您已经有类别和整数代码时,可以使用 alternational . from _ code ( ) 构造函数:
Categorical.from_codes(codes, categories[, …])从代码和类别数组中创建类别类型。
dtype 信息可从分类中获得
Categorical.dtype此实例的类别类型
Categorical.categories这个范畴。
Categorical.ordered类别是否有有序关系
Categorical.codes此类别的类别代码。
NP . asarray (分类) 通过实现数组接口工作。请注意,这将类别转换回 NumPy 数组,因此不会保留类别和顺序信息!
Categorical.array([dtype])numpy 数组接口。
类别可以存储在 Series 或 DataFrame 中。要创建一 Seriesdtype 类别,请使用 cat = s . astype (dtype) 或 Series (...,dtype = dtype ),其中 dtype 为
字符串 “类别”
类别类型的实例。
如果该 Series 属于 dtype CategoricalDtype,则可以使用 Series . cat 更改分类数据。此访问器类似于 series . dt 或 series . str,具有以下可用的方法和属性:
Series.cat.categories这个范畴。
Series.cat.ordered类别是否有有序关系
Series.cat.codes-
Series.cat.rename_categories(args, *kwargs)重命名类别。
Series.cat.reorder_categories(args, *kwargs)按照 new _ categories 中的指定重新排序类别。
Series.cat.add_categories(args, *kwargs)添加新类别。
Series.cat.remove_categories(args, *kwargs)删除指定的类别。
Series.cat.remove_unused_categories(*args, …)删除未使用的类别。
Series.cat.set_categories(args, *kwargs)将类别设置为指定的 new _ categories。
Series.cat.as_ordered(args, *kwargs)设置要排序的分类
Series.cat.as_unordered(args, *kwargs)将分类设置为无序