当前位置: 首页 > 文档资料 > Pandas 函数手册 >

索引

优质
小牛编辑
131浏览
2023-12-01
函数说明
在包含索引 (Series/DataFrame) 的对象上可以获得这些方法或其变体中的许多,这些方法或变体最有可能在直接调用这些方法之前使用。
Index不可变的 ndarray 实现有序的、可切片的集合。
属性
Index.values以 ndarray 形式返回基础数据
Index.is_monotonic别名为 is monotical exporting (已弃用)
Index.is_monotonic_increasing如果索引是单调递增 (仅相等或递增) 值,则返回。
Index.is_monotonic_decreasing如果索引是单调递减 (仅相等或递减) 值,则返回。
Index.is_unique如果索引具有唯一值,则返回
Index.has_duplicates-
Index.hasnans如果我有南社就回来;启用各种性能加速
Index.dtype返回基础数据的 dtype 对象
Index.dtype_str返回基础数据的 dtype 字符串
Index.inferred_type返回从值推断的类型的字符串
Index.is_all_dates-
Index.shape返回基础数据形状的元组
Index.name-
Index.names-
Index.nbytes返回基础数据中的字节数
Index.ndim根据定义 1 返回基础数据的维数
Index.size返回基础数据中的元素数
Index.empty-
Index.strides返回基础数据的步长
Index.itemsize返回基础数据项的 dtype 大小
Index.base如果共享基础数据的内存,则返回基对象
Index.T返回转置,这是自我定义
Index.memory_usage([deep])值的内存使用
修改和计算
Index.all(args, *kwargs)返回所有元素是否为真。
Index.any(args, *kwargs)返回任何元素是否为真。
Index.argmin([axis])返回最小参数索引器的 ndarray
Index.argmax([axis])返回最大参数索引器的 ndarray
Index.copy([name, deep, dtype])复制此对象。
Index.delete(loc)删除传递位置为 (- s) 的新索引
Index.drop(labels[, errors])创建新索引,删除传递的标签列表
Index.drop_duplicates([keep])返回删除重复值的索引。
Index.duplicated([keep])指示重复的索引值。
Index.equals(other)确定两个索引对象是否包含相同的元素。
Index.factorize([sort, na_sentinel])将对象编码为枚举类型或分类变量。
Index.identical(other)类似于 equals,但检查其他类似属性是否也相同
Index.insert(loc, item)制作新索引在位置插入新项目。
Index.is_(other)更灵活、更快速的检查就像是,但这可以通过视图来实现
Index.is_boolean()-
Index.is_categorical()检查索引是否包含分类数据。
Index.is_floating()-
Index.is_integer()-
Index.is_interval()-
Index.is_lexsorted_for_tuple(tup)-
Index.is_mixed()-
Index.is_numeric()-
Index.is_object()-
Index.min()返回索引的最小值。
Index.max()返回索引的最大值。
Index.reindex(target[, method, level, …])使用目标值创建索引 (根据需要移动 / 添加 / 删除值)
Index.rename(name[, inplace])在索引上设置新名称。
Index.repeat(repeats, args, *kwargs)重复索引的元素。
Index.where(cond[, other])-
Index.take(indices[, axis, allow_fill, …])返回索引所选值的新索引
Index.putmask(mask, value)返回使用掩码设置的值的新索引
Index.set_names(names[, level, inplace])在索引上设置新名称。
Index.unique([level])返回索引中的唯一值。
Index.nunique([dropna])返回对象中唯一元素的数目。
Index.value_counts([normalize, sort, …])返回包含唯一值计数的对象。
缺失值
Index.fillna([value, downcast])用指定值填充 NA / NaN 值
Index.dropna([how])没有 NA / NaN 值的返回索引
Index.isna()检测缺失值。
Index.notna()检测现有 (未丢失) 值。
转变
Index.astype(dtype[, copy])创建具有转换为 dtypes 的值的索引。
Index.item()以 python 标量形式返回基础数据的第一个元素
Index.map(mapper[, na_action])使用输入对应关系映射值 (dict、Series 或函数)。
Index.ravel([order])返回基础数据的展平值的数组
Index.tolist()返回值列表。
Index.to_native_types([slicer])格式化 self 的指定值并返回它们。
Index.to_series([index, name])创建一个索引和值都等于索引键的 Series,该索引键与 map 一起用于基于索引返回索引器
Index.to_frame([index])使用包含索引的列创建 DataFrame。
Index.view([cls])-
整理
Index.argsort(args, *kwargs)返回对索引进行排序的整数标记。
Index.searchsorted(value[, side, sorter])查找应该插入元素以维持秩序的索引。
Index.sort_values([return_indexer, ascending])返回索引的排序副本。
特定时间操作
Index.shift([periods, freq])按所需的时间频率增量数移位索引。
组合 / 连接 / 设置操作
Index.append(other)将索引选项集合附加在一起
Index.join(other[, how, level, …])这是一种内部非公开的方法
Index.intersection(other)形成两个索引对象的交集。
Index.union(other)形成两个索引对象的并集,并尽可能进行排序。
Index.difference(other)返回一个新索引,其中包含索引中不在其他位置的元素。
Index.symmetric_difference(other[, result_name])计算两个索引对象的对称差。
选择
Index.asof(label)对于排序的索引,返回直到并包括传递的标签的最新标签。
Index.asof_locs(where, mask)其中:时间戳掩码数组:数据不是 NA 的布尔数组
Index.contains(key)如果此键在索引中,则返回布尔值
Index.get_duplicates()(已弃用) 提取重复的索引元素。
Index.get_indexer(target[, method, limit, …])计算给定当前索引的新索引的索引器和掩码。
Index.get_indexer_for(target, **kwargs)即使在不唯一的情况下,也保证返回索引器,这将根据需要分派给 get indexer 或 get indexer _ uninique
Index.get_indexer_non_unique(target)计算给定当前索引的新索引的索引器和掩码。
Index.get_level_values(level)返回请求级别的值索引,等于索引的长度。
Index.get_loc(key[, method, tolerance])获取请求标签整数位置,切片或布尔掩码。
Index.get_slice_bound(label, side, kind)计算与给定标签相对应的切片边界。
Index.get_value(series, key)从一维数组快速查找值。
Index.get_values()以数字形式返回索引数据
Index.set_value(arr, key, value)从一维数组快速查找值。
Index.isin(values[, level])返回索引值以值为单位的布尔数组。
Index.slice_indexer([start, end, step, kind])对于有序或唯一索引,计算输入标签和步骤的切片索引器。
Index.slice_locs([start, end, step, kind])计算输入标签的切片位置。
数字索引
RangeIndex实现单调整数范围的不可变索引。
Int64Index不可变的 ndarray 实现有序的、可切片的集合。
UInt64Index不可变的 ndarray 实现有序的、可切片的集合。
Float64Index不可变的 ndarray 实现有序的、可切片的集合。
RangeIndex.from_range(data[, name, dtype])从范围 (py3) 或 xrange ( py2 ) 对象创建范围索引
范畴尺度指数
CategoricalIndex实现有序、可切片集合的不可变索引。
范畴成分
CategoricalIndex.codes-
CategoricalIndex.categories-
CategoricalIndex.ordered-
CategoricalIndex.rename_categories(*args, …)重命名类别。
CategoricalIndex.reorder_categories(*args, …)按照 new _ categories 中的指定重新排序类别。
CategoricalIndex.add_categories(args, *kwargs)添加新类别。
CategoricalIndex.remove_categories(*args, …)删除指定的类别。
CategoricalIndex.remove_unused_categories(…)删除未使用的类别。
CategoricalIndex.set_categories(args, *kwargs)将类别设置为指定的 new _ categories。
CategoricalIndex.as_ordered(args, *kwargs)设置要排序的分类
CategoricalIndex.as_unordered(args, *kwargs)将分类设置为无序
CategoricalIndex.map(mapper)使用输入对应关系映射值 (dict、Series 或函数)。
internalindex
IntervalIndex实现有序、可切片集合的不可变索引。
internalindex 组件
IntervalIndex.from_arrays(left, right[, …])由定义左右边界的两个数组构造。
IntervalIndex.from_tuples(data[, closed, …])从元组列表 / 数组中构建 internalindex
IntervalIndex.from_breaks(breaks[, closed, …])从拆分数组构造 internalindex
IntervalIndex.contains(key)返回一个布尔值,指示键是否在索引中
IntervalIndex.left返回 internalindex 中每个间隔的左端点作为索引
IntervalIndex.right返回 internalindex 中每个间隔的右端点作为索引
IntervalIndex.mid返回 internalindex 中每个间隔的中点作为索引
IntervalIndex.closed间隔是在左侧、右侧关闭,还是两者都关闭
IntervalIndex.length返回一个索引,其中的条目表示 internalindex 中每个间隔的长度
IntervalIndex.values将 internalindex 的数据作为间隔对象的 numpy 数组返回 (dtype = ' object ')
IntervalIndex.is_non_overlapping_monotonic如果 internalindex 不重叠 (无间隔共享点),并且单调递增或单调递减,则返回 True,否则返回 False
IntervalIndex.get_loc(key[, method])获取请求标签整数位置,切片或布尔掩码。
IntervalIndex.get_indexer(target[, method, …])计算给定当前索引的新索引的索引器和掩码。
多指标
MultiIndexPandas 对象的多级或分层索引对象
IndexSlice创建对象以更轻松地执行多索引切片
多指标构造函数
MultiIndex.from_arrays(arrays[, sortorder, …])将数组转换为多索引
MultiIndex.from_tuples(tuples[, sortorder, …])将元组列表转换为多索引
MultiIndex.from_product(iterables[, …])由多个可滴定物的笛卡儿积建立多指标
多指标属性
MultiIndex.names多重索引中的层级名称
MultiIndex.levels-
MultiIndex.labels-
MultiIndex.nlevels此多重索引中的整数层级。
MultiIndex.levshape具有每个级别长度的元组。
多指标成分
MultiIndex.set_levels(levels[, level, …])在多索引上设置新级别。
MultiIndex.set_labels(labels[, level, …])在多索引上设置新标签。
MultiIndex.to_hierarchical(n_repeat[, n_shuffle])返回重新整形的多索引,以符合 n repeat 和 n shuffle 给定的形状。
MultiIndex.to_frame([index])以多索引级别为列创建 DataFrame。
MultiIndex.is_lexsorted()如果标签按字典顺序排序,则返回 True
MultiIndex.sortlevel([level, ascending, …])在请求的级别排序多索引。
MultiIndex.droplevel([level])移除要求层级的传回索引。
MultiIndex.swaplevel([i, j])用 j 级交换一级
MultiIndex.reorder_levels(order)使用输入顺序重新排列级别。
MultiIndex.remove_unused_levels()从当前创建一个新的多索引,以删除未使用的级别,这意味着它们不会在标签中表达
MultiIndex.unique([level])返回索引中的唯一值。
多指标选择
MultiIndex.get_loc(key[, method])获取作为整数、切片或布尔掩码的标签或标签元组的位置。
MultiIndex.get_indexer(target[, method, …])计算给定当前索引的新索引的索引器和掩码。
MultiIndex.get_level_values(level)返回请求级别的标签值向量,等于索引的长度。
日期时间索引
DatetimeIndexdatetime64 数据的不可变的 ndarray,内部表示为 int 64,它可以被装箱到作为 datetime 子类的时间戳对象中,并携带诸如频率信息之类的元数据。
时间 / 日期组成部分
DatetimeIndex.year日期时间的年份
DatetimeIndex.month1 月 = 1 月,12 月 = 12 月
DatetimeIndex.day日期时间的天数
DatetimeIndex.hour日期时间的小时数
DatetimeIndex.minute日期时间的分钟数
DatetimeIndex.second日期时间的秒数
DatetimeIndex.microsecond日期时间的微秒
DatetimeIndex.nanosecond日期时间的纳秒
DatetimeIndex.date返回 python datetime . date 对象的 numpy 数组 (即时间戳中没有时区信息的日期部分)。
DatetimeIndex.time返回 datetime . time 的 numpy 数组。
DatetimeIndex.dayofyear一年中的第几天
DatetimeIndex.weekofyear一年中的第几周
DatetimeIndex.week一年中的第几周
DatetimeIndex.dayofweek星期一 = 0,星期日 = 6 的星期几
DatetimeIndex.weekday星期一 = 0,星期日 = 6 的星期几
DatetimeIndex.quarter日期的季度
DatetimeIndex.tz-
DatetimeIndex.freq如果设置了 frequency 对象,则返回该对象,否则无
DatetimeIndex.freqstr如果设置了 frequency 对象,则将其作为字符串返回,否则无
DatetimeIndex.is_month_start逻辑指示每月第一天 (由频率定义)
DatetimeIndex.is_month_end指示日期是否为当月的最后一天。
DatetimeIndex.is_quarter_start指示日期是否为季度的第一天。
DatetimeIndex.is_quarter_end指示日期是否为季度的最后一天。
DatetimeIndex.is_year_start指出日期是否为一年中的第一天。
DatetimeIndex.is_year_end指出日期是否为一年中的最后一天。
DatetimeIndex.is_leap_year如果日期属于闰年,则为布尔指示符。
DatetimeIndex.inferred_freq尝试返回一个 string 类型的值,该值代表由 inversion _ freq 生成的频率猜测。
选择
DatetimeIndex.indexer_at_time(time[, asof])返回索引值在一天中特定时间的索引位置 (例如
DatetimeIndex.indexer_between_time(…[, …])返回一天中特定时间 (例如 9 : 00 - 9 : 30) 之间的值的索引位置。
特定时间操作
DatetimeIndex.normalize()将时间转换为午夜。
DatetimeIndex.strftime(date_format)使用指定的 date _ format 转换为索引。
DatetimeIndex.snap([freq])将时间戳捕捉到最近出现的频率
DatetimeIndex.tz_convert(tz)将 tz 感知的日期时间索引从一个时区转换到另一个时区。
DatetimeIndex.tz_localize(tz[, ambiguous, …])将 tz - naive 日期时间索引本地化为 tz 感知的日期时间索引。
DatetimeIndex.round(freq, args, *kwargs)将数据舍入到指定的频率。
DatetimeIndex.floor(freq)将数据降至指定频率。
DatetimeIndex.ceil(freq)将数据上限设置为指定频率。
DatetimeIndex.month_name([locale])返回具有指定区域设置的 DateTimeIndex 的月份名称。
DatetimeIndex.day_name([locale])返回具有指定区域设置的 DateTimeIndex 的日期名称。
转变
DatetimeIndex.to_period([freq])以特定频率转换为周期指数。
DatetimeIndex.to_perioddelta(freq)计算指标值与按指定频率转换为周期指标的指标之间差值的时间增量指标。
DatetimeIndex.to_pydatetime()返回 DatetimeIndex 作为 datetime . datetime 对象的对象数组
DatetimeIndex.to_series([keep_tz, index, name])创建一个索引和值都等于索引键的 Series,该索引键与 map 一起用于基于索引返回索引器
DatetimeIndex.to_frame([index])使用包含索引的列创建 DataFrame。
时间增量指数
TimedeltaIndextimedelta 64 数据的不可变数组,内部表示为 int 64,可以装箱到 timedelta 对象中
成分
TimedeltaIndex.days每个元素的天数。
TimedeltaIndex.seconds每个元素的秒数 (> = 0 且小于 1 天)。
TimedeltaIndex.microseconds每个元素的微秒数 (> = 0 且小于 1 秒)。
TimedeltaIndex.nanoseconds每个元素的纳秒数 (> = 0 且小于 1 微秒)。
TimedeltaIndex.components返回时间增量组件的 DataFrame (天、小时、分钟、秒、毫秒、微秒、纳秒)。
TimedeltaIndex.inferred_freq尝试返回一个 string 类型的值,该值代表由 inversion _ freq 生成的频率猜测。
转变
TimedeltaIndex.to_pytimedelta()将 timedeltindex 作为 datetimedelta 对象的对象数组返回
TimedeltaIndex.to_series([index, name])创建一个索引和值都等于索引键的 Series,该索引键与 map 一起用于基于索引返回索引器
TimedeltaIndex.round(freq, args, *kwargs)将数据舍入到指定的频率。
TimedeltaIndex.floor(freq)将数据降至指定频率。
TimedeltaIndex.ceil(freq)将数据上限设置为指定频率。
TimedeltaIndex.to_frame([index])使用包含索引的列创建 DataFrame。
周期指数
PeriodIndex毫无疑问,ndarray holding ordinal values indirect regular periods of such as a special years,quarters,months,等等,这些都是在这些年份中经常出现的情况。
属性
PeriodIndex.day期间的天数
PeriodIndex.dayofweek星期一 = 0,星期日 = 6 的星期几
PeriodIndex.dayofyear一年中的第几天
PeriodIndex.days_in_month当月的天数
PeriodIndex.daysinmonth当月的天数
PeriodIndex.end_time-
PeriodIndex.freq如果设置了 frequency 对象,则返回该对象,否则无
PeriodIndex.freqstr如果设置了 frequency 对象,则将其作为字符串返回,否则无
PeriodIndex.hour时段的时间
PeriodIndex.is_leap_year逻辑指示日期是否属于闰年
PeriodIndex.minute时段的分钟
PeriodIndex.month1 月 = 1 月,12 月 = 12 月
PeriodIndex.quarter日期的季度
PeriodIndex.qyear-
PeriodIndex.second第二阶段
PeriodIndex.start_time-
PeriodIndex.week一年中的第几周
PeriodIndex.weekday星期一 = 0,星期日 = 6 的星期几
PeriodIndex.weekofyear一年中的第几周
PeriodIndex.year期间的年份
方法
PeriodIndex.asfreq([freq, how])将周期指数转换为指定的频率频率。
PeriodIndex.strftime(date_format)使用指定的 date _ format 转换为索引。
PeriodIndex.to_timestamp([freq, how])转换为日期时间索引
PeriodIndex.tz_convert(tz)将 tz 感知的日期时间索引从一个时区转换到另一个时区 (使用 pytz /dateutil)
PeriodIndex.tz_localize(tz[, ambiguous])将 tz - naive datetimendix 本地化为给定时区 (使用 pytz /dateutil),或从 tz 感知的 datetimendix 中删除时区
标量
时期
Period代表一段时间
属性
Period.day获取某个时间段所在月份的日期。
Period.dayofweek返回星期几。
Period.dayofyear返回一年中的某一天。
Period.days_in_month获取此期间所在月份的总天数。
Period.daysinmonth获取期间所在月份的总天数。
Period.end_time-
Period.freq-
Period.freqstr-
Period.hour获取时间段中的一天中的小时数。
Period.is_leap_year-
Period.minute获取时间段的小时组成部分的分钟数。
Period.month-
Period.ordinal-
Period.quarter-
Period.qyear-
Period.second获取周期的第二部分。
Period.start_time获取周期开始的时间戳。
Period.week获取给定时间段内的一年中的一周。
Period.weekday-
Period.weekofyear-
Period.year-
方法
Period.asfreq在间隔开始或结束时,将周期转换为所需频率
Period.now-
Period.strftime根据选定的 fmt 返回周期的字符串表示形式。
Period.to_timestamp返回指定周期结束 (方式) 时目标频率上周期的时间戳表示
时间戳
TimestampPandas 替换日期时间
性能
Timestamp.asm8-
Timestamp.day-
Timestamp.dayofweek-
Timestamp.dayofyear-
Timestamp.days_in_month-
Timestamp.daysinmonth-
Timestamp.fold-
Timestamp.hour-
Timestamp.is_leap_year-
Timestamp.is_month_end-
Timestamp.is_month_start-
Timestamp.is_quarter_end-
Timestamp.is_quarter_start-
Timestamp.is_year_end-
Timestamp.is_year_start-
Timestamp.max-
Timestamp.microsecond-
Timestamp.min-
Timestamp.minute-
Timestamp.month-
Timestamp.nanosecond-
Timestamp.quarter-
Timestamp.resolution-
Timestamp.second-
Timestamp.tztzinfo 的别名
Timestamp.tzinfo-
Timestamp.value-
Timestamp.week-
Timestamp.weekofyear-
Timestamp.year-
方法
Timestamp.astimezone将 tz 感知时间戳转换为另一个时区。
Timestamp.ceil返回导致此解决方案的新时间戳
Timestamp.combine(date, time)日期、时间 - > 日期时间,具有相同的日期和时间字段
Timestamp.ctime返回 ctime ( ) 样式字符串。
Timestamp.date返回年、月、日相同日期对象。
Timestamp.day_name返回具有指定区域设置的时间戳的日期名称。
Timestamp.dst返回自我。
Timestamp.floor返回此分辨率下的新时间戳
Timestamp.freq-
Timestamp.freqstr-
Timestamp.fromordinal(ordinal[, freq, tz])传递序号,翻译并转换为 ts 注释:根据定义,序号本身不能有任何 tz 信息
Timestamp.fromtimestamp(ts)时间戳 [,tz] - > 从 POSIX 时间戳开始的 tz 本地时间。
Timestamp.isocalendar返回包含 ISO 年、周数和工作日的三元组。
Timestamp.isoformat-
Timestamp.isoweekday返回日期所代表的星期几。
Timestamp.month_name返回具有指定区域设置的时间戳的月份名称。
Timestamp.normalize将时间戳标准化到午夜,保留 tz 信息。
Timestamp.now([tz])返回表示 tz 本地当前时间的新时间戳对象。
Timestamp.replace实现日期时间。替换,处理纳秒
Timestamp.round将时间戳舍入到指定的分辨率
Timestamp.strftime格式 - > strftime ( ) 样式字符串。
Timestamp.strptimestring,format - - > 从字符串解析的新日期时间 (如 time . strptime () )。
Timestamp.time返回时间相同但 tzinfo = 无的时间对象。
Timestamp.timestamp以浮点形式返回 POSIX 时间戳。
Timestamp.timetuple返回时间元组,与时间兼容。localtime ( )。
Timestamp.timetz返回具有相同时间和 tzinfo 的时间对象。
Timestamp.to_datetime64返回一个精度为 “ns” 的 numpy . datetime64 对象
Timestamp.to_julian_date将时间戳转换为儒略日。
Timestamp.to_period返回此时间戳为观察值的时间段。
Timestamp.to_pydatetime将时间戳对象转换为本机 Python datetime 对象。
Timestamp.today(cls[, tz])返回本地时区中的当前时间。
Timestamp.toordinal返回无理期公历序数。
Timestamp.tz_convert将 tz 感知时间戳转换为另一个时区。
Timestamp.tz_localize将原始时间戳转换为本地时区,或从 tz 感知时间戳中删除时区。
Timestamp.tzname返回自我。
Timestamp.utcfromtimestamp(ts)从 POSIX 时间戳构造一个幼稚的 UTC 日期时间。
Timestamp.utcnow()返回表示 UTC 日期和时间的新时间戳。
Timestamp.utcoffset返回 self . tzinfo . utcoffset (自我)。
Timestamp.utctimetuple返回 UTC 时间元组,与时间兼容。localtime ( )。
Timestamp.weekday返回日期所代表的星期几。
间隔
Interval实现一个区间的不可变对象,一个有界的切片状区间。
性能
Interval.closed间隔是在左侧、右侧关闭,还是两者都关闭
Interval.closed_left检查左侧间隔是否关闭。
Interval.closed_right检查右侧间隔是否关闭。
Interval.left左界间隔
Interval.length返回间隔的长度
Interval.mid返回间隔的中点
Interval.open_left检查左侧间隔是否打开。
Interval.open_right检查右侧间隔是否打开。
Interval.right右界间隔
时间增量
Timedelta表示持续时间,即两个日期或时间之间的差值。
性能
Timedelta.asm8返回自己的 numpy timedelta 64 数组视图
Timedelta.components返回一个名为 “类耦合” 的组件
Timedelta.days天数。
Timedelta.delta返回以纳秒 (ns) 为单位的时间增量,以实现内部兼容性。
Timedelta.freq-
Timedelta.is_populated-
Timedelta.max-
Timedelta.microseconds微秒数 (> = 0 小于 1 秒)。
Timedelta.min-
Timedelta.nanoseconds返回纳秒数 (n),其中 0≤n < 1 微秒。
Timedelta.resolution返回一个字符串,表示我们拥有的最低分辨率
Timedelta.seconds秒数 (> = 0 小于 1 天)。
Timedelta.value-
Timedelta.view阵列视图兼容性
方法
Timedelta.ceil返回导致此解决方案的新 Timedelta CEI
Timedelta.floor返回一个新的时间增量
Timedelta.isoformat将时间增量格式化为 ISO 8601 持续时间,如 P [n] Y [ n ] M [ n ] DT [ n ] H [ n ] M [ n ] S,其中 [ n ] S 由值替换。
Timedelta.round将时间增量舍入到指定的分辨率
Timedelta.to_pytimedelta返回一个实际的 datetime . timedelta 对象注意:如果有,我们将丢失纳秒分辨率
Timedelta.to_timedelta64返回一个精度为 “ns” 的 numpy . timedelta 64 对象
Timedelta.total_seconds时间增量的总持续时间 (以秒为单位) (精度为 ns )
频率
to_offset(freq)从字符串或元组表示或 datetime . timedelta 对象返回 DateOffset 对象
窗户
滚动对象由返回。点名:Pandas。DataFrame 滚动 (),Pandas。Series 滚动 () 等。扩展对象由返回。扩大通话:Pandas。DataFrame. 扩展 ( ),Pandas。Series. 扩展 ( ),等等。EWM 对象由返回。ewm 电话:Pandas。DataFrame. ewm ( ),Pandas。Series. ewm ( ),等等。
标准移动窗口功能
Rolling.count()窗口内任何非南观测的滚动计数。
Rolling.sum(args, *kwargs)计算给定 DataFrame 或 Series 的滚动和。
Rolling.mean(args, *kwargs)计算值的滚动平均值。
Rolling.median(**kwargs)计算滚动中值。
Rolling.var([ddof])计算无偏滚动方差。
Rolling.std([ddof])计算轧制标准偏差。
Rolling.min(args, *kwargs)计算滚动最小值。
Rolling.max(args, *kwargs)滚动最大值
Rolling.corr([other, pairwise])滚动样本相关
Rolling.cov([other, pairwise, ddof])滚动样本协方差
Rolling.skew(**kwargs)无偏轧制偏度
Rolling.kurt(**kwargs)计算无偏滚动峰度。
Rolling.apply(func[, raw, args, kwargs])滚动功能适用
Rolling.aggregate(arg, args, *kwargs)使用指定轴上的一个或多个操作聚合。
Rolling.quantile(quantile[, interpolation])滚动分位数。
Window.mean(args, *kwargs)计算值的窗口平均值。
Window.sum(args, *kwargs)计算给定 DataFrame 或 Series 的窗口和。
标准扩展窗口功能
Expanding.count(**kwargs)窗口内任何非南观测的扩展计数。
Expanding.sum(args, *kwargs)计算给定 DataFrame 或 Series 的扩展和。
Expanding.mean(args, *kwargs)计算值的展开平均值。
Expanding.median(**kwargs)计算膨胀中值。
Expanding.var([ddof])计算无偏扩展方差。
Expanding.std([ddof])计算扩展标准差。
Expanding.min(args, *kwargs)计算扩展最小值。
Expanding.max(args, *kwargs)膨胀最大值
Expanding.corr([other, pairwise])扩展样本相关性
Expanding.cov([other, pairwise, ddof])扩展样本协方差
Expanding.skew(**kwargs)无偏膨胀偏度
Expanding.kurt(**kwargs)计算无偏膨胀峰度。
Expanding.apply(func[, raw, args, kwargs])扩展函数应用
Expanding.aggregate(arg, args, *kwargs)使用指定轴上的一个或多个操作聚合。
Expanding.quantile(quantile[, interpolation])扩展分位数。
指数加权移动窗函数
EWM.mean(args, *kwargs)指数加权移动平均
EWM.std([bias])指数加权移动标准开发
EWM.var([bias])指数加权移动方差
EWM.corr([other, pairwise])指数加权样本相关
EWM.cov([other, pairwise, bias])指数加权样本协方差
GroupBy
GroupBy 对象由 GroupBy 调用返回:Pandas。DataFrame. 群比 (),Pandas。Series. groupby (),等等。
索引、迭代
GroupBy.iter()群比迭代器
GroupBy.groupsdict {组名 -> 组标签}
GroupBy.indicesdict {组名 -> 组索引}
GroupBy.get_group(name[, obj])使用提供的名称从组中构造 NDFrame
Grouper([key, level, freq, axis, sort])groupby 允许用户为目标对象指定 groupby 指令
功能应用
GroupBy.apply(func, args, *kwargs)按组应用函数,并将结果组合在一起。
GroupBy.aggregate(func, args, *kwargs)-
GroupBy.transform(func, args, *kwargs)-
GroupBy.pipe(func, args, *kwargs)将带有参数的函数 func 应用于此 groubby 对象,并返回函数的结果。
计算 / 描述统计
GroupBy.all([skipna])如果组中的所有值都是真实的,则返回 True,否则返回 False
GroupBy.any([skipna])如果组中的任何值是真实的,则返回 True,否则返回 False
GroupBy.bfill([limit])向后填充值
GroupBy.count()计算组计数,不包括缺少的值
GroupBy.cumcount([ascending])将每组中的每个项目编号为 0 到该组 - 1 的长度。
GroupBy.ffill([limit])向前填充这些值
GroupBy.first(**kwargs)先计算组值
GroupBy.head([n])返回每个组的前 n 行。
GroupBy.last(**kwargs)计算最后一组值
GroupBy.max(**kwargs)计算组值的最大值
GroupBy.mean(args, *kwargs)计算组平均值,不包括缺少的值
GroupBy.median(**kwargs)计算组的中值,不包括缺少的值
GroupBy.min(**kwargs)计算组值最小值
GroupBy.ngroup([ascending])将每个组从 0 编号到组数 - 1。
GroupBy.nth(n[, dropna])如果 n 是 int,则从每组中取第 n 行,如果 n 是 int 列表,则取行子集。
GroupBy.ohlc()计算值之和,不包括多个分组的缺失值,结果索引将是多索引
GroupBy.prod(**kwargs)计算组值乘积
GroupBy.rank([method, ascending, na_option, …])提供每个组中的值的等级。
GroupBy.pct_change([periods, fill_method, …])计算每个值到组中先前条目的 pct _ change
GroupBy.size()计算组大小
GroupBy.sem([ddof])计算组平均值的标准误差,不包括缺失值
GroupBy.std([ddof])计算组的标准差,不包括缺失值
GroupBy.sum(**kwargs)计算组值之和
GroupBy.var([ddof])计算组的方差,不包括缺少的值
GroupBy.tail([n])返回每个组的最后 n 行
以下方法在 SeriesGroupBy 和 data framegroupby 对象中都可用,但可能略有不同,通常是因为 data framegroupby 版本通常允许指定 axis 参数,并且通常是指示是否将应用程序限制在特定数据类型的列的参数。
DataFrameGroupBy.agg(arg, args, *kwargs)使用指定轴上的一个或多个操作聚合。
DataFrameGroupBy.all([skipna])如果组中的所有值都是真实的,则返回 True,否则返回 False
DataFrameGroupBy.any([skipna])如果组中的任何值是真实的,则返回 True,否则返回 False
DataFrameGroupBy.bfill([limit])向后填充值
DataFrameGroupBy.corr计算列的成对相关性,不包括 NA /null 值
DataFrameGroupBy.count()计算组计数,不包括缺少的值
DataFrameGroupBy.cov计算列的成对协方差,不包括 NA /null 值。
DataFrameGroupBy.cummax([axis])每个组的累计最大值
DataFrameGroupBy.cummin([axis])每组的累计最小值
DataFrameGroupBy.cumprod([axis])每组累积产品
DataFrameGroupBy.cumsum([axis])每组累计金额
DataFrameGroupBy.describe(**kwargs)生成描述性统计数据,总结数据集分布的中心趋势、分散和形状,不包括 NaN 值。
DataFrameGroupBy.diff元素的第一离散差。
DataFrameGroupBy.ffill([limit])向前填充这些值
DataFrameGroupBy.fillna使用指定的方法填写 NA / NaN 值
DataFrameGroupBy.filter(func[, dropna])返回 DataFrame 的副本,不包括不满足 func 指定的布尔条件的组中的元素。
DataFrameGroupBy.hist制作 DataFrame 的直方图。
DataFrameGroupBy.idxmax返回请求轴上首次出现最大值的索引。
DataFrameGroupBy.idxmin返回请求轴上第一次出现最小值的索引。
DataFrameGroupBy.mad返回请求轴值的平均绝对偏差
DataFrameGroupBy.pct_change([periods, …])计算每个值到组中先前条目的 pct _ change
DataFrameGroupBy.plot实现的类。群组依据物件的出图属性
DataFrameGroupBy.quantile在请求轴上给定分位数的返回值,la numpy . 百分位。
DataFrameGroupBy.rank([method, ascending, …])提供每个组中的值的等级。
DataFrameGroupBy.resample(rule, args, *kwargs)使用 TimeGrouper 时提供 Resampling 返回带有我们的 Resampling 器的新 grouper
DataFrameGroupBy.shift([periods, freq, axis])每组按时段移动观察
DataFrameGroupBy.size()计算组大小
DataFrameGroupBy.skew返回由 N - 1 归一化的请求轴上的无偏歪斜
DataFrameGroupBy.take沿轴返回给定位置索引中的元素。
DataFrameGroupBy.tshift移动时间索引,使用索引的频率 (如果可用)。
以下方法仅适用于 SeriesGroupBy 对象。
SeriesGroupBy.nlargest返回最大的 n 个元素。
SeriesGroupBy.nsmallest返回最小的 n 个元素。
SeriesGroupBy.nunique([dropna])返回组中唯一元素的数量
SeriesGroupBy.unique返回 Series 对象的唯一值。
SeriesGroupBy.value_counts([normalize, …])-
SeriesGroupBy.is_monotonic_increasing如果对象中的值是单调递增的,则返回 boolean
SeriesGroupBy.is_monotonic_decreasing如果对象中的值是单调递减的,则返回 boolean
以下方法仅适用于 DataFrameGroupBy 对象。
DataFrameGroupBy.corrwith计算两个 DataFrame 对象的行或列之间的成对相关性。
DataFrameGroupBy.boxplot([subplots, column, …])根据 DataFrame 组制作方框图。
Resampling
Resampling 对象通过 Resampling 调用返回:Pandas。DataFrame.Resampling (),Pandas。Series. 重新取样 ()。
索引、迭代
Resampler.iter()群比迭代器
Resampler.groupsdict {组名 -> 组标签}
Resampler.indicesdict {组名 -> 组索引}
Resampler.get_group(name[, obj])使用提供的名称从组中构造 NDFrame
功能应用
Resampler.apply(arg, args, *kwargs)使用指定轴上的一个或多个操作聚合。
Resampler.aggregate(arg, args, *kwargs)使用指定轴上的一个或多个操作聚合。
Resampler.transform(arg, args, *kwargs)调用函数,在每个组上生成一个类似索引的 Series,并返回一个带有转换值的 Series
Resampler.pipe(func, args, *kwargs)将带有参数的函数 func 应用于此重新采样器对象,并返回函数的结果。
上采样
Resampler.ffill([limit])向前填充这些值
Resampler.backfill([limit])在重新采样的数据中向后填充新的缺失值。
Resampler.bfill([limit])在重新采样的数据中向后填充新的缺失值。
Resampler.pad([limit])向前填充这些值
Resampler.nearest([limit])从中心开始用最近邻填充值
Resampler.fillna(method[, limit])填充上采样引入的缺失值。
Resampler.asfreq([fill_value])返回新频率的值,本质上是重新索引
Resampler.interpolate([method, axis, limit, …])根据不同的方法插值。
计算 / 描述统计
Resampler.count([_method])计算组计数,不包括缺少的值
Resampler.nunique([_method])返回组中唯一元素的数量
Resampler.first([_method])先计算组值
Resampler.last([_method])计算最后一组值
Resampler.max([_method])计算组值的最大值
Resampler.mean([_method])计算组平均值,不包括缺少的值
Resampler.median([_method])计算组的中值,不包括缺少的值
Resampler.min([_method])计算组值最小值
Resampler.ohlc([_method])计算值之和,不包括多个分组的缺失值,结果索引将是多索引
Resampler.prod([_method, min_count])计算组值乘积
Resampler.size()计算组大小
Resampler.sem([_method])计算组平均值的标准误差,不包括缺失值
Resampler.std([ddof])计算组的标准差,不包括缺失值
Resampler.sum([_method, min_count])计算组值之和
Resampler.var([ddof])计算组的方差,不包括缺少的值
风格
styler 对象由 Pandas 返回
样式构造器
Styler(data[, precision, table_styles, …])使用 HTML 和 CSS 帮助根据数据设置 DataFrame 或 Series 的样式。
Styler.from_custom_template(searchpath, name)工厂函数,用于使用自定义模板和 Jinja 环境创建 Styler 子类。
样式属性
Styler.env-
Styler.template-
Styler.loader-
样式应用
Styler.apply(func[, axis, subset])应用函数列、行或表 wase,用结果更新 HTML 表示。
Styler.applymap(func[, subset])以元素方式应用函数,用结果更新 HTML 表示。
Styler.where(cond, value[, other, subset])以元素方式应用函数,用根据函数返回值选择的样式更新 HTML 表示。
Styler.format(formatter[, subset])格式化单元格的文本显示值。
Styler.set_precision(precision)设置用于渲染的精度。
Styler.set_table_styles(table_styles)在样式器上设置表格样式。
Styler.set_table_attributes(attributes)设置表属性。
Styler.set_caption(caption)在样式器上设置标题
Styler.set_properties([subset])为每个单元格设置一个或多个非数据相关属性的便捷方法。
Styler.set_uuid(uuid)设置样式器的 uuid。
Styler.clear()“重置” 样式器,删除以前应用的任何样式。
内置样式
Styler.highlight_max([subset, color, axis])通过阴影化背景来突出显示最大值
Styler.highlight_min([subset, color, axis])通过阴影化背景来突出显示最小值
Styler.highlight_null([null_color])为缺少的值着色背景 null _ color。
Styler.background_gradient([cmap, low, …])根据每列 (可选行) 中的数据为背景上色。
Styler.bar([subset, axis, color, width, align])将背景颜色标记为每列中的值。
样式导出和导入
Styler.render(**kwargs)将构建的样式渲染为 HTML
Styler.export()导出要应用于当前样式的样式。
Styler.use(styles)设置当前样式器上的样式,可能使用样式器中的样式。导出
Styler.to_excel(excel_writer[, sheet_name, …])将样式写入 excel 工作表
绘图
Pandas 绘图模块包含以下功能。
andrews_curves(frame, class_column[, ax, …])生成 Andrews 曲线的 matplotlib 图,用于可视化多变量数据集群。
bootstrap_plot(series[, fig, size, samples])均值、中值和中值统计的自举图。
deregister_matplotlib_converters()移除 Pandas 的格式化程序和转换器
lag_plot(series[, lag, ax])时间 Series 的滞后图。
parallel_coordinates(frame, class_column[, …])平行坐标绘图。
radviz(frame, class_column[, ax, color, …])在 2D 中绘制多维数据集。
register_matplotlib_converters([explicit])用 matplotlib 注册 Pandas 格式化程序和转换器
scatter_matrix(frame[, alpha, figsize, ax, …])绘制散点图矩阵。
通用功能
使用选项
describe_option(pat[, _print_desc])打印一个或多个已注册选项的说明。
reset_option(pat)将一个或多个选项重置为默认值。
get_option(pat)检索指定选项的值。
set_option(pat, value)设置指定选项的值。
option_context(*args)上下文管理器在 with 语句上下文中临时设置选项。
测试功能
testing.assert_frame_equal(left, right[, …])检查左右 DataFrame 是否相等。
testing.assert_series_equal(left, right[, …])检查左右 Series 是否相等。
testing.assert_index_equal(left, right[, …])检查左右索引是否相等。
例外和警告
errors.DtypeWarning从文件读取列中的不同 dtypes 时发出警告。
errors.EmptyDataError遇到空数据或标头时在 PD . read _ CSV 中引发的异常 (由 C 和 Python 引擎引发)。
errors.OutOfBoundsDatetime-
errors.ParserError由 PD . read _ CSV 中遇到的错误引发的异常。
errors.ParserWarning读取不使用默认 “c” 分析器的文件时发出警告。
errors.PerformanceWarning可能影响性能时发出警告。
errors.UnsortedIndexError尝试获取多索引切片时引发错误,并且该索引尚未进行词法排序。
errors.UnsupportedFunctionCall尝试在 Pandas 对象上调用 numpy 函数时引发异常,但该对象不支持该函数
数据类型相关功能
api.types.union_categoricals(to_union[, …])组合类列表类、联合类。
api.types.infer_dtype有效推断传递的 val 或类似列表的值数组的类型。
api.types.pandas_dtype(dtype)将输入转换为仅 Pandasdtype 对象或 numpy dtype 对象。
型内省
api.types.is_bool_dtype(arr_or_dtype)检查所提供的数组或 dtype 是否为布尔 dtype。
api.types.is_categorical_dtype(arr_or_dtype)检查数组状或 dtype 是否属于分类 dtype。
api.types.is_complex_dtype(arr_or_dtype)检查所提供的数组或 dtype 是否为复杂的 dtype。
api.types.is_datetime64_any_dtype(arr_or_dtype)检查提供的数组或 dtype 是否为 datetime64 dtype。
api.types.is_datetime64_dtype(arr_or_dtype)检查阵列状或 dtype 是否为 datetime64 dtype。
api.types.is_datetime64_ns_dtype(arr_or_dtype)检查所提供的数组或 dtype 是否为 datetime64 [ns] dtype。
api.types.is_datetime64tz_dtype(arr_or_dtype)检查阵列状或 dtype 是否为 DatetimeTZDtype dtype。
api.types.is_extension_type(arr)检查类数组是否属于 Pandas 扩展类实例。
api.types.is_float_dtype(arr_or_dtype)检查所提供的数组或 dtype 是否为浮点 dtype。
api.types.is_int64_dtype(arr_or_dtype)检查提供的数组或 dtype 是否为 int64 dtype。
api.types.is_integer_dtype(arr_or_dtype)检查所提供的数组或 dtype 是否为整数 dtype。
api.types.is_interval_dtype(arr_or_dtype)检查阵列状或 dtype 是否为间隔 dtype。
api.types.is_numeric_dtype(arr_or_dtype)检查所提供的数组或 dtype 是否为数字 dtype。
api.types.is_object_dtype(arr_or_dtype)检查阵列状或 dtype 是否为物件 dtype。
api.types.is_period_dtype(arr_or_dtype)检查数组类型或 dtype 是否为周期 dtype。
api.types.is_signed_integer_dtype(arr_or_dtype)检查所提供的数组或 dtype 是否为带符号整数 dtype。
api.types.is_string_dtype(arr_or_dtype)检查提供的数组或 dtype 是否为字符串 dtype。
api.types.is_timedelta64_dtype(arr_or_dtype)检查阵列状或 dtype 是否为 timedelta 64 dtype。
api.types.is_timedelta64_ns_dtype(arr_or_dtype)检查所提供的数组或 dtype 是否为 timedelta 64 [ns] dtype。
api.types.is_unsigned_integer_dtype(arr_or_dtype)检查所提供的数组或 dtype 是否为无符号整数 dtype。
api.types.is_sparse(arr)检查阵列状是否为 Pandas 稀疏阵列。
反复反省
api.types.is_dict_like(obj)检查对象是否像 dict 一样。
api.types.is_file_like(obj)检查对象是否为类文件对象。
api.types.is_list_like(obj)检查对象是否类似列表。
api.types.is_named_tuple(obj)检查对象是否为命名元组。
api.types.is_iterator(obj)检查对象是否是迭代器。
标量内省
api.types.is_bool-
api.types.is_categorical(arr)检查类数组是否是分类实例。
api.types.is_complex-
api.types.is_datetimetz(arr)检查阵列状是否为 dtype 中含有时区元件的日期时间阵列状。
api.types.is_float-
api.types.is_hashable(obj)如果哈希 (obj) 成功,则返回 True,否则返回 False。
api.types.is_integer-
api.types.is_interval-
api.types.is_number(obj)检查对象是否为数字。
api.types.is_period(arr)检查阵列状是否为周期性索引。
api.types.is_re(obj)检查对象是否为 regex 模式实例。
api.types.is_re_compilable(obj)检查对象是否可以编译成 regex 模式实例。
api.types.is_scalar如果给定值是标量,则返回 True。
延长
这些主要是为图书馆的作者打算扩展 Pandas 的对象。
api.extensions.register_dataframe_accessor(name)在 DataFrame 对象上注册自定义访问者。
api.extensions.register_series_accessor(name)在 Series 对象上注册自定义访问者。
api.extensions.register_index_accessor(name)在索引对象上注册自定义访问者。
api.extensions.ExtensionDtype自定义数据类型,要与扩展数组配对。
api.extensions.ExtensionArray自定义一维数组类型的抽象基类。