当前位置: 首页 > 文档资料 > Pandas 函数手册 >

Series

优质
小牛编辑
128浏览
2023-12-01
函数说明
构造器
Series([data, index, dtype, name, copy, …])带有轴标签的一维 ndarray (包括时间 Series)。
属性
轴线
Series.indexSeries 的索引 (轴标签)。
Series.values根据 dtype,返回 ndarray 或类似 ndarray 的 Series
Series.dtype返回基础数据的 dtype 对象
Series.ftype如果数据稀疏密集,则返回
Series.shape返回基础数据形状的元组
Series.nbytes返回基础数据中的字节数
Series.ndim根据定义 1 返回基础数据的维数
Series.size返回基础数据中的元素数
Series.strides返回基础数据的步长
Series.itemsize返回基础数据项的 dtype 大小
Series.base如果共享基础数据的内存,则返回基对象
Series.T返回转置,这是自我定义
Series.memory_usage([index, deep])返回 Series 的内存使用情况。
Series.hasnans如果我有 nans 就回来;启用各种性能加速
Series.flags-
Series.empty-
Series.dtypes返回基础数据的 dtype 对象
Series.ftypes如果数据稀疏密集,则返回
Series.data返回基础数据的数据指针
Series.is_copy-
Series.name-
Series.put(args, *kwargs)如果 put 方法有值属性,则将其应用于该属性。
转变
Series.astype(dtype[, copy, errors])将 Pandas 对象转换为指定的 dtype dtype。
Series.infer_objects()尝试为对象列推断更好的数据类型。
Series.convert_objects([convert_dates, …])(已弃用) 尝试推断对象列的更好 dtype。
Series.copy([deep])复制此对象的索引和数据。
Series.bool()返回单个元素 PandasObject 的布尔。
Series.to_period([freq, copy])以所需频率将 Series 从 DatetimeIndex 转换为周期索引 (如果未通过,则从索引推断)
Series.to_timestamp([freq, how, copy])转换为时间段开始时时间戳的日期时间索引
Series.tolist()返回值列表。
Series.get_values()与值相同 (但处理稀疏转换);是一种观点
索引、迭代
Series.get(key[, default])从给定键 (DataFrame 列、Panel 切片等) 的对象中获取项目。) .
Series.at访问行 / 列标签对的单个值。
Series.iat按整数位置访问行 / 列对的单个值。
Series.loc通过标签或布尔数组访问一组行和列。
Series.iloc用于按位置选择的纯整数位置索引。
Series.iter()返回值的迭代器。
Series.iteritems()懒洋洋地迭代 (索引,值) 元组
Series.items()懒洋洋地迭代 (索引,值) 元组
Series.keys()索引别名
Series.pop(item)返回项目并从框架中删除。
Series.item()以 python 标量形式返回基础数据的第一个元素
Series.xs(key[, axis, level, drop_level])从 Series/DataFrame 返回横截面 (行或列)。
二元算子函数
Series.add(other[, level, fill_value, axis])Series 和其他元素相加 (二进制运算符相加)。
Series.sub(other[, level, fill_value, axis])Series 减法和其他元素减法 (二进制运算符 sub)。
Series.mul(other[, level, fill_value, axis])级数与其他元素相乘 (二元运算符 mul)。
Series.div(other[, level, fill_value, axis])Series 和其他元素的浮动除法 (二元运算符 truediv)。
Series.truediv(other[, level, fill_value, axis])Series 和其他元素的浮动除法 (二元运算符 truediv)。
Series.floordiv(other[, level, fill_value, axis])按元素对 Series 和其他 Series 进行整数除法 (二进制运算符 flooddiv)。
Series.mod(other[, level, fill_value, axis])Series 模和其他元素方式 (二进制运算符 mod)。
Series.pow(other[, level, fill_value, axis])级数指数幂和其他元素幂 (二元算子幂)。
Series.radd(other[, level, fill_value, axis])级数和其他元素相加 (二元算子 radd)。
Series.rsub(other[, level, fill_value, axis])Series 减法和其他元素减法 (二元运算符 rsub)。
Series.rmul(other[, level, fill_value, axis])级数与其他元素相乘 (二元运算符 rmul)。
Series.rdiv(other[, level, fill_value, axis])Series 和其他元素的浮动划分 (二元运算符 rtruediv)。
Series.rtruediv(other[, level, fill_value, axis])Series 和其他元素的浮动划分 (二元运算符 rtruediv)。
Series.rfloordiv(other[, level, fill_value, …])整数除法 Series 和其他,元素方式 (二元运算符 rfloordiv)。
Series.rmod(other[, level, fill_value, axis])Series 模和其他元素 (二元运算符 rmod)。
Series.rpow(other[, level, fill_value, axis])级数的指数幂和其他元素的指数幂 (二元算子 rpow)。
Series.combine(other, func[, fill_value])当一个 Series 或另一个 Series 中缺少索引时,使用给定函数和可选填充值对两个 Series 执行元素二进制操作
Series.combine_first(other)组合 Series 值,首先选择调用 Series 的值。
Series.round([decimals])将 Series 中的每个值舍入到给定的小数位数。
Series.lt(other[, level, fill_value, axis])少于 Series 和其他元素 (二元运算符 lt)。
Series.gt(other[, level, fill_value, axis])大于 Series 和其他元素 (二元运算符 gt)。
Series.le(other[, level, fill_value, axis])小于或等于级数和其他元素的 (二元运算符 le)。
Series.ge(other[, level, fill_value, axis])大于或等于 Series 和其他元素的 (二元运算符 ge)。
Series.ne(other[, level, fill_value, axis])不等于级数等,按元素计算 (二元运算符 ne)。
Series.eq(other[, level, fill_value, axis])等于级数和其他,按元素计算 (二元运算符 eq)。
Series.product([axis, skipna, level, …])返回请求轴值的乘积
Series.dot(other)与 DataFrame 的矩阵乘法或与 Series 对象的内积。
功能应用程序,GroupBy & windows
Series.apply(func[, convert_dtype, args])调用 Series 值上的函数。
Series.agg(func[, axis])使用指定轴上的一个或多个操作聚合。
Series.aggregate(func[, axis])使用指定轴上的一个或多个操作聚合。
Series.transform(func, args, *kwargs)调用函数生成类似索引的 NDFrame,并返回带有转换值的 NDFrame
Series.map(arg[, na_action])使用输入对应关系映射 Series 值 (dict、Series 或函数)。
Series.groupby([by, axis, level, as_index, …])使用映射程序 (dict 或 key 函数,将给定函数应用于组,将结果作为 Series 返回) 或按一 Series 列对 Series 进行分组。
Series.rolling(window[, min_periods, …])提供滚动窗口计算。
Series.expanding([min_periods, center, axis])提供扩展转换。
Series.ewm([com, span, halflife, alpha, …])提供指数加权函数
Series.pipe(func, args, *kwargs)应用 func (自我, args, * kwargs)
计算 / 描述统计
Series.abs()返回每个元素具有绝对值的 Series/DataFrame。
Series.all([axis, bool_only, skipna, level])返回 Series 轴或 DataFrame 轴上的所有元素是否为 True。
Series.any([axis, bool_only, skipna, level])返回在请求的轴上是否有任何元素为真。
Series.autocorr([lag])滞后 - N 自相关
Series.between(left, right[, inclusive])返回等效于左 < = Series < = right 的布尔级数。
Series.clip([lower, upper, axis, inplace])输入阈值处的修剪值。
Series.clip_lower(threshold[, axis, inplace])返回值低于阈值的输入副本被截断。
Series.clip_upper(threshold[, axis, inplace])返回截断值大于给定值的输入副本。
Series.corr(other[, method, min_periods])计算与其他 Series 的相关性,不包括缺失值
Series.count([level])Series 中非 NA /null 观测值的返回数
Series.cov(other[, min_periods])用 Series 计算协方差,不包括缺失值
Series.cummax([axis, skipna])返回 DataFrame 或 Series 轴上的累积最大值。
Series.cummin([axis, skipna])返回 DataFrame 或 Series 轴上的累积最小值。
Series.cumprod([axis, skipna])通过 DataFrame 或 Series 轴返回累积产品。
Series.cumsum([axis, skipna])返回 DataFrame 或 Series 轴上的累计总和。
Series.describe([percentiles, include, exclude])生成描述性统计数据,总结数据集分布的中心趋势、分散和形状,不包括 NaN 值。
Series.diff([periods])元素的第一离散差。
Series.factorize([sort, na_sentinel])将对象编码为枚举类型或分类变量。
Series.kurt([axis, skipna, level, numeric_only])使用 Fisher 的峰度定义返回请求轴上的无偏峰度 (正常峰度 = = 0.0)。
Series.mad([axis, skipna, level])返回请求轴值的平均绝对偏差
Series.max([axis, skipna, level, numeric_only])此方法返回对象中值的最大值。
Series.mean([axis, skipna, level, numeric_only])返回请求轴值的平均值
Series.median([axis, skipna, level, …])返回请求轴的值的中间值
Series.min([axis, skipna, level, numeric_only])此方法返回对象中值的最小值。
Series.mode()返回数据集的模式。
Series.nlargest([n, keep])返回最大的 n 个元素。
Series.nsmallest([n, keep])返回最小的 n 个元素。
Series.pct_change([periods, fill_method, …])当前元素和先前元素之间的百分比变化。
Series.prod([axis, skipna, level, …])返回请求轴值的乘积
Series.quantile([q, interpolation])给定分位数的返回值,即 la 数值百分位。
Series.rank([axis, method, numeric_only, …])沿轴计算数值数据列 (1 到 n)。
Series.sem([axis, skipna, level, ddof, …])返回请求轴上平均值的无偏标准误差。
Series.skew([axis, skipna, level, numeric_only])返回由 N - 1 归一化的请求轴上的无偏歪斜
Series.std([axis, skipna, level, ddof, …])返回要求轴上的样品标准偏差。
Series.sum([axis, skipna, level, …])返回请求轴的值之和
Series.var([axis, skipna, level, ddof, …])返回请求轴上的无偏方差。
Series.kurtosis([axis, skipna, level, …])使用 Fisher 的峰度定义返回请求轴上的无偏峰度 (正常峰度 = = 0.0)。
Series.unique()返回 Series 对象的唯一值。
Series.nunique([dropna])返回对象中唯一元素的数目。
Series.is_unique如果对象中的值是唯一的,则返回 boolean
Series.is_monotonic如果对象中的值是单调递增的,则返回 boolean
Series.is_monotonic_increasing如果对象中的值是单调递增的,则返回 boolean
Series.is_monotonic_decreasing如果对象中的值是单调递减的,则返回 boolean
Series.value_counts([normalize, sort, …])返回包含唯一值计数的对象。
Series.compound([axis, skipna, level])返回请求轴值的复合百分比
Series.nonzero()返回非零元素的整数索引
Series.ptp([axis, skipna, level, numeric_only])返回对象中最大值和最小值之间的差值。
重新设计 / 选择 / 标签操作
Series.align(other[, join, axis, level, …])将轴上的两个对象与每个轴索引的指定连接方法对齐
Series.drop([labels, axis, index, columns, …])返回删除了指定索引标签的 Series。
Series.drop_duplicates([keep, inplace])返回删除重复值的 Series。
Series.duplicated([keep])指示重复的 Series 值。
Series.equals(other)确定两个 NDFrame 对象是否包含相同的元素。
Series.first(offset)基于日期偏移对时间 Series 数据初始周期进行细分的便捷方法。
Series.head([n])返回前 n 行。
Series.idxmax([axis, skipna])返回最大值的行标签。
Series.idxmin([axis, skipna])返回最小值的行标签。
Series.isin(values)检查值是否包含在 Series 中。
Series.last(offset)基于日期偏移对时间 Series 数据的最终周期进行细分的便捷方法。
Series.reindex([index])用可选的填充逻辑使 Series 符合新索引,将 NA / NaN 放置在前一个索引中没有值的位置。
Series.reindex_like(other[, method, copy, …])将具有匹配索引的对象返回给我自己。
Series.rename([index])更改 Series 索引标签或名称
Series.rename_axis(mapper[, axis, copy, inplace])更改索引或列的名称。
Series.reset_index([level, drop, name, inplace])使用索引重置生成新的 DataFrame 或 Series。
Series.sample([n, frac, replace, weights, …])从对象轴返回项目的随机样本。
Series.select(crit[, axis])(已弃用) 返回与轴标签匹配条件相对应的数据
Series.set_axis(labels[, axis, inplace])为给定轴指定所需的索引。
Series.take(indices[, axis, convert, is_copy])沿轴返回给定位置索引中的元素。
Series.tail([n])返回最后 n 行。
Series.truncate([before, after, axis, copy])在某个索引值前后截断 Series 或 DataFrame。
Series.where(cond[, other, inplace, axis, …])返回与 self 形状相同的对象,其对应条目来自 self,cond 为 True,否则来自其他。
Series.mask(cond[, other, inplace, axis, …])返回与 self 形状相同的对象,其对应条目来自 self,cond 为 False,否则来自其他。
Series.add_prefix(prefix)带字符串前缀的前缀标签。
Series.add_suffix(suffix)带有字符串后缀的后缀标签。
Series.filter([items, like, regex, axis])根据指定索引中的标签子集 DataFrame 的行或列。
缺失数据处理
Series.isna()检测缺失值。
Series.notna()检测现有 (未丢失) 值。
Series.dropna([axis, inplace])返回删除了缺少值的新 Series。
Series.fillna([value, method, axis, …])使用指定的方法填写 NA / NaN 值
Series.interpolate([method, axis, limit, …])根据不同的方法插值。
整形、分选
Series.argsort([axis, kind, order])覆盖 ndarray . argsort。
Series.argmin([axis, skipna])(已弃用)..
Series.argmax([axis, skipna])(已弃用)..
Series.reorder_levels(order)使用输入顺序重新排列索引级别。
Series.sort_values([axis, ascending, …])按值排序。
Series.sort_index([axis, level, ascending, …])按索引标签排序 Series。
Series.swaplevel([i, j, copy])交换多索引中的级别 I 和 j
Series.unstack([level, fill_value])史黛克,又名
Series.searchsorted(value[, side, sorter])查找应该插入元素以维持秩序的索引。
Series.ravel([order])将展平的基础数据作为 ndarray 返回
Series.repeat(repeats, args, *kwargs)重复 Series 的元素。
Series.squeeze([axis])挤压长度 1 尺寸。
Series.view([dtype])创建 Series 的新视图。
Series.sortlevel([level, ascending, …])(已弃用) 按选定级别对具有多索引的 Series 进行排序。
合并 / 加入 / 合并
Series.append(to_append[, ignore_index, …])连接两个或多个 Series。
Series.replace([to_replace, value, inplace, …])将 to _ replace 中给定的值替换为值。
Series.update(other)使用传递 Series 中的非 NA 值就地修改 Series。
时间 Series 相关的
Series.asfreq(freq[, method, how, …])将时间 Series 转换为指定频率。
Series.asof(where[, subset])取不带 NaN 的最后一行 (或者在 DataFrame 的情况下,不带 NaN 的最后一行仅考虑列的子集)
Series.shift([periods, freq, axis])按所需周期数移位索引,可选时间频率
Series.first_valid_index()返回第一个非 NA /null 值的索引。
Series.last_valid_index()返回最后一个非 NA /null 值的索引。
Series.resample(rule[, how, axis, …])时间 Series 频率转换和 Resampling 的便捷方法。
Series.tz_convert(tz[, axis, level, copy])将 tz 感知轴转换为目标时区。
Series.tz_localize(tz[, axis, level, copy, …])将 tz - naive 时间 Series 本地化为目标时区。
Series.at_time(time[, asof])选择一天中特定时间的值 (例如
Series.between_time(start_time, end_time[, …])选择一天中特定时间之间的值 (例如,上午 9 : 00 - 9 : 30)。
Series.tshift([periods, freq, axis])移动时间索引,使用索引的频率 (如果可用)。
Series.slice_shift([periods, axis])相当于移位而不复制数据。
类日期属性
日期时间属性
Series.dt.date返回 python datetime . date 对象的 numpy 数组 (即时间戳中没有时区信息的日期部分)。
Series.dt.time返回 datetime . time 的 numpy 数组。
Series.dt.year日期时间的年份
Series.dt.month1 月 = 1 月,12 月 = 12 月
Series.dt.day日期时间的天数
Series.dt.hour日期时间的小时数
Series.dt.minute日期时间的分钟数
Series.dt.second日期时间的秒数
Series.dt.microsecond日期时间的微秒
Series.dt.nanosecond日期时间的纳秒
Series.dt.week一年中的第几周
Series.dt.weekofyear一年中的第几周
Series.dt.dayofweek星期一 = 0,星期日 = 6 的星期几
Series.dt.weekday星期一 = 0,星期日 = 6 的星期几
Series.dt.dayofyear一年中的第几天
Series.dt.quarter日期的季度
Series.dt.is_month_start逻辑指示每月第一天 (由频率定义)
Series.dt.is_month_end指示日期是否为当月的最后一天。
Series.dt.is_quarter_start指示日期是否为季度的第一天。
Series.dt.is_quarter_end指示日期是否为季度的最后一天。
Series.dt.is_year_start指出日期是否为一年中的第一天。
Series.dt.is_year_end指出日期是否为一年中的最后一天。
Series.dt.is_leap_year如果日期属于闰年,则为布尔指示符。
Series.dt.daysinmonth当月的天数
Series.dt.days_in_month当月的天数
Series.dt.tz-
Series.dt.freq-
日期时间方法
Series.dt.to_period(args, *kwargs)以特定频率转换为周期指数。
Series.dt.to_pydatetime()将数据作为本机 Python datetime 对象的数组返回
Series.dt.tz_localize(args, *kwargs)将 tz - naive 日期时间索引本地化为 tz 感知的日期时间索引。
Series.dt.tz_convert(args, *kwargs)将 tz 感知的日期时间索引从一个时区转换到另一个时区。
Series.dt.normalize(args, *kwargs)将时间转换为午夜。
Series.dt.strftime(args, *kwargs)使用指定的 date _ format 转换为索引。
Series.dt.round(args, *kwargs)将数据舍入到指定的频率。
Series.dt.floor(args, *kwargs)将数据降至指定频率。
Series.dt.ceil(args, *kwargs)将数据上限设置为指定频率。
Series.dt.month_name(args, *kwargs)返回具有指定区域设置的 DateTimeIndex 的月份名称。
Series.dt.day_name(args, *kwargs)返回具有指定区域设置的 DateTimeIndex 的日期名称。
时间增量属性
Series.dt.days每个元素的天数。
Series.dt.seconds每个元素的秒数 (> = 0 且小于 1 天)。
Series.dt.microseconds每个元素的微秒数 (> = 0 且小于 1 秒)。
Series.dt.nanoseconds每个元素的纳秒数 (> = 0 且小于 1 微秒)。
Series.dt.components返回时间增量组件的 DataFrame (天、小时、分钟、秒、毫秒、微秒、纳秒)。
时间增量法
Series.dt.to_pytimedelta()返回本机 datetime . timedelta 对象的数组。
Series.dt.total_seconds(args, *kwargs)返回每个元素的总持续时间 (以秒为单位)。