DataFrame

优质

小牛编辑

144浏览

2023-12-01

函数	说明
构造器
DataFrame([data, index, columns, dtype, copy])	二维大小可变的、具有标记轴 (行和列) 的潜在异构表格数据结构。
属性和基础数据
轴线
DataFrame.index	DataFrame 的索引 (行标签)。
DataFrame.columns	DataFrame 的列标签。
DataFrame.dtypes	返回 DataFrame 中的数据类型。
DataFrame.ftypes	返回 DataFrame 中的 ftype (稀疏 / 密集和 dtype 的指示)。
DataFrame.get_dtype_counts()	返回此对象中唯一 dtypes 的计数。
DataFrame.get_ftype_counts()	(已弃用) 返回此对象中唯一 ftypes 的计数。
DataFrame.select_dtypes([include, exclude])	根据列 dtypes 返回 DataFrame 列的子集。
DataFrame.values	返回 DataFrame 的 Numpy 表示形式。
DataFrame.get_values()	将稀疏值转换为密集值后返回 ndarray。
DataFrame.axes	返回表示 DataFrame 轴的列表。
DataFrame.ndim	返回一个表示轴 / 数组维数的 int。
DataFrame.size	返回一个 int，表示此对象中的元素数。
DataFrame.shape	返回表示 DataFrame 维度的元组。
DataFrame.memory_usage([index, deep])	以字节为单位返回每列的内存使用情况。
DataFrame.empty	指示 DataFrame 是否为空。
DataFrame.is_copy	-
转变
DataFrame.astype(dtype[, copy, errors])	将 Pandas 对象转换为指定的 dtype dtype。
DataFrame.convert_objects([convert_dates, …])	(已弃用) 尝试推断对象列的更好 dtype。
DataFrame.infer_objects()	尝试为对象列推断更好的数据类型。
DataFrame.copy([deep])	复制此对象的索引和数据。
DataFrame.isna()	检测缺失值。
DataFrame.notna()	检测现有 (未丢失) 值。
DataFrame.bool()	返回单个元素 PandasObject 的布尔。
索引、迭代
DataFrame.head([n])	返回前 n 行。
DataFrame.at	访问行 / 列标签对的单个值。
DataFrame.iat	按整数位置访问行 / 列对的单个值。
DataFrame.loc	通过标签或布尔数组访问一组行和列。
DataFrame.iloc	用于按位置选择的纯整数位置索引。
DataFrame.insert(loc, column, value[, …])	在指定位置将列插入 DataFrame。
DataFrame.insert(loc, column, value[, …])	在指定位置将列插入 DataFrame。
DataFrame.iter()	迭代信息轴
DataFrame.items()	迭代器 (列名，Series) 对。
DataFrame.keys()	获取 “信息轴”(有关详细信息，请参阅索引)
DataFrame.iteritems()	迭代器 (列名，Series) 对。
DataFrame.iterrows()	以 (索引、Series) 对形式迭代 DataFrame 行。
DataFrame.itertuples([index, name])	以 namedtpulles 形式迭代 DataFrame 行，索引值作为元组的第一个元素。
DataFrame.lookup(row_labels, col_labels)	基于标签的 DataFrame “花式索引” 功能。
DataFrame.pop(item)	返回项目并从框架中删除。
DataFrame.tail([n])	返回最后 n 行。
DataFrame.xs(key[, axis, level, drop_level])	从 Series/DataFrame 返回横截面 (行或列)。
DataFrame.get(key[, default])	从给定键 (DataFrame 列、Panel 切片等) 的对象中获取项目。) .
DataFrame.isin(values)	返回布尔 DataFrame，显示 DataFrame 中的每个元素是否包含在值中。
DataFrame.where(cond[, other, inplace, …])	返回与 self 形状相同的对象，其对应条目来自 self，cond 为 True，否则来自其他。
DataFrame.mask(cond[, other, inplace, axis, …])	返回与 self 形状相同的对象，其对应条目来自 self，cond 为 False，否则来自其他。
DataFrame.query(expr[, inplace])	使用布尔表达式查询框架的列。
二元算子函数
DataFrame.add(other[, axis, level, fill_value])	添加 DataFrame 和其他元素 (二进制运算符 add)。
DataFrame.sub(other[, axis, level, fill_value])	DataFrame 和其他元素相减 (二进制运算符 sub)。
DataFrame.mul(other[, axis, level, fill_value])	DataFrame 和其他元素的乘法 (二进制运算符 mul)。
DataFrame.div(other[, axis, level, fill_value])	DataFrame 和其他元素的浮动划分 (二进制运算符 truediv)。
DataFrame.truediv(other[, axis, level, …])	DataFrame 和其他元素的浮动划分 (二进制运算符 truediv)。
DataFrame.floordiv(other[, axis, level, …])	DataFrame 和其他元素的整数除法 (二进制运算符 flooddiv)。
DataFrame.mod(other[, axis, level, fill_value])	DataFrame 模和其他元素 (二进制运算符 mod)。
DataFrame.pow(other[, axis, level, fill_value])	DataFrame 指数幂和其他元素幂 (二元算子幂)。
DataFrame.dot(other)	与 DataFrame 或 Series 对象的矩阵乘法。
DataFrame.radd(other[, axis, level, fill_value])	添加 DataFrame 和其他元素 (二元运算符 radd)。
DataFrame.rsub(other[, axis, level, fill_value])	DataFrame 和其他元素减法 (二进制运算符 rsub)。
DataFrame.rmul(other[, axis, level, fill_value])	DataFrame 和其他元素的乘法 (二进制运算符 rmul)。
DataFrame.rdiv(other[, axis, level, fill_value])	DataFrame 和其他元素的浮动划分 (二进制运算符 rtruediv)。
DataFrame.rtruediv(other[, axis, level, …])	DataFrame 和其他元素的浮动划分 (二进制运算符 rtruediv)。
DataFrame.rfloordiv(other[, axis, level, …])	DataFrame 和其他元素的整数除法 (二元运算符 rfloordiv)。
DataFrame.rmod(other[, axis, level, fill_value])	DataFrame 模和其他元素 (二进制运算符 rmod)。
DataFrame.rpow(other[, axis, level, fill_value])	DataFrame 和其他元素的指数幂 (二元运算符 rpow)。
DataFrame.lt(other[, axis, level])	灵活比较方法包装
DataFrame.gt(other[, axis, level])	灵活比较方法包装器
DataFrame.le(other[, axis, level])	灵活比较方法包装
DataFrame.ge(other[, axis, level])	灵活比较方法的包装
DataFrame.ne(other[, axis, level])	用于灵活比较方法的包装器
DataFrame.eq(other[, axis, level])	灵活比较方法包装器
DataFrame.combine(other, func[, fill_value, …])	添加两个 DataFrame 对象，不传播 NaN 值，因此如果某个 (列，时间) 帧缺少一个值，它将默认为另一帧的值 (也可能是 NaN )
DataFrame.combine_first(other)	组合两个 DataFrame 对象，并在调用方法的帧中默认为非空值。
功能应用程序，GroupBy & windows
DataFrame.apply(func[, axis, broadcast, …])	沿 DataFrame 的轴应用函数。
DataFrame.applymap(func)	以元素方式将函数应用于 DataFrame。
DataFrame.pipe(func, args, *kwargs)	应用 func (自我， args， * kwargs)
DataFrame.agg(func[, axis])	使用指定轴上的一个或多个操作聚合。
DataFrame.aggregate(func[, axis])	使用指定轴上的一个或多个操作聚合。
DataFrame.transform(func, args, *kwargs)	调用函数生成类似索引的 NDFrame，并返回带有转换值的 NDFrame
DataFrame.groupby([by, axis, level, …])	使用映射程序 (dict 或 key 函数，将给定函数应用于组，将结果作为 Series 返回) 或按一 Series 列对 Series 进行分组。
DataFrame.rolling(window[, min_periods, …])	提供滚动窗口计算。
DataFrame.expanding([min_periods, center, axis])	提供扩展转换。
DataFrame.ewm([com, span, halflife, alpha, …])	提供指数加权函数
计算 / 描述统计
DataFrame.abs()	返回每个元素具有绝对值的 Series/DataFrame。
DataFrame.all([axis, bool_only, skipna, level])	返回 Series 轴或 DataFrame 轴上的所有元素是否为 True。
DataFrame.any([axis, bool_only, skipna, level])	返回在请求的轴上是否有任何元素为真。
DataFrame.clip([lower, upper, axis, inplace])	输入阈值处的修剪值。
DataFrame.clip_lower(threshold[, axis, inplace])	返回值低于阈值的输入副本被截断。
DataFrame.clip_upper(threshold[, axis, inplace])	返回截断值大于给定值的输入副本。
DataFrame.compound([axis, skipna, level])	返回请求轴值的复合百分比
DataFrame.corr([method, min_periods])	计算列的成对相关性，不包括 NA /null 值
DataFrame.corrwith(other[, axis, drop])	计算两个 DataFrame 对象的行或列之间的成对相关性。
DataFrame.count([axis, level, numeric_only])	对每列或每行的非 NA 单元格进行计数。
DataFrame.cov([min_periods])	计算列的成对协方差，不包括 NA /null 值。
DataFrame.cummax([axis, skipna])	返回 DataFrame 或 Series 轴上的累积最大值。
DataFrame.cummin([axis, skipna])	返回 DataFrame 或 Series 轴上的累积最小值。
DataFrame.cumprod([axis, skipna])	通过 DataFrame 或 Series 轴返回累积产品。
DataFrame.cumsum([axis, skipna])	返回 DataFrame 或 Series 轴上的累计总和。
DataFrame.describe([percentiles, include, …])	生成描述性统计数据，总结数据集分布的中心趋势、分散和形状，不包括 NaN 值。
DataFrame.diff([periods, axis])	元素的第一离散差。
DataFrame.eval(expr[, inplace])	评估描述 DataFrame 列操作的字符串。
DataFrame.kurt([axis, skipna, level, …])	使用 Fisher 的峰度定义返回请求轴上的无偏峰度 (正常峰度 = = 0.0)。
DataFrame.kurtosis([axis, skipna, level, …])	使用 Fisher 的峰度定义返回请求轴上的无偏峰度 (正常峰度 = = 0.0)。
DataFrame.mad([axis, skipna, level])	返回请求轴值的平均绝对偏差
DataFrame.max([axis, skipna, level, …])	此方法返回对象中值的最大值。
DataFrame.mean([axis, skipna, level, …])	返回请求轴值的平均值
DataFrame.median([axis, skipna, level, …])	返回请求轴的值的中间值
DataFrame.min([axis, skipna, level, …])	此方法返回对象中值的最小值。
DataFrame.mode([axis, numeric_only])	获取每个元素沿选定轴的模式。
DataFrame.pct_change([periods, fill_method, …])	当前元素和先前元素之间的百分比变化。
DataFrame.prod([axis, skipna, level, …])	返回请求轴值的乘积
DataFrame.product([axis, skipna, level, …])	返回请求轴值的乘积
DataFrame.quantile([q, axis, numeric_only, …])	在请求轴上给定分位数的返回值，la numpy . 百分位。
DataFrame.rank([axis, method, numeric_only, …])	沿轴计算数值数据列 (1 到 n)。
DataFrame.round([decimals])	将 DataFrame 舍入到可变小数位数。
DataFrame.sem([axis, skipna, level, ddof, …])	返回请求轴上平均值的无偏标准误差。
DataFrame.skew([axis, skipna, level, …])	返回由 N - 1 归一化的请求轴上的无偏歪斜
DataFrame.sum([axis, skipna, level, …])	返回请求轴的值之和
DataFrame.std([axis, skipna, level, ddof, …])	返回要求轴上的样品标准偏差。
DataFrame.var([axis, skipna, level, ddof, …])	返回请求轴上的无偏方差。
DataFrame.nunique([axis, dropna])	返回在请求轴上有多个不同观察值的 Series。
重新设计 / 选择 / 标签操作
DataFrame.add_prefix(prefix)	带字符串前缀的前缀标签。
DataFrame.add_suffix(suffix)	带有字符串后缀的后缀标签。
DataFrame.align(other[, join, axis, level, …])	将轴上的两个对象与每个轴索引的指定连接方法对齐
DataFrame.at_time(time[, asof])	选择一天中特定时间的值 (例如
DataFrame.between_time(start_time, end_time)	选择一天中特定时间之间的值 (例如，上午 9 : 00 - 9 : 30)。
DataFrame.drop([labels, axis, index, …])	从行或列中删除指定的标签。
DataFrame.drop_duplicates([subset, keep, …])	返回删除重复行的 DataFrame，可选地只考虑某些列
DataFrame.duplicated([subset, keep])	返回表示重复行的布尔 Series，可选地仅考虑某些列
DataFrame.equals(other)	确定两个 NDFrame 对象是否包含相同的元素。
DataFrame.filter([items, like, regex, axis])	根据指定索引中的标签子集 DataFrame 的行或列。
DataFrame.first(offset)	基于日期偏移对时间 Series 数据初始周期进行细分的便捷方法。
DataFrame.head([n])	返回前 n 行。
DataFrame.idxmax([axis, skipna])	返回请求轴上首次出现最大值的索引。
DataFrame.idxmin([axis, skipna])	返回请求轴上第一次出现最小值的索引。
DataFrame.last(offset)	基于日期偏移对时间 Series 数据的最终周期进行细分的便捷方法。
DataFrame.reindex([labels, index, columns, …])	用可选的填充逻辑使 DataFrame 符合新索引，将 NA / NaN 放置在前一个索引中没有值的位置。
DataFrame.reindex_axis(labels[, axis, …])	使用可选的填充逻辑使输入对象符合新索引，将 NA / NaN 放在先前索引中没有值的位置。
DataFrame.reindex_like(other[, method, …])	将具有匹配索引的对象返回给我自己。
DataFrame.rename([mapper, index, columns, …])	更改轴标签。
DataFrame.rename_axis(mapper[, axis, copy, …])	更改索引或列的名称。
DataFrame.reset_index([level, drop, …])	对于具有多级索引的 DataFrame，在索引名称下的列中返回带有标记信息的新 DataFrame，默认为 “level 0”、“level 1” 等。
DataFrame.sample([n, frac, replace, …])	从对象轴返回项目的随机样本。
DataFrame.select(crit[, axis])	(已弃用) 返回与轴标签匹配条件相对应的数据
DataFrame.set_axis(labels[, axis, inplace])	为给定轴指定所需的索引。
DataFrame.set_index(keys[, drop, append, …])	使用一个或多个现有列设置 DataFrame 索引 (行标签)。
DataFrame.tail([n])	返回最后 n 行。
DataFrame.take(indices[, axis, convert, is_copy])	沿轴返回给定位置索引中的元素。
DataFrame.truncate([before, after, axis, copy])	在某个索引值前后截断 Series 或 DataFrame。
缺失数据处理
DataFrame.dropna([axis, how, thresh, …])	删除缺少的值。
DataFrame.fillna([value, method, axis, …])	使用指定的方法填写 NA / NaN 值
DataFrame.replace([to_replace, value, …])	将 to _ replace 中给定的值替换为值。
DataFrame.interpolate([method, axis, limit, …])	根据不同的方法插值。
整形、分类、转移
DataFrame.pivot([index, columns, values])	返回按给定索引 / 列值组织的重新整形 DataFrame。
DataFrame.pivot_table([values, index, …])	创建电子表格样式的透视表作为 DataFrame 架。
DataFrame.reorder_levels(order[, axis])	使用输入顺序重新排列索引级别。
DataFrame.sort_values(by[, axis, ascending, …])	按任一轴的值排序
DataFrame.sort_index([axis, level, …])	按标签 (沿轴) 排序对象
DataFrame.nlargest(n, columns[, keep])	按列降序返回前 n 行。
DataFrame.nsmallest(n, columns[, keep])	获取按列的 n 个最小值排序的 DataFrame 的行。
DataFrame.swaplevel([i, j, axis])	交换特定轴上多索引中的级别 I 和 j
DataFrame.stack([level, dropna])	将指定级别从列堆叠到索引。
DataFrame.unstack([level, fill_value])	枢转 (必须是分层的) 索引标签的级别，返回具有新级别的列标签的 DataFrame，该列标签的最内层由枢转的索引标签组成。
DataFrame.swapaxes(axis1, axis2[, copy])	适当交换轴和交换值轴
DataFrame.melt([id_vars, value_vars, …])	“取消固定” 从宽格式到长格式的 DataFrame，可选地保留标识符变量集。
DataFrame.squeeze([axis])	挤压长度 1 尺寸。
DataFrame.to_panel()	(已弃用) 将长 (堆叠) 格式 (DataFrame) 转换为宽 ( 3D、Panel) 格式。
DataFrame.to_xarray()	从 Pandas 对象返回 xarray 对象。
DataFrame.T	转置索引和列。
DataFrame.transpose(args, *kwargs)	转置索引和列。
合并 / 加入 / 合并
DataFrame.append(other[, ignore_index, …])	将其他行追加到此帧的末尾，返回一个新对象。
DataFrame.assign(**kwargs)	将新列分配给 DataFrame，返回新对象 (副本)，新列添加到原始列中。
DataFrame.join(other[, on, how, lsuffix, …])	将列与索引或键列上的其他 DataFrame 连接起来。
DataFrame.merge(right[, how, on, left_on, …])	通过按列或索引执行数据库样式的联接操作来合并 DataFrame 对象。
DataFrame.update(other[, join, overwrite, …])	使用来自另一个 DataFrame 的非 NA 值就地修改。
时间 Series 相关的
DataFrame.asfreq(freq[, method, how, …])	将时间 Series 转换为指定频率。
DataFrame.asof(where[, subset])	取不带 NaN 的最后一行 (或者在 DataFrame 的情况下，不带 NaN 的最后一行仅考虑列的子集)
DataFrame.shift([periods, freq, axis])	按所需周期数移位索引，可选时间频率
DataFrame.slice_shift([periods, axis])	相当于移位而不复制数据。
DataFrame.tshift([periods, freq, axis])	移动时间索引，使用索引的频率 (如果可用)。
DataFrame.first_valid_index()	返回第一个非 NA /null 值的索引。
DataFrame.last_valid_index()	返回最后一个非 NA /null 值的索引。
DataFrame.resample(rule[, how, axis, …])	时间 Series 频率转换和 Resampling 的便捷方法。
DataFrame.to_period([freq, axis, copy])	将 DataFrame 从 DatetimeIndex 转换为所需频率的周期索引 (如果没有通过，则从索引推断)
DataFrame.to_timestamp([freq, how, axis, copy])	转换为时间段开始时时间戳的日期时间索引
DataFrame.tz_convert(tz[, axis, level, copy])	将 tz 感知轴转换为目标时区。
DataFrame.tz_localize(tz[, axis, level, …])	将 tz - naive 时间 Series 本地化为目标时区。
绘图
DataFrame. plot 是表单 DataFrame. plot 的特定绘图方法的可调用方法和命名空间属性。
DataFrame.plot([x, y, kind, ax, ….])	DataFrame 绘图存取器和方法
DataFrame.plot.area([x, y])	面积图
DataFrame.plot.bar([x, y])	竖线图。
DataFrame.plot.barh([x, y])	画一个横杠图。
DataFrame.plot.box([by])	制作 DataFrame 列的方框图。
DataFrame.plot.density([bw_method, ind])	使用高斯核生成核密度估计图。
DataFrame.plot.hexbin(x, y[, C, …])	生成六边形宁滨图。
DataFrame.plot.hist([by, bins])	绘制 DataFrame 列的直方图。
DataFrame.plot.kde([bw_method, ind])	使用高斯核生成核密度估计图。
DataFrame.plot.line([x, y])	将 DataFrame 列绘制为线。
DataFrame.plot.pie([y])	生成饼图。
DataFrame.plot.scatter(x, y[, s, c])	创建具有不同标记点大小和颜色的散点图。
DataFrame.boxplot([column, by, ax, …])	从 DataFrame 列绘制方框图。
DataFrame.hist([column, by, grid, …])	制作 DataFrame 的直方图。
Series 化 / 输入输出 / 转换
DataFrame.from_csv(path[, header, sep, …])	(已弃用) 读取 CSV 文件。
DataFrame.from_dict(data[, orient, dtype, …])	从数组状或 dict 的 dict 构造 DataFrame。
DataFrame.from_items(items[, columns, orient])	(已弃用) 从元组列表中构建 DataFrame
DataFrame.from_records(data[, index, …])	将结构化或记录数组转换为 DataFrame
DataFrame.info([verbose, buf, max_cols, …])	打印 DataFrame 的简明摘要。
DataFrame.to_parquet(fname[, engine, …])	将 DataFrame 写入二进制拼花格式。
DataFrame.to_pickle(path[, compression, …])	将对象保存 (Series 化) 到文件中。
DataFrame.to_csv([path_or_buf, sep, na_rep, …])	将 DataFrame 写入逗号分隔值 (CSV) 文件
DataFrame.to_hdf(path_or_buf, key, **kwargs)	使用 HDFStore 将包含的数据写入 HDF5 文件。
DataFrame.to_sql(name, con[, schema, …])	将存储在 DataFrame 中的记录写入 SQL 数据库。
DataFrame.to_dict([orient, into])	将 DataFrame 转换为词典。
DataFrame.to_excel(excel_writer[, …])	将 DataFrame 写入 excel 工作表
DataFrame.to_json([path_or_buf, orient, …])	将对象转换为 JSON 字符串。
DataFrame.to_html([buf, columns, col_space, …])	将 DataFrame 渲染为 HTML 表。
DataFrame.to_feather(fname)	写出 DataFrame 的二进制羽化格式
DataFrame.to_latex([buf, columns, …])	将对象呈现为表格环境表。
DataFrame.to_stata(fname[, convert_dates, …])	导出 Stata 二进制 DTA 文件。
DataFrame.to_msgpack([path_or_buf, encoding])	msgpack (Series 化) 对象到输入文件路径
DataFrame.to_gbq(destination_table, project_id)	将 DataFrame 写入 Google BigQuery 表。
DataFrame.to_records([index, convert_datetime64])	将 DataFrame 转换为 NumPy 记录数组。
DataFrame.to_sparse([fill_value, kind])	转换为稀疏塔夫兰
DataFrame.to_dense()	返回 NDFrame 的密集表示 (相对于稀疏)
DataFrame.to_string([buf, columns, …])	将 DataFrame 呈现为控制台友好的表格输出。
DataFrame.to_clipboard([excel, sep])	将对象复制到系统剪贴板。
DataFrame.style	属性返回 Styler 对象，该对象包含用于构建 DataFrame 架的样式化 HTML 表示的方法。
稀少的
SparseDataFrame.to_coo()	将帧内容作为稀疏的 SciPy COO 矩阵返回。