当前位置: 首页 > 面试题库 >

pandas-带状空白

微生博简
2023-03-14
问题内容

我正在使用pythoncsvkit比较2个文件,如下所示:

df1 = pd.read_csv('input1.csv', sep=',\s+', delimiter=',', encoding="utf-8")
df2 = pd.read_csv('input2.csv', sep=',\s,', delimiter=',', encoding="utf-8")
df3 = pd.merge(df1,df2, on='employee_id', how='right')
df3.to_csv('output.csv', encoding='utf-8', index=False)

目前,我正在通过脚本(从employee_id列中删除空格)之前运行文件。

employee_ids的示例:

37 78973 3
23787
2 22 3
123

有办法csvkit做到这一点并为我节省一步吗?


问题答案:

您可以strip()使用.str.strip()在Pandas中整个系列:

df1['employee_id'] = df1['employee_id'].str.strip()
df2['employee_id'] = df2['employee_id'].str.strip()

这将消除导致/在后的空格employee_id中柱都df1df2

或者,您可以修改read_csv行以同时使用skipinitialspace=True

df1 = pd.read_csv('input1.csv', sep=',\s+', delimiter=',', encoding="utf-8", skipinitialspace=True)
df2 = pd.read_csv('input2.csv', sep=',\s,', delimiter=',', encoding="utf-8", skipinitialspace=True)

您似乎正在尝试删除包含数字的字符串中的空格。您可以通过以下方式做到这一点:

df1['employee_id'] = df1['employee_id'].str.replace(" ","")
df2['employee_id'] = df2['employee_id'].str.replace(" ","")


 类似资料:
  • 介绍 空状态时的占位提示,2.6 版本开始支持此组件。 引入 import { createApp } from 'vue'; import { Empty } from 'vant'; const app = createApp(); app.use(Empty); 代码演示 基础用法 <van-empty description="描述文字" /> 图片类型 Empty 组件内置了多种占

  • 空状态时的占位提示。 基础用法 demo <el-empty description="描述文字"></el-empty> 自定义图片 通过设置 image 属性传入图片 URL。 demo <el-empty image="https://shadow.elemecdn.com/app/element/hamburger.9cf7b091-55e9-11e9-a976-7f4d0b07eef6

  • 问题内容: 我如何使用pandas读取.csv文件(无标题),并且只希望使用列的子集(比如说20列中的第4和第7列)?我似乎无法做 问题答案: 为了读取其中没有标题的csv,仅对于某些列,您需要传递params以及第4列和第7列: 查看文档

  • 相较于《利用Python进行数据分析》,本书最大的特点是所有操作都变成了分解动作,而且每步都有详细讲解。但是,书写的有点啰嗦,而Jupyter Notebook又有些错。我对两者做了整合和总结。

  • 空状态发生于一个常规内容页面不能显示时。可能是一个没有条目的列表,或者一个没有返回结果的搜索。虽然这些情况不是典型的,但也是展示良好设计以避免用户失望或者困惑的好机会。 如果因为一个系统错误不能显示内容,参见 app errors。 显示空状态 避免完全空的内容 显示空状态 最基本的空状态显示一个非交互的图片和文本标语。 使用一个图片: 相对于背景来说,显得巧妙和素净。 以一个生动的方式传达应用的