当前位置: 首页 > 面试题库 >

Pandas的to_csv呼叫以逗号开头

柳刚豪
2023-03-14
问题内容

我有一个数据文件apples.csv,其标题如下:

"id","str1","str2","str3","num1","num2"

我将其读入带有熊猫的数据框中:

apples = pd.read_csv('apples.csv',delimiter=",",sep=r"\s+")

然后,我对此做一些处理,但是忽略了这一点(我已将所有注释都注释掉了,而我的总体问题仍然存在,因此这里所说的内容无关紧要)。

然后将其保存:

apples.to_csv('bananas.csv',columns=["id","str1","str2","str3","num1","num2"])

现在,查看bananas.csv,其标题为:

,id,str1,str2,str3,num1,num2

没有更多的引号(我不太在意,因为它不会影响文件中的任何内容),然后是引号。现在,随后的行中还有一个附加列,因此节省了7列。但是,如果我这样做:

print(len(apples.columns))

即将保存之前,它会显示6列…

我通常使用Java / Perl / R,对Python尤其是Pandas的经验较少,所以我不确定这是“是的,它确实做到了”还是问题所在-
但我花了很长时间进行有趣的尝试来弄清楚并无法通过搜索找到它。

我怎么能不以逗号开头呢,也许同样重要-为什么要这样做呢?


问题答案:

设置index=False(因此默认为True您看到此输出的原因),以便不将索引值保存到您的csv中,请参阅文档

所以这:

df = pd.DataFrame({'a':np.arange(5), 'b':np.arange(5)})
df.to_csv(r'c:\data\t.csv')

结果是

,a,b
0,0,0
1,1,1
2,2,2
3,3,3
4,4,4

同时:

df.to_csv(r'c:\data\t.csv', index=False)

结果:

a,b
0,0
1,1
2,2
3,3
4,4

这是针对您可能要保存一些索引值的情况



 类似资料:
  • 这里是Twilio的新手,并寻求twilio专家的建议。我正在尝试拨打IVR系统的出站电话,等待几秒钟并发送键盘号码输入以在另一端启动工作流程 到目前为止,我可以呼叫IVR系统,但我如何发送号码输入?我认为TwiML是实现这一点的方法!非常感谢您的帮助

  • 我们需要使用语音连接两位客户,但我们需要隐藏彼此的客户电话号码。我们决定使用下一种方法——用twilio屏蔽电话号码 问题是: 我们使用twilio号码连接两个客户。我们可以使用相同的号码进行另一个呼叫吗?或者在呼叫完成之前它是“忙”的? 如果它是'忙',我们可以购买例如20个电话号码,并在每次需要打电话时可用吗? 不相关,但为什么没有可能购买乌克兰电话号码。 非常感谢您的帮助。

  • 我在调用我的onLeScan时遇到问题。我在开始扫描中放置了一个标签,每次都会被调用。出于某种原因,我的onLeScan永远不会被调用。有人看到我所做的有问题吗?onLeScan应该在开始扫描后立即调用,对吗? 编辑更改了我的onLeScan函数。仍然不起作用,但我认为我正在走向正确的道路。DeviceBeacon是一个只包含方法的类:getName()、getSignal()和getAddres

  • 1、接口声明 如果您希望在自己的CRM系统嵌入呼叫中心能力,需要对接智齿呼叫中心能力,在对接前请您阅读如下对接流程,以便您更好的完成对接。如果只对接基本呼叫能力,预计对接及调试过程1周左右即可完成。 第一步:获取第三方用户接口调用唯一凭证 请联系您的售后经理,获取您企业的如下信息: 1、companyid(企业id) 2、appid(第三方用户接口调用唯一凭证id) 3、app_key(第三方用户

  • 我是RXJava的新手。在一个场景中,我希望调用第一个登录webservice(),如果成功,则希望调用另一个webservice()以获取用户信息。

  • 我在java应用程序中使用gRPC(非阻塞存根),两个函数调用之间的响应时间约为5-8ms。我想减少它。你有什么建议?有可能吗?