当前位置: 首页 > 编程笔记 >

python利用pandas将excel文件转换为txt文件的方法

许淳
2023-03-14
本文向大家介绍python利用pandas将excel文件转换为txt文件的方法,包括了python利用pandas将excel文件转换为txt文件的方法的使用技巧和注意事项,需要的朋友参考一下

python将数据换为txt的方法有很多,可以用xlrd库实现。本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件。

直接上代码:

'''
function:将excel文件转换为text
author:Nstock
date:2018/3/1
'''
import pandas as pd
import re
import codecs
 
#将excel转化为txt文件
def exceltotxt(excel_dir, txt_dir): 
 with codecs.open(txt_dir, 'w', 'utf-8') as f:
 neg=pd.read_excel(excel_dir, header=None, index=None)
 f.write(neg.to_string())
 
#去除记录行首的数字和空格
def del_linehead_number_speace(orig_txt_dir,saveas_txt_dir):
 with open(orig_txt_dir,'r+') as f, open(saveas_txt_dir,'r+') as fw:
 lines = f.readlines()
 print(len(lines)) #行数
 texts = [re.sub(r'(\d)+(\s)+','',lines[num]) for num in range(len(lines)) ]
 
 texts = list(set(texts)) #去重如果要保留重复记录注释该行
 
 line_num = len(texts)
#  for num in range(line_num):   #查看转化后的文本
#  print(texts[num])
 fw.writelines(texts)
 
exceltotxt('./data/neg.xls', './data/neg_temp.txt') 
del_linehead_number_speace('./data/neg_temp.txt','./data/neg.txt')

说明:xxx_dir带目标文件名为:xxx_dir='保存路径/'+'文件名'

以上这篇python利用pandas将excel文件转换为txt文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持小牛知识库。

 类似资料:
  • 本文向大家介绍使用matlab或python将txt文件转为excel表格,包括了使用matlab或python将txt文件转为excel表格的使用技巧和注意事项,需要的朋友参考一下 假设txt文件为: 一、matlab代码 二、python代码 利用pandas的DataFrame输出为Excel【但是输出会有索引】 结果为: 使用xlrd、xlwt来操作excel windows下载: 结果:

  • 在这里你可以看到我正在处理的一些文件。 与我最相似的问题是这个问题(将一个文本文件文件夹合并到一个CSV中,每个内容都在一个单元格中),但我无法实现那里提出的任何解决方案。 我尝试的最后一个是Nathaniel Verhaaren在前面提到的问题中提出的Python代码,但我得到了与问题作者完全相同的错误(即使在实施了一些建议之后): 与我类似的其他问题(例如,Python:将多个。txt文件解析

  • 本文向大家介绍python使用pandas处理excel文件转为csv文件的方法示例,包括了python使用pandas处理excel文件转为csv文件的方法示例的使用技巧和注意事项,需要的朋友参考一下 由于客户提供的是excel文件,在使用时期望使用csv文件格式,且对某些字段内容需要做一些处理,如从某个字段中固定的几位抽取出来,独立作为一个字段等,下面记录下使用acaconda处理的过程; (

  • 问题内容: 所以我想将一个简单的制表符分隔的文本文件转换为一个csv文件。如果我使用string.split(’\ n’)将txt文件转换为字符串,则会得到一个列表,其中每个列表项都是字符串,每列之间带有’\ t’。我当时以为我可以用逗号替换’\ t’,但它不会像清单中的字符串一样对待字符串,并允许我使用string.replace。这是我的代码的开始,仍然需要解析选项卡“ \ t”的方法。 问题

  • 找不到很多这个确切用例的例子。基本上,我有两个目录,其中应该包含相同的文件,混合了。xlsx文件和。txt文件。我编写了一系列代码来比较。xlsx文件很好,还可以返回它发现的任何不匹配(行、列)的坐标。 我的代码似乎有一个问题做同样的文本文件,我可以通过excel手动打开这个罚款,这是一个标签分隔的文本文件。 当我尝试将其转换为XSSFWorkbook时,它不喜欢,其中文件excelFile1是我

  • 问题内容: 为了有效地利用Hadoop中的 map- reduce作业,我需要将数据以hadoop的序列文件格式存储。但是,当前数据仅是平面.txt格式。有人可以建议我将.txt文件转换为序列文件的方法吗? 问题答案: 因此,最简单的答案就是只有一个具有SequenceFile输出的“身份”工作。 在Java中看起来像这样: