当前位置: 首页 > 知识库问答 >
问题:

我们有很多大型机文件都是EBCDIC格式的,在Python中有没有一种方法可以将大型机文件解析或转换为csv文件或文本文件?

柴文林
2023-03-14

我需要从大型机文件中读取记录,并对记录值应用一些过滤器。因此,我正在寻找一个解决方案,以转换大型机文件到csv或文本或Excel工作簿,以便我可以很容易地执行操作的文件。

我还需要验证记录数。

共有1个答案

施德元
2023-03-14

谁说了EBCDIC的事?行动没有。

如果都是文本,那么使用EBCDIC到ASCII转换的FTP是可行的,包括在Python中。

如果没有,则:

  • 提取和转换到CSV需要在z/OS上进行。也许是用COBOL程序。然后,CSV可以用
  • 进行ftp“down

  • 必须对数据进行FTP二进制处理,然后对数据进行解析,并对其中的一些位进行翻译。
 类似资料:
  • 由于多值字段和维度使用报价,csv读取器读取此文件失败。我的函数(上面代码中的函数f)如果那个逗号在属于同一字段的两个数据之间,就用分号代替逗号,如果那个引号是维度的东西,就用'inch'代替。

  • 我需要将文本文件转换为csv并按列组织它。但是,文本文件中的数据是按行排列的,长度为715页。下面是文本文件外观的示例: 这是我的数据的一个例子,但实际上每个人的信息要多得多,而且有成千上万的条目。 基本上,每一行都用“----”分隔。但是,行之间的数据是多行的。例如,下一行是姓名和年龄,下一行是薪水,下一行是薪水,下一行是薪水,下一行是薪水,这意味着新条目的开始。 有没有一种方法可以让我绕过这种

  • 问题内容: 我正在尝试将非常大的json文件转换为csv。我已经能够将这种类型的小文件转换为10条记录(例如)csv文件。但是,当尝试转换大文件(csv文件中的50000行的数量)时,它不起作用。数据是通过curl命令创建的,其中- o指向要创建的json文件。输出的文件中没有换行符。csv文件将使用csv.DictWriter()编写,并且(其中数据是json文件输入)的格式为 然后,我遍历行和

  • 问题内容: 我有一系列使用Beautiful Soup解析为单个文本文件的HTML文件。HTML文件的格式设置为使其输出始终为文本文件中的三行,因此输出将类似于: 但这很容易 换句话说,HTML文件的内容在每个文件中并不是真正的标准,但是它们始终会产生三行。 因此,我想知道如果我想从Beautiful Soup生成的文本文件然后将其解析为带有以下内容的列的CSV文件(使用上面的示例),应该从哪里开

  • 问题内容: 我正在研究可访问API的cron脚本,可接收JSON文件(大量对象)并将其存储在本地。完成后,另一个脚本需要解析下载的JSON文件,并将每个对象插入MySQL数据库。 我目前正在使用和。这将尝试在尝试处理之前将整个文件读入内存。除了我的JSON文件通常在250MB-1GB +之间的事实之外,这将很好。我知道我可以增加我的PHP内存限制,但这在我看来似乎并不是最大的答案。我知道我可以运行

  • 我从Google Bigquery中提取了一个2列1000万行的。csv文件。 我已经在本地下载了一个大小为170MB的.csv文件,然后将文件上传到Google Drive,我想使用pandas.read_csv()函数将其读入我的Jupyter笔记本中的pandas DataFrame。 这是我使用的代码,有我想读的特定文件ID。