当前位置: 首页 > 面试题库 >

在Linux中将制表符分隔的文件转换为CSV的最快方法

相威
2023-03-14
问题内容

我有一个制表符分隔的文件,其中包含超过2亿行。在Linux中将其转换为CSV文件的最快方法是什么?该文件的确包含多行标题信息,我需要将其删除,但是标题行数是已知的。我已经看到了有关sed和的建议gawk,但是我想知道是否存在“首选”选择。

为了澄清起见,此文件中没有嵌入的选项卡。


问题答案:

如果您需要做的就是 所有制表符 转换 为逗号,tr则可能是这样。

此处的空白是文字标签:

$ echo "hello   world" | tr "\\t" ","
hello,world

当然,如果您在文件的字符串文字中嵌入了制表符,那么这也会错误地转换它们。但是嵌入的文字标签很少见。



 类似资料:
  • 问题内容: 所以我想将一个简单的制表符分隔的文本文件转换为一个csv文件。如果我使用string.split(’\ n’)将txt文件转换为字符串,则会得到一个列表,其中每个列表项都是字符串,每列之间带有’\ t’。我当时以为我可以用逗号替换’\ t’,但它不会像清单中的字符串一样对待字符串,并允许我使用string.replace。这是我的代码的开始,仍然需要解析选项卡“ \ t”的方法。 问题

  • 问题内容: 我是python的新手,我正在尝试使用下面显示的代码来执行上面的标题所说的。它一直运行到我要求保存xls输出的位置。任何帮助将不胜感激。 [编辑]此代码有效。 问题答案: 我相信,您需要为输出电子表格设置编码。您需要知道该文件正在使用什么编码。csv模块不直接支持unicode,但它仅适用于大多数西方语言。 在不知道文本文件的编码是什么的情况下,您有两个选择。选项1是根据python使

  • 问题内容: 我有&想要将其转换为逗号分隔的字符串。我的方法如下所示,但也需要其他意见。 问题答案: 从Apache Commons库: 用: 另一个类似的问题和答案在这里

  • 我想把这个字典变成这样的制表符分隔文件: 我应该如何做到这一点。谢啦

  • 我有一个逗号分隔的CSV文件(),其中逗号通过在引号中环绕数据来转义()。 我想通过使用记事本查找任何未包含在双引号()中的逗号,并将其替换为管道,将我的CSV转换为管道分隔文件()。 我的第一种方法是使用正则表达式匹配任何不带引号的逗号。但是,在记事本中搜索会同时替换未加引号的逗号和任何包含逗号的带引号的字符串。 如何使用记事本将逗号分隔的CSV文件()转换为管道分隔的文件()?

  • 问题内容: 使用PHP,将这样的字符串转换为整数的最快方法是什么? 为什么该特定方法最快?如果它收到意外的输入(例如或数组)会怎样? 问题答案: 我刚刚进行了快速基准测试: 平均而言,调用intval()的速度要慢两倍半,并且如果您的输入已经是整数,则相差最大。 我想知道 为什么 。 更新:我再次使用强制性进行测试 附录: 我刚刚遇到了一种意想不到的行为,选择以下一种方法时应注意: 使用PHP 5