当前位置: 首页 > 面试题库 >

获取不在file2中的file1行

章威
2023-03-14
问题内容

我有两个很长但已排序的文件。如何获取第一文件中所有不在第二文件中的行?

文件1

0000_aaa_b
0001_bccc_b
0002_bcc <------ file2 have not that line
0003_aaa_d
0006_xxx
...

文件2

0000_aaa_b
0001_bccc_b
0003_aaa_d
0006_xxx
...

问题答案:

这是comm命令的用途:

$ comm -3 file1 file2
0002_bcc

来自man comm

DESCRIPTION

   Compare sorted files FILE1 and FILE2 line by line.

   With  no  options,  produce  three-column  output.  Column one contains
   lines unique to FILE1, column two contains lines unique to  FILE2,  and
   column three contains lines common to both files.

   -1     suppress column 1 (lines unique to FILE1)

   -2     suppress column 2 (lines unique to FILE2)

   -3     suppress column 3 (lines that appear in both files)


 类似资料:
  • 我目前重构我的测试从AsserJ到hamcrest库。但有一个断言,我不能迁移到汉克雷斯特。 tmp1和tmp2在文件系统中包含两个路径。我需要验证tmp1或tmp2是否存在,但不是两者都存在。目前的断言是 什么是等效hamcrest测试?

  • 我有一个文件1.txt,它包含: 第1行 第2行 第3行 第4行 第1行 第4行 我尝试使用这个命令,但它只有在文件2.txt中有一行时才起作用: 注意:我不想比较2个文件看它们是否相同。 你知道吗?我对PowerShell很陌生。

  • 在Lambda中使用Python 3.7,如何从sample.py导入函数run()lambda_function.py 这是我的代码:File1-lambda_函数。py: 文件2-示例。py: 错误:{"错误消息":"无法导入模块'示例':没有名为'sample.py'的模块;'示例'不是一个包","错误类型":"运行时。####################################

  • 给定两个文件会产生一个算法/程序来查找文件1中的单词,而不是文件2中的单词。请注意,文件中的单词不是按顺序排列的。 这是我的思考过程: 步骤1:读取文件2的单词并将其添加到哈希集 如果两个文件中的字数都只有100或1000个,那么这个算法就可以正常工作 但是,如果两个文件都很大(数十亿字),那么此解决方案将无法工作,因此我提出了一个改进的解决方案: 步骤1:逐字阅读文件2,并按字母顺序对单词进行排

  • 我正在使用go-redis/redis和go-redis/cache来缓存Go对象。 其中obj是一个具有go映射(键值对)的结构,通过使用上面的代码,我正在设置一个键并将值保存到其中。这是package Common。现在我想在不同的包中访问它,比如GetRedis_pkg,而不导入pkg。我有什么办法可以做到。并且我可以通过任何方式访问该结构内部的特定映射吗?使用redis key imort

  • 问题内容: 我有两个pandas数据框,它们有一些共同点。 假设是的子集。 如何获取dataframe1中不在dataframe2中的行? 问题答案: 一种方法是存储两个df的内部合并结果,然后我们可以简单地在一行的值不在此通用值中时选择行: 编辑 你发现的另一种方法是使用isin它将产生NaN可删除的行: 但是,如果df2不能以相同的方式开始行,那么它将行不通: 将产生整个df: