当前位置: 首页 > 面试题库 >

有一个1G大小的文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M,返回频数最高的100个词?

皮嘉德
2023-03-14
本文向大家介绍有一个1G大小的文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M,返回频数最高的100个词?相关面试题,主要包含被问及有一个1G大小的文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M,返回频数最高的100个词?时的应答技巧和注意事项,需要的朋友参考一下

利用hash映射,将数据映射到小文件中,取1000为例,然后在各个小文件中进行hashmap统计各个串的出现频数,对应进行快排序或者堆排序,找出每个文件中最大频数的,最后将每个文件中最多的取出再进行快排,得到总的出现最多的字符

 类似资料:
  • 我想知道Json响应体的字节大小是否会在改版时引起问题。 现在,我遇到了一个使用默认的OkHttp客户端的修改的回调的随机问题,在Http拦截器日志中,所有的事情都显示为OKK,但在代码中,它将调用视为失败并抛出一条简单的消息 java.net.SocketTimeoutException:超时详细信息消息:timeout 或 插座关闭。java.net.SocketException 不多不少。

  • 本文向大家介绍Number()的存储空间是多大?假如接口返回一个超过最大字节的数字怎么办?相关面试题,主要包含被问及Number()的存储空间是多大?假如接口返回一个超过最大字节的数字怎么办?时的应答技巧和注意事项,需要的朋友参考一下 Number类型的最大值为2的53次方,即9007199254740992,如果超过这个值,比如900719925474099222,那么得到的值会不精确,也就是9

  • 问题内容: 我正在使用MySQL存储视频游戏数据。我有用于标题,平台,标签,徽章,评论,开发人员,出版商等的表… 当某人正在观看游戏时,最好有一个查询来返回与游戏相关的所有数据,还是最好使用多个查询?直观地,由于我们具有评论,将它们包括在同一查询中似乎毫无意义,因为它们需要分页。但是在其他情况下,我不确定是否要分解查询或使用两个查询… 我有点担心性能,因为我现在加入游戏下表:开发人员,发行者,元标

  • 问题内容: 我正在使用Drupal,我注意到如果聚合了我的CSS文件,那么CSS不一定会正常工作。我知道IE7中存在问题,但IE9中的CSS文件大小是否有限制? 问题答案: 有3个限制: 一个工作表最多可以包含4095个选择器,请参阅 http://demos.telerik.com/testcases/4095issues.html 一张纸最多可以导入31张纸,请参见http://demos.t

  • 问题内容: 我正在使用JVM标志运行Java进程,并看到以下输出: 有没有办法解决这个问题? 问题答案: 当无法满足Java堆的分配或永久生成时,命令行选项告诉HotSpot VM生成堆转储。使用此选项运行不会产生任何开销,因此对于OutOfMemoryError需要很长时间才能浮出水面的生产系统很有用。 为了解决您面临的特定问题,可以使用以下纠正措施之一: 措施1: XX:HeapDumpSeg

  • 问题内容: 我试图找出word文档中是否存在字体为2的任何内容。但是,我无法做到这一点。首先,我尝试读取只有一行和7个单词的示例单词文档中每个单词的字体。我没有得到正确的结果。 这是我的代码: 但是,以上代码始终使字体大小加倍。也就是说,如果文档中的实际字体大小是12,则输出24;如果实际字体是8,则输出16。 这是从Word文档读取字体大小的正确方法吗? 问题答案: 是的,那是正确的方法;测量单