当前位置：首页 > 专题 >

《hash》专题

为什么spark流示例中的StatefulNetworkWordCount需要HashPartioner？
我的问题是关于StatefulNetworkWordCount的例子: https://github.com/apache/spark/blob/master/examples/src/main/scala/org/apache/spark/examples/streaming/StatefulNetworkWordCount.scala Q1）stateDstream RDD由驱动程序或工作节点
词频-HashMap或TreeMap
我需要使一个程序，计数频率的每一个字在一个文本，另外，我需要能够返回一个列表的n个最经常的字（如果更多的字有相同的频率，他们排序的字母顺序）。还有一个单词列表是不被计算的（停止单词）。停用词用什么结构我认为HashSet是最有效的 HashMap添加单词的效率更高，但需要排序，TreeMap插入单词需要logn时间，但单词可以按频率排序总体而言，什么方法更有效？附言。@主持人我知道有一个类
在同一文件中保存/加载两个HashMap
我很想知道如何保存和加载两个HashMaps，我一直在尝试使用自己的方法，但我什么都想不通，因为一个正在覆盖另一个！这是我的主要.class 这是我的潜艇.class 正如我在一开始提到的，地图会互相覆盖，我不知道如何解决这个问题！
多线程环境中调整大小时的Hashmap
我正在学习一个教程，它基本上解释了在多线程环境中调整Hashmap大小时出现争用条件的原因：在Java中，如果两个线程同时发现现在HashMap需要调整大小，那么它们都尝试调整大小。Java HashMap在调整HashMap大小的过程中，链表中存储的bucket中的元素在迁移到新bucket时被颠倒，因为Java HashMap不在尾部追加新元素，而是在头部追加新元素，以避免尾部遍历。如果竞争
为什么hashmap的值没有用getOrDefault方法更新？
为什么我需要再次使用hmap.put方法？我的理解是这样的。假设没有现有的键值对。所以，用如果我在同一个实例中添加一个字符串，那么hashmap也应该自动更新，对吗？键=>列表对象。如果我添加到列表对象，那么对象引用不应该改变，对吗？为什么我需要再次使用put方法并这样做？
我应该在两个不同的RDD上重用HashPartitioner吗？
在所有示例中，我总是看到分区通过接收Hash分区器的新实例我加入了两个RDD。它们的键列具有来自同一集合的值。为了更有效地连接，我应该对两者进行分区吗？如果是，我应该创建一个HashPartitioner实例hp吗并传递hp到两个分区方法，以便有要连接的行落到同一个节点？这是分区的工作方式吗？
获取非重写的equals方法以使用hashCode
这是来自与hashCode一起使用的旧版本代码并等于，但我正在尝试让新版本使用它。我认为原因是因为在旧版本中我覆盖了 equals 和 hashCode，但在新版本中我似乎无法做到这一点，因为我不再比较对象，而是比较数组（这是猜测）。因此，当前版本不会拾取重复项。它说没有重复项，但这是不正确的。以下是检测重复项的旧版本的哈希代码和等于。这是当前版本。在搜索方法中是确定重复项的地方。这是旧的代
使用多个字段作为相等比较将对象添加到集合中，以覆盖现有的equals和hashCode方法
我有一个POJO类，它已经定义了equals和hashcode，并用于许多保存到DB的遗留对象，因此不能改变该对象的工作方式。她是一个简化的代码：因此，我想基于雇员、startDate和contractCost将福利合同添加到中，以便消除基于这些字段的同一雇员的重复合同。如果我不能重新定义equals和hashcode，那该怎么做呢？
HashSet如何不允许重复？
我正在检查< code>HashSet的< code>add方法。有人提到如果该集合已经包含元素，则调用保持集合不变，并返回false。但是方法在内部保存中的值的方法声明将指定值与该映射中的指定键相关联。如果映射先前包含该键的映射，则旧值将被替换。那么，如果的方法替换了旧值，那么方法如何在元素重复的情况下保持集合不变？
在for循环中添加到HashSet时，如何删除重复项，但也将它们替换为另一个对象？
问题我正在构建一个应用程序，它可以从一系列条目中创建抽奖抽奖。开始抽奖时，用户可以输入一个整数，该整数表示抽奖将返回多少中奖者。应用程序使用randomGenerator从条目arrayList中选择一个随机索引。这个randomGenerator位于for循环中，该循环检查它被迭代了多少次，并将其与numberOfWinners整数进行比较。假设用户插入了“3”作为他们的数字的整数。该应用程
如何在ProtoBuf中高效地建模HashMap/Dictionary
我有一个由.NET代码序列化的protobuf文件，我想把它用到Java中。在.NET代码中，有字典数据类型，并且proto模式类似于正如协议缓冲区中的stackoverflow post字典中所述。我可以使用protoc将原始文件编译成Java类罚款。我可以成功地将protobuf文件反序列化为Java对象。唯一的问题是，它在Java中转换为一个配对对象列表，而不是HashMap。当然，我仍
在TreeMap、HashMap或LinkedHashMap中使用重复键存储值
我目前正在做一个项目，在这个项目中，我从社会保障网站检索关于姓名的数据。基本上，我得到一个数字x，年份y和z。我必须返回从y到z的每一年的前x名。所以从网站返回的数据是一个名字、一个等级和一个年份。我必须将返回的每个名称输入到TreeMap、HashMap或LinkedHashMap中，但我不确定如何存储它们，因为无论我使用什么作为密钥，都可能存在重复。年份不可能是关键，因为我每年都会有前x名，
HashMap中的全映射锁以外的每键锁
我在Java有一个很大map=concurrenthashMap()，而Key、Value是某种对象结构。假设这个映射的键集是keyset。现在我下面有一个计算程序。我的问题是我如何能够获得一个更好的性能通过不使用全地图锁。是否有任何选择，如使用每键锁或使用其他类型的数据结构？考虑到这是一个很大的映射，使用every-key锁可能不是一种可接受的方法。
单元测试问题中的静态Java HashMap并发
我有一个类（我们称之为XClass)，它有一个我正在测试的方法（我们称之为xMethod）。它还包含一个：在我的单元测试设置方法中，我有：在测试方法中，我创建了几个（在我的例子中是8个）线程。它们的run方法调用XClass.XMethod。此方法更改静态映射变量。方法xMethod应该调用Map.ContainsKey（）Map.Get（）和Map.Put（）8次。它不执行任何删除操作。这个
如何在Spark中加入之前正确应用HashPartitioner？
为了减少两个rdd连接时的混乱，我决定首先使用HashPartitioner对它们进行分区。我是这样做的。我这样做对吗，或者有更好的方法吗？

首页

60

61

62

63

64

65

66

67

68

尾页

最新发布

字节 data 大数据二面货拉拉大数据开发(实习)一面经寄字节大数据开发三面面经团子数据开发oc了秋招拼多多数据分析一面（9.26）

推荐文章

java学习路线算法是什么架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

wsl2 mysql error: 98 (地址已在使用)?javascript - Java+Selenium如何实现将HTML页面转换成图片?uniapp textarea组件自动失焦？显示器是32:9的，linux什么软件可以快捷键控制窗口16:9且水平居中？如何在 Git 不同分支中对通常在gitignore中的 .vscode 进行版本管理？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Docutils M2BOX CMS WP-reCAPTCHA mysql_websocket_chat mAdserve LuaViewSDK web-framework-for-java Allure

文档资料

Angular 4 中文教程 Java Servlet 3.1 规范 html2canvas 中文文档 Microsoft Office 对象参考 Node.js 中文电子书