问题：

Java：允许重复的排序集合，内存效率高，并提供快速插入更新

袁翰池

2023-03-14

具体来说，我需要一个使用一个字段A进行访问和一个不同的字段（字段S）进行排序的集合，但是一个接受重复的排序集合就足够了。

我经常需要这个集合，而TreeMap不是一个选项，因为它不允许重复。所以现在是时候问这里了。正如在这里和这里的stackoverflow中指出的，有几个变通方法，即：

PriorityQueue：缓慢更新（删除（对象）添加（对象）），基本键装箱
斐波那契堆：内存浪费（？）
TreeMap

有人有更好的建议吗？或者我应该扮演我自己的分类数据结构（哪一个？）？另外，其他源代码（Java、开源、单元测试和小型DEP）也不错。

使现代化

目前关于我的用例的更多细节（尽管我上次也有类似的需求）。我有一个收藏（数以百万计）的参考资料，我希望能够

轮询或获取关于字段S的最小元素

 并借助字段A更新字段S
 字段S的相同值可能发生。字段A实际上是指向另一个数组的整数
 我想要的唯一依赖是trove4j。如果需要的话，我可以使用不同的像驯象师的收藏品。但不是番石榴，因为尽管是一个不错的库，但这些集合并没有被调整为内存效率（装箱/取消装箱）。

因此，所有人都要求使用斐波那契堆，但我担心每个元素的开销太大-

共有3个答案

东方高洁

2023-03-14

我决定推出自己的解决方案，但不是最佳解决方案，只是一个树映射变体。如果我能微调这个关于内存的集合，我会保持更新。速度已经比之前的PriorityQueue尝试好得多，因为我需要收集。删除（对象）方法（用于更新条目）：

package com.graphhopper.coll;

import gnu.trove.iterator.TIntIterator;
import gnu.trove.set.hash.TIntHashSet;
import java.util.Map.Entry;
import java.util.TreeMap;

/**
 * A priority queue implemented by a treemap to allow fast key update. Or should we use a standard
 * b-tree?
 */
public class MySortedCollection {

    private int size;
    private int slidingMeanValue = 20;
    private TreeMap<Integer, TIntHashSet> map;

    public MySortedCollection(int size) {
        map = new TreeMap<Integer, TIntHashSet>();
    }

    void remove(int key, int value) {
        TIntHashSet set = map.get(value);
        if (set == null || !set.remove(key))
            throw new IllegalStateException("cannot remove key " + key + " with value " + value
                    + " - did you insert " + key + "," + value + " before?");
        size--;
        if (set.isEmpty())
            map.remove(value);
    }

    public void update(int key, int oldValue, int value) {
        remove(key, oldValue);
        insert(key, value);
    }

    public void insert(int key, int value) {
        TIntHashSet set = map.get(value);
        if (set == null)
            map.put(value, set = new TIntHashSet(slidingMeanValue));
//        else
//            slidingMeanValue = Math.max(5, (slidingMeanValue + set.size()) / 2);
        if (!set.add(key))
            throw new IllegalStateException("use update if you want to update " + key);
        size++;
    }

    public int peekValue() {
        if (size == 0)
            throw new IllegalStateException("collection is already empty!?");
        Entry<Integer, TIntHashSet> e = map.firstEntry();
        if (e.getValue().isEmpty())
            throw new IllegalStateException("internal set is already empty!?");
        return map.firstEntry().getKey();
    }

    public int peekKey() {
        if (size == 0)
            throw new IllegalStateException("collection is already empty!?");
        TIntHashSet set = map.firstEntry().getValue();
        if (set.isEmpty())
            throw new IllegalStateException("internal set is already empty!?");
        return set.iterator().next();
    }

    public int pollKey() {
        size--;
        if (size < 0)
            throw new IllegalStateException("collection is already empty!?");
        Entry<Integer, TIntHashSet> e = map.firstEntry();
        TIntHashSet set = e.getValue();
        TIntIterator iter = set.iterator();
        if (set.isEmpty())
            throw new IllegalStateException("internal set is already empty!?");
        int val = iter.next();
        iter.remove();
        if (set.isEmpty())
            map.remove(e.getKey());
        return val;
    }

    public int size() {
        return size;
    }

    public boolean isEmpty() {
        return size == 0;
    }

    public int getSlidingMeanValue() {
        return slidingMeanValue;
    }

    @Override
    public String toString() {
        return "size " + size + " min=(" + peekKey() + "=>" + peekValue() + ")";
    }
}

陶星辰

2023-03-14

番石榴呢？你想要的是：一个接受重复项的分类集合。但我对它的性能一无所知。

白嘉石

2023-03-14

当你需要分类收集时，你应该仔细分析你的需求
如果大多数操作都是插入操作，只有少数操作要搜索，那么使用排序的集合，即在集合中不断对元素进行排序，将不是一个好的选择（因为在插入操作中保持元素排序的开销是最常见的操作）
在这种情况下，最好保留未排序的集合，并仅在需要时进行排序。即在搜查之前。您甚至可以使用一个简单的列表，并在需要时对其进行排序（使用集合。排序即合并排序）。但我谨慎地建议这样做，因为为了提高效率，我们假设您处理的是大数据。在非常小的数据中，即使是线性搜索也足够好。

如果大多数操作都在搜索，那么你可以使用一个排序的集合，从我的角度来看，有数据结构可供选择（你已经提到了一些），你可以进行基准测试，看看哪个适合你的需要。

类似资料：

Java：允许重复的排序列表/集合

我有一个程序有很多数据对象。每种方法都实现了可比性，并设置为从最高到最低（基于简单的长值）排序，包括重复的值。我希望这些对象存储在一个集合/列表中，这样我就可以遍历它，并在其各自的位置取出每个对象。我已经研究过使用树集，但是这不允许重复，因此只保留具有相同值的多个对象中的一个。然后我找到了TreeMultiset，它可以保持元素具有相同的值。唯一的问题是，它只是存储同一对象的副本，而不是多个相等
优化的合并排序比快速排序更快

问题内容： [http://jsperf.com/optimized-mergesort-versus- quicksort][1] 为什么这个半缓冲区合并排序的工作速度与quicksort一样快？ QuickSort是：就地虽然会占用递归（堆栈空间）缓存友好这一半缓冲区合并排序：使用Buffer进行合并。使用递归。进行较少的比较。我的问题是，在这种情况下，为什么半缓冲区合并排序与Q
哪个java集合允许重复键

null
Java 多线程快速排序或合并排序

问题内容：如何为Java实现并发的quicksort或mergesort算法？我们在16（虚拟）核的Mac上遇到问题，其中只有一个核（！）使用默认的Java排序算法工作，而且很好的机器没有得到充分利用是不好的。因此，我们编写了自己的代码（我编写了代码），并且确实取得了不错的提速（我编写了多线程快速排序，由于其分区特性，它可以很好地并行化，但我也可以编写合并排序）……但是我的实现只能扩展最多4个
Java-高效的集合管理[重复]

假设我有理由要求通过多个值类型快速查找类实例，为了便于解释，我将以游戏服务器为例。假设服务器使用静态标识号处理用户。这个数字用于与特定玩家交流和互动（即：私聊、交易请求、战斗、公会邀请等）。这需要经常使用玩家的识别号来查找玩家，根据我目前的经验，最好的方法是：（如果我错了，请纠正我。）然而，在处理网络时，很多时候我还需要将播放器与网络会话关联，或者一些人可能更熟悉的“套接字”。看起来是这样的
快速排序效率：扫描方向重要吗？

下面是我对一个就地快速排序算法的实现，这是从这段视频改编的：似乎有几种扫描步骤的实现，其中数组（或数组的当前部分）被分成3个段：低于枢轴的元素、枢轴和大于枢轴的元素。我从左边扫描大于或等于枢轴的元素，从右边扫描小于或等于枢轴的元素。一旦找到每一个，就进行交换，循环继续，直到左标记等于或大于右标记。然而，在此图之后还有另一种方法，在许多情况下会导致更少的分区步骤。有人能验证一下对于quicksor

Java：允许重复的排序集合，内存效率高，并提供快速插入更新

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档