Java8的groupingBy实现集合的分组,类似Mysql的group by分组功能,注意得到的是一个map
对集合按照单个属性分组、分组计数、排序
List<String> items = Arrays.asList("apple", "apple", "banana", "apple", "orange", "banana", "papaya"); // 分组 Map<String, List<String>> result1 = items.stream().collect( Collectors.groupingBy( Function.identity() ) ); //{papaya=[papaya], orange=[orange], banana=[banana, banana], apple=[apple, apple, apple]} System.out.println(result1); // 分组计数 Map<String, Long> result2 = items.stream().collect( Collectors.groupingBy( Function.identity(), Collectors.counting() ) ); // {papaya=1, orange=1, banana=2, apple=3} System.out.println(result2); Map<String, Long> finalMap = new LinkedHashMap<>(); //分组, 计数和排序 result2.entrySet().stream() .sorted(Map.Entry.<String, Long>comparingByValue().reversed()) .forEachOrdered(e -> finalMap.put(e.getKey(), e.getValue())); // {apple=3, banana=2, papaya=1, orange=1} System.out.println(finalMap);
集合按照多个属性分组
1.多个属性拼接出一个组合属性
public static void main(String[] args) { User user1 = new User("zhangsan", "beijing", 10); User user2 = new User("zhangsan", "beijing", 20); User user3 = new User("lisi", "shanghai", 30); List<User> list = new ArrayList<User>(); list.add(user1); list.add(user2); list.add(user3); Map<String, List<User>> collect = list.stream().collect(Collectors.groupingBy(e -> fetchGroupKey(e))); //{zhangsan#beijing=[User{age=10, name='zhangsan', address='beijing'}, User{age=20, name='zhangsan', address='beijing'}], // lisi#shanghai=[User{age=30, name='lisi', address='shanghai'}]} System.out.println(collect); } private static String fetchGroupKey(User user){ return user.getName() +"#"+ user.getAddress(); }
2.嵌套调用groupBy
User user1 = new User("zhangsan", "beijing", 10); User user2 = new User("zhangsan", "beijing", 20); User user3 = new User("lisi", "shanghai", 30); List<User> list = new ArrayList<User>(); list.add(user1); list.add(user2); list.add(user3); Map<String, Map<String, List<User>>> collect = list.stream().collect( Collectors.groupingBy( User::getAddress, Collectors.groupingBy(User::getName) ) ); System.out.println(collect);
3. 使用Arrays.asList
我有一个与Web访问记录相关的域对象列表。这些域对象可以扩展到数千个。
我没有资源或需求将它们以原始格式存储在数据库中,因此我希望预先计算聚合并将聚合的数据放在数据库中。
我需要聚合在5分钟窗口中传输的总字节数,如下面的sql查询
select round(request_timestamp, '5') as window, --round timestamp to the nearest 5 minute cdn, isp, http_result_code, transaction_time, sum(bytes_transferred) from web_records group by round(request_timestamp, '5'), cdn, isp, http_result_code, transaction_time
在java 8中,我当前的第一次尝试是这样的,我知道这个解决方案类似于Group by multiple field names in java 8
Map<Date, Map<String, Map<String, Map<String, Map<String, Integer>>>>>>> aggregatedData = webRecords .stream() .collect(Collectors.groupingBy(WebRecord::getFiveMinuteWindow, Collectors.groupingBy(WebRecord::getCdn, Collectors.groupingBy(WebRecord::getIsp, Collectors.groupingBy(WebRecord::getResultCode, Collectors.groupingBy(WebRecord::getTxnTime, Collectors.reducing(0, WebRecord::getReqBytes(), Integer::sum)))))));
这是可行的,但它是丑陋的,所有这些嵌套的地图是一个噩梦!要将地图“展平”或“展开”成行,我必须这样做
for (Date window : aggregatedData.keySet()) { for (String cdn : aggregatedData.get(window).keySet()) { for (String isp : aggregatedData.get(window).get(cdn).keySet()) { for (String resultCode : aggregatedData.get(window).get(cdn).get(isp).keySet()) { for (String txnTime : aggregatedData.get(window).get(cdn).get(isp).get(resultCode).keySet()) { Integer bytesTransferred = aggregatedData.get(window).get(cdn).get(distId).get(isp).get(resultCode).get(txnTime); AggregatedRow row = new AggregatedRow(window, cdn, distId...
如你所见,这是相当混乱和难以维持。
有谁知道更好的方法吗?任何帮助都将不胜感激。
我想知道是否有更好的方法来展开嵌套的映射,或者是否有一个库允许您对集合进行分组。
最佳答案
您应该为地图创建自定义密钥。最简单的方法是使用Arrays.asList:
Function<WebRecord, List<Object>> keyExtractor = wr -> Arrays.<Object>asList(wr.getFiveMinuteWindow(), wr.getCdn(), wr.getIsp(), wr.getResultCode(), wr.getTxnTime()); Map<List<Object>, Integer> aggregatedData = webRecords.stream().collect( Collectors.groupingBy(keyExtractor, Collectors.summingInt(WebRecord::getReqBytes)));
在这种情况下,键是按固定顺序列出的5个元素。不是很面向对象,但很简单。或者,您可以定义自己的表示自定义键的类型,并创建适当的hashCode/equals实现。
补充知识:java8 新特性 Stream流 分组 排序 过滤 多条件去重 (最小、最大、平均、求和)
什么是 Stream?
Stream 是用函数式编程方式在集合类上进行复杂操作的工具,其集成了Java 8中的众多新特性之一的聚合操作,开发者可以更容易地使用Lambda表达式,并且更方便地实现对集合的查找、遍历、过滤以及常见计算等。话不多说,直接上代码。
List<User> list = new ArrayList<User>(); list = Arrays.asList( new User("小强", 11, "男"), new User("小玲", 15, "女"), new User("小虎", 23, "男"), new User("小雨", 26, "女"), new User("小飞", 19, "男"), new User("小玲", 15, "女") ); //分组 Map<String, List<User>> listMap = list.stream().collect(Collectors.groupingBy(User::getSex)); for(String key:listMap.keySet()){ System.out.print(key+"组:"); listMap.get(key).forEach(user -> System.out.print(user.getName())); System.out.println(); } //排序 list.stream().sorted(Comparator.comparing(user-> user.getAge())) .forEach(user -> System.out.println(user.getName())); //过滤 list.stream().filter(user -> user.getSex().equals("男")).collect(Collectors.toList()) .forEach(user -> System.out.println(user.getName())); //多条件去重 list.stream().collect(Collectors.collectingAndThen( Collectors.toCollection(() -> new TreeSet<>( Comparator.comparing(user -> user.getAge() + ";" + user.getName()))), ArrayList::new)) .forEach(user -> System.out.println(user.getName())); //最小值 Integer min = list.stream().mapToInt(User::getAge).min().getAsInt(); //最大值 Integer max = list.stream().mapToInt(User::getAge).max().getAsInt(); //平均值 Double average = list.stream().mapToInt(User::getAge).average().getAsDouble(); //和 Integer sum = list.stream().mapToInt(User::getAge).sum(); System.out.println("最小值:"+min+", 最大值"+max+", 平均值:"+average+", 和:"+sum); //分组求和 Map<String, IntSummaryStatistics> collect = list.stream().collect(Collectors.groupingBy(User::getSex, Collectors.summarizingInt(User::getAge))); IntSummaryStatistics statistics1 = collect.get("男"); IntSummaryStatistics statistics2 = collect.get("女"); System.out.println(statistics1.getSum()); System.out.println(statistics1.getAverage()); System.out.println(statistics1.getMax()); System.out.println(statistics1.getMin()); System.out.println(statistics1.getCount()); System.out.println(statistics2.getSum()); System.out.println(statistics2.getAverage()); System.out.println(statistics2.getMax()); System.out.println(statistics2.getMin()); System.out.println(statistics2.getCount()); //提取list中两个属性值,转为map Map<String, String> userMap = list.stream().collect(Collectors.toMap(User::getName, User::getSex)); System.out.println(JsonUtil.toJson(userMap)) //取出所有名字 List<String> names = list.stream().map(User::getName).collect(Collectors.toList()); System.out.println(JsonUtil.toJson(names))
以上这篇Java8 stream 中利用 groupingBy 进行多字段分组求和案例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持小牛知识库。
我有课 给出一个Person类列表,我根据该类的不同属性进行聚合。对于(如)- 现在我需要得到一个结果,这样我就应该根据国家和城市的组合得到总的“totalcountrytoCityCount”,并且根据国家、城市和宠物的组合得到总的“petCount”。我可以使用groupingBy和summingint分别获得它们 它给出了结果 但我想要的实际结果是:- 令人惊讶地删除了计数
我可以同时使用和吗?
我有一张清单,傻瓜 我想按类别分组,然后合计金额和价格。 现在我只需要用一个保存汇总的金额和价格的Foo对象替换String键。这就是我被困住的地方。我好像找不到办法。
我尝试做的一个简单示例: 假设我有一个字符串列表,如果包含或不包含特定的子字符串,则需要根据条件将其分为4组。如果字符串包含Foo,则它应位于组Foo中;如果字符串包含Bar,则它应位于组Bar中;如果字符串同时包含Bar,则它应出现在两个组中。 由于字符串被分组到第一个匹配组中,因此上述输入的简单方法无法按预期工作: 结果1是 其中,预期结果应为 在搜索了一段时间后,我找到了另一种方法,接近我想
我已经创建了一个bean类,其中包含所有字段(name、amount、description和number),以及相同的getter和setter。productBeans有所有产品的列表。 groupByProduct具有用名称分组的产品列表。结果给出了以产品地图为关键,以产品总量为价值的产品地图。 但在这里,我试图将产品和总金额映射到产品列表中。我试图结合上面的代码来获得预期的输出,但未能实现
本文向大家介绍Java8进行多个字段分组统计的实例代码,包括了Java8进行多个字段分组统计的实例代码的使用技巧和注意事项,需要的朋友参考一下 Java8进行多个字段分组统计实现代码如下: 实例补充: 1.本实例其实可以用一句简单的sql去实现 由于我们项目数据库中时间存的是13位的时间戳 所以必须得转行成日期格式 才能进行分组 如下: 以上的就能实现多字段求和统计等功能 但我们老大考虑到查询速度