当前位置: 首页 > 编程笔记 >

JAVA mongodb 聚合几种查询方式详解

华温书
2023-03-14
本文向大家介绍JAVA mongodb 聚合几种查询方式详解,包括了JAVA mongodb 聚合几种查询方式详解的使用技巧和注意事项,需要的朋友参考一下

一、BasicDBObject

整个聚合查询是统计用户的各种状态下的用户数量为场景:

1.筛选条件:

date为查询日期:

BasicDBObject Query = new BasicDBObject(); 
Query.put("time",new BasicDBObject("$gte", date + " 00:00:00")
 .append("$lte", date + " 23:59:59"));

如果有多个条件:直接加Query.put("status", 0);

如果有OR筛选:

BasicDBList values = new BasicDBList();
values.add(new BasicDBObject("status", new BasicDBObject("$exists",false)));
values.add(new BasicDBObject("status", 0));
Query.put("$or", values);

其中 new BasicDBObject("$exists",false)) 就是“status”不存在(mongodb文档可不等于实体的字段)

2.拼接match

DBObject Match = new BasicDBObject("$match", Query);

将上一步的Query放入macth筛选中

3.拼接分组条件

此步相当于SQL的Group By

BasicDBObject GroupBy = new BasicDBObject();// 分组条件
GroupBy.put("userId", "$userId");//根据用户ID来分组

同第一步的筛选一样,如果有多个分组可直接添加在后面:GroupBy.put("status", "$status");

4.分组后查询

首先把分组拼接上:

DBObject Select = new BasicDBObject("_id", GroupBy);

如果我们要对分组后的数据进行操作:(这里是用户的统计数量)

Select.put("count", new BasicDBObject("$sum", 1));

5.拼接$group

DBObject Group = new BasicDBObject("$group", Select);

至此。我们拼接,mongodb的语句到此结束

下面我们开始查询操作:

import com.mongodb.AggregationOutput;
import org.springframework.data.mongodb.core.MongoTemplate;
AggregationOutput Output = mongoTemplate.getCollection("这里是mongodb的数据表名")
  .aggregate(Match, Group);

读取查询结果:

Iterable<DBObject> map = Output.results();
//遍历map
for (DBObject dbObject : map) {
  //这里读取到的map为{"_id":{"userId":1,"status"0}}...   
  Map<String, Object> resultMap = (Map<String, Object>) dbObject.get("_id");

  //这里截取掉.0   
  Integer userId = Integer.parseInt(CommUtil.toString(ausgMap.get("userId")).replace(".0",""));

  //在这里我们就可以对我们的数据进行操作了;  
  Integer count = Integer.parseInt(CommUtil.toString(dbObject.get("count")));
     
}

二、DBObject

不多说,如果大家觉得第一种方法特别长篇大论,那么下面我给大家带来一种代码更简洁的聚合查询:

直接上代码吧。

1.注意导入的包:

import com.mongodb.DBObject; import com.mongodb.util.JSON;

2.$macth:

(beginDay-查询开始日期;endDay-查询结束日期)

DBObject match = (DBObject) JSON.parse("{$match:{'status':'1','time':
  {$gte:'"+beginDay+"',$lte:'"+endDay+"'}}}");

3.$group:

(以userId分组,统计用户数量,累加amout字段值,取amout字段最大值)

DBObject group = (DBObject) JSON.parse("{$group:{_id:'$userId', 
  count:{$sum:1},total:{$sum:'$amount'},maxSigle:{$max:'$amount'}}}");

条件拼接完,开始查询:

List<DBObject> list = new ArrayList<DBObject>();
list.add(match); list.add(group);
AggregationOutput Output = mongoTemplate.getCollection("表名").aggregate(list);

遍历结果就不用在说了。上面已经详细描述了

第二种方法是不是比一种方式简单多了。但是比较考验自身对mongodb语句熟悉性。

【扩展】

接着上面的方法进行扩展

//status 为0或者为1 ; type 不为11;time在beginDay ~ endDay时间段内
DBObject match = (DBObject) JSON.parse("{$match:{'status':{$in:['0','1']},
  type:{$ne:11},'time':{$gte:'"+beginDay+"',$lte:'"+endDay+"'}}}");

//以用户Id分组,统计查询次数,取最后一次time的时间
DBObject group = (DBObject) JSON.parse("{$group:{_id:'$userId', 
  count:{$sum:1},lastTime:{$max:'$time'} }}");

//在上一步统计出的结果中筛选次数大于100的数据
DBObject groupMatch = (DBObject) JSON.parse("{$match:{count:{$gte:100}}}");

//$project----查询结果中需要显示哪些字段,显示则设置为1。如下需要不显示_id 域(字段),则需如下指定:
//db.集合名.aggregate( [ { $project : { _id: 0, count: 1 , lastSuccTime: 1 } } ] )
DBObject project = (DBObject) JSON.parse("{$project:{_id:1,count:1,lastSuccTime:1}}");

DBObject sort = (DBObject) JSON.parse("{$sort:{'count':-1}}");//排序

List<DBObject> list = new ArrayList<DBObject>();
list.add(match);
list.add(group);
list.add(groupMatch);
list.add(project);
list.add(sort);
AggregationOutput catchOutPut = mongoTemplate.getCollection("表名")
  .aggregate(list);//查询结果

三、BasicDBObject+脚本语句

BasicDBObject groupIndex = new BasicDBObject();
BasicDBObject distinctQuery = new BasicDBObject();
distinctQuery.put("userId", new BasicDBObject("$in", userIds));//UserIds数组
BasicDBObject initIndex = new BasicDBObject();
initIndex.put("count", 0);//给count赋初值

// 脚本(doc代表数据库的数据.prev代表查询结果//prev.count这里的count就是上一步initIndex的count)
String reduce = "function(doc, prev) {if(doc.status==0){prev.count+= 1;};}";
List<Map<String, Object>> basicDBList = (List<Map<String, Object>>) mongoTemplate.
  getCollection("Collection").group(groupIndex, distinctQuery, initIndex, reduce, null);

最后循环遍历List即可得到结果【PS:group这种聚合方式有个限制条件--->超过20000数据就会报错】

以上就是我在普通业务处理中用到mongodb聚合处理。如果有更好的方法或是有需要改进的地方,欢迎大家给我留言~

 类似资料:
  • 1、导航对象图查询:根据已加载的对象,导航到其他对象。 例如,对于已经加载的Customer对象,调用它的getOrders().iterator()方法就可以导航到所有关联的Order对象,假如在关联级别使用了延迟加载检索策略,那么首次执行此方法时,hibernate会从数据库中加载关联的Order对象,否则就从缓存中获得Order对象。 2、OID方式:按照对象的OID来检索对象 Sessio

  • 本文向大家介绍hibernate 有几种查询方式?相关面试题,主要包含被问及hibernate 有几种查询方式?时的应答技巧和注意事项,需要的朋友参考一下 三种:hql、原生 SQL、条件查询 Criteria。

  • >[danger] 注意!!! 使用聚合功能时,必须给它一个别名,以便能够从模型中访问它 > 聚合函数的计算,都是排除了 null 值,所以COUNT( id ) 一般推荐用非空的主键来计算 COUNT 计算数量 const { Sequelize } = app; // 查询班级总人数,按照姓名聚合 const ret = await Student.findAll({ attribut

  • 在应用中我们经常会用到一些统计数据,例如当前所有(或者满足某些条件)的用户数、所有用户的最大积分、用户的平均成绩等等,ThinkPHP为这些统计操作提供了一系列的内置方法,包括: 方法 说明 count 统计数量,参数是要统计的字段名(可选) max 获取最大值,参数是要统计的字段名(必须) min 获取最小值,参数是要统计的字段名(必须) avg 获取平均值,参数是要统计的字段名(必须) sum

  • 本文向大家介绍Mybatis的几种传参方式详解,包括了Mybatis的几种传参方式详解的使用技巧和注意事项,需要的朋友参考一下 前言 前几天恰好面试一个应届生,问了一个很简单的问题:你了解过Mybatis中有几种传参方式吗? 没想到其他问题回答的很好,唯独这个问题一知半解,勉强回答了其中两种方式。 于是这篇文章就来说一说Mybatis传参的几种常见方式,给正在面试或者准备面试的朋友巩固一下。 单个

  • 主要内容:aggregate() 方法,管道MongoDB 中的聚合操作用来处理数据并返回计算结果,聚合操作可以将多个文档中的值组合在一起,并可对数据执行各种操作,以返回单个结果,有点类似于 SQL 语句中的 count(*)、group by 等。 aggregate() 方法 您可以使用 MongoDB 中的 aggregate() 方法来执行聚合操作,其语法格式如下: db.collection_name.aggregate(aggr