mongodb字段验证规则(schema validation)

陈翰林
2023-12-01

在我们通常的印象中,mongodb是模式自由的(schemaless),可以往一个集合里插入任意类型的数据,这会带来一些问题,例如对于PHP这种弱类型的语言,一个本应该是int型的字段,可能会同时存在string和int类型的数据。

例如一个集合members,存储会员信息,包含的文档如下

> db.members.find();{ "_id" : ObjectId("5b62a5c73eeb75204f15dbe3"), "user_id" : 100"level" : "vip" }{ "_id" : ObjectId("5b62a5cb3eeb75204f15dbe4"), "user_id" : 101"level" : "vip" }{ "_id" : ObjectId("5b62a5db3eeb75204f15dbe5"), "user_id" : "102""level" : "gold" }{ "_id" : ObjectId("5b62a5e53eeb75204f15dbe6"), "user_id" : 102"level" : "gold" }

  • 1
  • 2
  • 3
  • 4
  • 5

集合中有user_id为102和”102”的两个文档,按user_id查询

> db.members.find({user_id:{$eq:102}});{ "_id" : ObjectId("5b62a5e53eeb75204f15dbe6"), "user_id" : 102"level" : "gold" }> db.members.find({user_id:{$eq:"102"}});{ "_id" : ObjectId("5b62a5db3eeb75204f15dbe5"), "user_id" : "102""level" : "gold" }

  • 1
  • 2
  • 3
  • 4

可以看出102和”102”查询出了不同的结果。

问题来了,开发语言为弱类型语言,导致同一个字段写入了不同类型的值,这很容易引起bug。

是否可以对mongodb的字段类型进行约束呢?很不幸,mongodb 3.2之前的版本不支持本操作。

幸运的是,mongodb从版本3.2开始引入了schema validation,可以为集合指定验证规则。

我们为members集合指定验证规则,限定user_id必须为int类型,且不可或缺。

> db.runCommand({collMod:"members", validator:{$and:[{"user_id":{$type:"int"$exists:true}}]}});{ "ok" : 1 }

  • 1
  • 2

尝试插入user_id为string类型的数据,可以看出验证失败了。

> db.members.insert({user_id:"102", level:"gold"});Document failed validation

  • 1
  • 2

我们还可以在创建集合时就指定验证规则

> db.createCollection("test_members", {validator:{$and:[{"user_id":{$type:"int"$exists:true}}]}});{ "ok" : 1 }

 类似资料: