根据关键字段查找 MongoDB 集合中的所有重复文档?
使用聚合框架根据关键字段查找 MongoDB 集合中的所有重复文档。
为了解这个概念,让我们创建一个带有文档的集合。创建带有文档的集合的查询如下 −
> db.findDuplicateByKeyDemo.insertOne({"StudentId":1,"StudentName":"John"});
{
"acknowledged" : true,
"insertedId" : ObjectId("5c7f5b168d10a061296a3c3a")
}
> db.findDuplicateByKeyDemo.insertOne({"StudentId":2,"StudentName":"Carol"});
{
"acknowledged" : true,
"insertedId" : ObjectId("5c7f5b1f8d10a061296a3c3b")
}
> db.findDuplicateByKeyDemo.insertOne({"StudentId":3,"StudentName":"Carol"});
{
"acknowledged" : true,
"insertedId" : ObjectId("5c7f5b248d10a061296a3c3c")
}
> db.findDuplicateByKeyDemo.insertOne({"StudentId":4,"StudentName":"John"});
{
"acknowledged" : true,
"insertedId" : ObjectId("5c7f5b2d8d10a061296a3c3d")
}
> db.findDuplicateByKeyDemo.insertOne({"StudentId":5,"StudentName":"Sam"});
{
"acknowledged" : true,
"insertedId" : ObjectId("5c7f5b398d10a061296a3c3e")
}
> db.findDuplicateByKeyDemo.insertOne({"StudentId":6,"StudentName":"Carol"});
{
"acknowledged" : true,
"insertedId" : ObjectId("5c7f5b438d10a061296a3c3f")
}使用 find() 方法显示集合中的所有文档。查询如下 −
> db.findDuplicateByKeyDemo.find().pretty();
以下是输出 −
{
"_id" : ObjectId("5c7f5b168d10a061296a3c3a"),
"StudentId" : 1,
"StudentName" : "John"
}
{
"_id" : ObjectId("5c7f5b1f8d10a061296a3c3b"),
"StudentId" : 2,
"StudentName" : "Carol"
}
{
"_id" : ObjectId("5c7f5b248d10a061296a3c3c"),
"StudentId" : 3,
"StudentName" : "Carol"
}
{
"_id" : ObjectId("5c7f5b2d8d10a061296a3c3d"),
"StudentId" : 4,
"StudentName" : "John"
}
{
"_id" : ObjectId("5c7f5b398d10a061296a3c3e"),
"StudentId" : 5,
"StudentName" : "Sam"
}
{
"_id" : ObjectId("5c7f5b438d10a061296a3c3f"),
"StudentId" : 6,
"StudentName" : "Carol"
}以下是查找所有重复文档的查询” −
> db.findDuplicateByKeyDemo.aggregate([
... { $group: {
... _id: { StudentName: "$StudentName" },
... UIDS: { $addToSet: "$_id" },
... COUNTER: { $sum: 1 }
... } },
... { $match: {
... COUNTER: { $gte: 2 }
... } },
... { $sort : { COUNTER : -1} },
... { $limit : 10 }
... ]).pretty();以下是显示重复记录的输出。在此,学生“Carol‟ 出现 3 次,而 John 出现 2 次 −
以下是输出 −
{
"_id" : {
"StudentName" : "Carol"
},
"UIDS" : [
ObjectId("5c7f5b248d10a061296a3c3c"),
ObjectId("5c7f5b438d10a061296a3c3f"),
ObjectId("5c7f5b1f8d10a061296a3c3b")
],
"COUNTER" : 3
}
{
"_id" : {
"StudentName" : "John"
},
"UIDS" : [
ObjectId("5c7f5b2d8d10a061296a3c3d"),
ObjectId("5c7f5b168d10a061296a3c3a")
],
"COUNTER" : 2
}
广告
数据结构
网络
RDBMS
操作系统
Java
iOS
HTML
CSS
Android
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP