MongoDB CRUD

插入文档

插入一个或多个文档

db.collection.insert(
   <document or array of documents>,
   {
     writeConcern: <document>,
     ordered: <boolean>
   }
)

插入一个文档(3.2)

db.collection.insertOne(
   <document>,
   {
      writeConcern: <document>
   }
)

插入多个文档(3.2)

db.collection.insertMany(
   [ <document 1> , <document 2>, ... ],
   {
      writeConcern: <document>,
      ordered: <boolean>
   }
)

插入文档时，如果集合不存在，则插入操作将会创建该集合。

_id字段

插入时未指定_id的话，系统将自动添加一个ObjectId对象

原子性

MongoDB中所有写操作都是单个文档级别的原子操作，如果批量操作时有一个文档插入失败，那么在这个文档之前的所有文档都会插入成功，后续的文档全部失败。

插入校验

插入数据时，MongoDB会做基本的检查：检查文档结构，检查大小。MongoDB限制所有文档都必须小于16MB，防止不良设计。如果要查看BSON文档的大小，可以执行Object.bsonsize()

writeConcern

可选参数，写入关注程度

ordered

2.6新增的可选项，如果为true则有序插入，发生错误则直接返回，false则无序插入，发生错误则继续处理后续文档，默认为true

删除文档

db.collection.remove()

db.collection.remove(
   <query>,
   {
     justOne: <boolean>,
     writeConcern: <document>
   }
)

query:删除文档的条件，如果不指定则删除整个集合
justOne：是否只删除一个文档，如果为true则只删除一个，false则删除所有匹配的文档
writeConcern：写入关注

db.collection.deleteMany()

db.collection.deleteMany(
   <filter>,
   {
      writeConcern: <document>,
      collation: <document>
   }
)

db.collection.deleteOne()

db.collection.deleteOne(
   <filter>,
   {
      writeConcern: <document>,
      collation: <document>
   }
)

collation: collation用于指定字符串比较规则

在3.2版本中通过findOneAndDelete()也可以对文档进行查找删除，并返回删除的文档信息

db.collection.findOneAndDelete(
   <filter>,
   {
     projection: <document>,
     sort: <document>,
     maxTimeMS: <number>,
     collation: <document>
   }
)

projection：选择返回的文档字段，省略则返回全部字段
sort：指定排序方式
maxTimeMS：指定操作时间限制，超过则报错，单位为毫秒

删除文档通常很快，并且索引不会随着文档的删除而删除。但如果是想清空整个文档，建议使用drop直接将集合删除

更新文档

db.collection.update(
   <query>,
   <update>,
   {
     upsert: <boolean>,
     multi: <boolean>,
     writeConcern: <document>,
     collation: <document>,
     arrayFilters: [ <filterdocument1>, ... ]
   }
)

db.collection.updateOne(
   <filter>,
   <update>,
   {
     upsert: <boolean>,
     writeConcern: <document>,
     collation: <document>,
     arrayFilters: [ <filterdocument1>, ... ]
   }
)

db.collection.updateMany(
   <filter>,
   <update>,
   {
     upsert: <boolean>,
     writeConcern: <document>,
     collation: <document>,
     arrayFilters: [ <filterdocument1>, ... ]
   }
)

db.collection.findOneAndUpdate(
   <filter>,
   <update>,
   {
     projection: <document>,
     sort: <document>,
     maxTimeMS: <number>,
     upsert: <boolean>,
     returnNewDocument: <boolean>,
     collation: <document>,
     arrayFilters: [ <filterdocument1>, ... ]
   }
)

filter：查询过滤器
update：如果是要替换文档中的字段，可以使用文档替换模式，如果在原字段进行修改需要使用操作符
projection：返回文档的字段
sort：指定排序规则
maxTimeMS：限定操作时间，单位为毫秒，超时则报错
upsert：文档不存在时，自动创建一个新文档，默认为false
returnNewDocument：返回更新前的文档还是更新后的文档，默认为false，返回更新前的文档
collation：collation用于指定字符串比较规则
arrayFilters：数组过滤器
writeConcern：写入关注级别
multi：是否批量修改，默认为false，更新只能对符合匹配条件的第一个文档进行更新

默认情况下，更新只能对符合匹配条件的第一个文档执行操作。如果需要对多个文档进行操作，需要将update的第四个参数修改为true。为了安全起见，建议显示指定该参数。如果想知道更新了多少文档可以执行getLastError

db.runCommand({getLastError:1})

文档替换

当前数据库存在下列文档记录

{
  "_id" : ObjectId("5bf4f9936dd981d267ddd1b0"),
  "name" : "joe",
  "friends" : 32,
  "enemies" : 2
}

现在计划将friends和enemies划分到relationships的子文档中，可以做如下修改

>var joe=db.U_Test.findOne({"name":"joe"})
>joe.relationships={"frieds":joe.friends,"enemies":joe.enemies}
>delete joe.friends
>delete joe.enemies
>db.U_Test.updateOne({"_id":ObjectId("5bf4f9936dd981d267ddd1b0")},joe)
{
  "_id" : ObjectId("5bf4f9936dd981d267ddd1b0"),
  "name" : "joe",
  "relationships" : {
    "friends" : 32,
    "enemies" : 2
  }
}

修改器

修改器	作用	示例
$set	修改指定字段的值，如果字段不存在则创建	db.user.update({“_id”:ObjectId(“5e7335dd420cd17d56e7281f”)},{ $set:{“name”:”hengxing”}});
$unset	删除指定字段	db.user.update({“_id”:ObjectId(“5e7335dd420cd17d56e7281f”)},{ $unset:{“address”:1}});
$currentDate	将当前时间值赋值给字段，字段不存在则创建	db.user.update({“_id”:ObjectId(“5e7335dd420cd17d56e7281f”)},{“$currentDate”:{“lastModified”:true}});
$inc	用于增加或减少键值为数字的值，不存在则创建	db.user.update({“_id”:ObjectId(“5e7335dd420cd17d56e7281f”)},{“$inc”:{“age”:5}});
$max	大于当前字段值，才会更新字段	db.user.update({“_id”:ObjectId(“5e7335dd420cd17d56e7281f”),{ $max:{“age”:30}});
$min	小于当前字段值，才会更新字段	db.user.update({“_id”:ObjectId(“5e7335dd420cd17d56e7281f”)},{“$min”:{“age”:25}});
$mul	将指定值与字段值相乘	db.user.update({“_id”:ObjectId(“5e7335dd420cd17d56e7281f”)},{“$mul”:{“age”:2}});
$rename	字段重命名	db.user.update({“_id”:ObjectId(“5e7335dd420cd17d56e7281f”)},{“$rename”:{“sex”:”sexs”}});
$setOnInsert	如果文档不存在，则将指定值赋给指定字段，存在则退出	db.user.update({“_id”:ObjectId(“5e7335dd420cd17d56e7281f”)},{“$addToSet”:{“email”:”1111@mail.com“}});
$	占位符，匹配更新第一个文档元素	db.user.update({“email”:”1111@mail.com“},{“$set”:{“email.$“:”3333@mail.com“}});
$[]	占位符，匹配更新所有文档的元素	db.user.update({“email”:”1111@mail.com“},{“$set”:{“email.$[]”:”3333@mail.com“}});
$[identifier]	占位符，匹配更新所有满足arrayFilters条件的文档的元素	db.user.update({“_id” : ObjectId(“5e7335dd420cd17d56e7281f”)},{“$set”:{“email.$[elem]”:”4444@mail.com“}},{multi:true,arrayFilters:[{“elem”:{$ne:”5555@mail.com“}}]});
$push	向数组末尾添加一个元素，不存在则创建数组	db.U_Test.update({“_id”:ObjectId(“5bf4f9936dd981d267ddd1b0”)},{“$push”:{“comments”:{“name”:”mark”,”email”:”mark@example.com“}}})
$pop	从数组中弹出元素，1为从末尾，-1为头部	db.U_Test.update({“_id”:ObjectId(“5bf4f9936dd981d267ddd1b0”)},{“$pop”:{“enemies”:-1}})
$addToSet	元素不存在时将元素添加到数组中	db.U_Test.update({“_id”:ObjectId(“5bf4f9936dd981d267ddd1b0”)},{“$addToSet”:{“name”:”jack”}})
$pull	删除所有符合条件的元素	db.U_Test.update({},{“$pull”:{“top5”:”B”}})
$pullAll	移除数组的所有元素	db.U_Test.update({},{“$pullAll”:{“top5”:”B”}})
$each	与$push或者addToSet一起完成批量操作，可以结合$slice限制数组的长度	db.U_Test.update({“_id”:ObjectId(“5bf4f9936dd981d267ddd1b0”)},{“$push”:{“top5”:{“$each”:[“A”,”B”,”C”,”D”,”E”,”F”],”$slice”:-5}}})
$sort	对字段进行排序	db.U_Test.update({“_id”:ObjectId(“5bf4f9936dd981d267ddd1b0”)},{“$sort”:{“enemies”:1}})
$ne	只有在集合中尚未存在元素时才将元素添加到数组中	db.U_Test.update({“_id”:ObjectId(“5bf4f9936dd981d267ddd1b0”),”name”:{“$ne”:”mark”}},{“$set”:{“name”:”mark”}})
$position	指定数组添加元素的位置	db.user.update({“_id”:ObjectId(“5e7335dd420cd17d56e7281f”)},{$push: {scores: {$each: [ 40，50 ],$position: 0}}})
$bit	执行整数值的按位和、or和异或更新

填充因子

MongoDB不得不移动一个新文档时，例如update使原有文档变大，它会修改集合的填充因子，填充因子是MongoDB为每个新文档预留的增长空间。可以执行db.collection.status()查看填充因子。随着不断的文档移动，填充因子会越来越大，反之则缓慢降低。

移动文档是非常慢的，MongoDB必须将文档原本所占的空间释放掉，然后将文档写入另一片区域。因此尽量让填充因子接近1。如果日志中频繁出现was empty,skipping ahead的字眼，说明数据库目前在频繁移动文档，存在较多碎片，意味着存在性能问题。

如果你的集合插入和删除时会进行大量的移动或者经常打乱数据，可以用usePowerOf2Sizes选项提高磁盘复用率。可以通过collMod命令来设置该选项：

db.runCommand({"collMod":collection,"usePowerOf2Sizes":true})

这个集合之后进行的所有空间分配，得到的块都是2的幂。只会影响新分配的记录，不对现有数据产生影响。该选项会导致初始空间不再那么高效，建议在需要经常打乱数据的集合上使用

upsert

upset是一种特殊更新，如果没有按条件找到对应文档，则以更新条件和更新文档为基础创建一个新的文档,找到则正常更新

db.analytics.update({"url":"/blog"},{"$inc":{"pageviews":1}},true)

save

save是一个shell函数，传入一个文档，如果文档不存在，它会自动创建文档，如果文档存在，它会更新这个文档。要是这个文档带有_id键，save会调用upsert，否则调用insert

findAndModify

findAndModify具有原子性，能够在一个操作中返回匹配结果以及更新，适用于大批量查询更新的场景。

process=db.runCommand({"findAndModify":"processes",
"query":{"status":"READY"},
"sort":{"priority":-1},
"update":{"$set":{"status":"RUNNING"}}}
).value

findAndModify支持很多字段：

query：检索文档的条件
sort：排序结果的条件
update：用于对文档进行匹配更新
remove：布尔类型，表示是否删除文档
new：布尔类型，表示返回更新前的文档还是更新后的文档，默认为更新前
fields：文档中需要返回的字段
upset：布尔类型，值为true则使用upset，默认为false

查询

MongoDB中使用find()来进行查询，查询返回集合中的文档子集，查询时可以指定限定条件来筛选所需的数据，条件为空则返回整个集合的文档

查询年龄为27的的男性

db.user.find({"age" : 27 , "sex" : "男"})

有时只想查询文档的部分字段，可以对其进行指定，例如只返回name列

db.user.find({} , {"name" : 1})

默认情况_id总是会自动输出，当然也可以设置_id=0不输出_id

查询操作符

操作符	说明
$lt	小于
$lte	小于等于
$gt	大于
$gte	大于等于
$ne	不等于
$in	用于查询一个键的多个值
$nin	与$in相反，是返回无法匹配数组的文档
$or	可以在多个键中查询任意一个给定的值
$nor	$or取反
$and	满足所有的给定条件
$not	$not是元条件句，可以用在任何其它条件之上。用于求非
$all	通过多个元素来匹配数组
$size	查询指定长度的数组
$slice	返回某个键匹配的数组元素的一个子集
$mod	将查询的值除以第一个指定值，若余数为第二个指定值则匹配成功

查询age大于等于18，小于等于30的文档

db.mycoll.find({"age" : {"$gte" : 18 , "$lte" : 30}})

查询number为725，542，290的文档

db.mycoll.find({"number" : {"$in" : [725,542,290]}})

查询number不为725，542，290的文档

db.mycoll.find({"number" : {"$nin" : [725,542,290]}})

查询number为725或name为lhx的文档

db.mycoll.find({"$or" : [{"number" : 725} , {"name" : "lhx"}]})

查询包含apple和banana的数组

db.mycoll.find({"fruit" : {$all : ["apple" , "banana"]}})

查询数组长度为3的数组

db.mycoll.find({"fruit" : {"$size" : 3}})

查询第11-20条的留言

db.mycoll.find(criteria , {"comments" : {"$slice" : [10,10]}})

针对null类型的查询

在针对数据类型为null的字段进行查询时，如果指定了一个不存在的键，则会返回整个集合不包含该键的文档

> db.mycoll.find({"a" : null})
{"_id" : ObjectID("4bados9df830a0ok0d52"),"a" : null}

查询不存在的b字段

> db.mycoll.find({"b" : null})
{"_id" : ObjectID("4bados9df830a0ok0d52"),"a" : null}
{"_id" : ObjectID("4bados9df830a0ok0d53"),"a" : 1}
{"_id" : ObjectID("4bados9df830a0ok0d54"),"a" : 2}

如果仅想检查该键的值是否为null，可以设置$exists条件判定键值是否存在

db.mycoll.find({"b" :{$in : [null] , "$exists" : true}})

针对正则表达式的查询

MongoDB使用perl兼容的正则表达式(PCRE)库来匹配正则表达式，任何PCRE支持的正则表达式语法都能被MongoDB接受。建议使用正则表达式之前现在JavaScripts shell中检查一下语法

查询name为joe的文档(正则表达式不区分大小写)

db.mycoll.find({"name": /joe/i})

数组与范围查询

目前存在如下文档：
{“x” : 5}
{“x” : 15}
{“x” : 25}
{“x” : [5 , 25]}

如果现在要查询x的值位于10-20之间的所有文档，通常可能会通过db.mycoll.find({“x” : {“$gt” : 10 , “lt” : 20}})的方式来查询，希望返回{“x” : 15}。但是实际上会返回两个文档：
{“x” : 15}
{“x” : [5 , 25]}

造成数组也返回的原因是因为25大于10，而且5也小于20，因此也符合查询条件。针对这种情况可以进行如下设置

如果希望排除非数组，可以通过$elemMatch要求MongoDB同时使用查询条件的两个语句与一个组元素进行比较
db.mycoll.find({"x" : {"\$elemMatch" : {"\$gt" : 10 , "\$lt" : 20}})
如果查询字段创建了索引，可以使用min()和max()将查询范围限制为$gt和$lt的值
db.mycoll.find({"x" : {"$gt" : 10 , "lt" : 20}}).min({"x" : 10}).max({"x" : 20})

$where查询

$where子句可以在查询中执行任意的javascript，这样就可以实现更多操作。但$where子句比较慢且不走索引，因此不到迫不得已不建议使用该方式。

比如查询返回两个键值相同的文档，在当前的环境中没有提供相关操作符。这里可以用$where借助javascript实现

db.mycoll.find({"where" : function(){
    for (var current in this) {
         for (var other in this) {
              if (current != other && this[currnet] == this[other]) {
                  return true;
              }
         }
     }
     return false;
}});

游标

数据库使用游标返回find的查询结果，客户端对游标的实现通常可以对最终结果进行有效的控制。

定义一个变量来保存find结果

var cursor = db.mycoll.find();

cursor.hasNext()检查是否还存在下一个值，cursor.next()获得该值

while (cursor.hasNext()) {
    obj=cursor.next();
    print(obj)
}

游标还实现了Javascripts的迭代器接口，所以可以在forEach中使用

cursor.forEach(function(x)) {
    print(x.name);
})

调用find时，并不会立即查询数据库，而是等待真正开始要获取结果时才会立即获取前100个结果或4MB数据(两者中最小)，这样下次调用next或者hasNext就不用再连接服务器获取结果了。当第一组数据获取结束后，会再次用getMore的方式请求更多结果。

结果集限制

limit可以限制返回结果的数量，例如只返回三条数据

db.mycoll.find().limit(3)

Skip则可以略过指定的数据，例如略过前三条数据

db.mycoll.find().skip(3)

如果将skip用于过滤大量数据，则性能会比较缓慢。例如对数据进行分页。最简单的数据分页方式就是通过skip不断修改偏移量结合limit实现

db.mycoll.find().limit(100)
db.mycoll.find().skip(100).limit(100)
db.mycoll.find().skip(200).limit(100)

对于数据分页可采用下列方式，而不是使用skip

var page1 = db.mycoll.find().sort({"date" : -1}).limit(100)
var latest = null
while (page1.hasNext()) {
     latest = page1.next();
     display(latest)
}
var page2 = db.mycoll.find({"date" : {$gt" : latest.date}});
page2.sort({"date" : -1}).limit(100)

sort接收一个键值对对象作为参数，键对应文档的键名，值代表排序方向，1表示升序，-1表示倒序

db.mycoll.find().sort({username :1 , age : -1})

如果一个键的值是多种类型的，其排序顺序是预先定义好的。优先级从小到大顺序如下：

最小值
Null
数字
字符串
对象/文档
数组
二进制数据
对象ID
布尔型
日期型
时间戳
正则表达式
最大值

高级查询选项

大部分驱动程序都提供了辅助函数，用于向查询添加各种选项

选项	说明
$comment	向查询添加注释
$explain	强制mongodb报告查询执行计划
$hint	强制MongoDB使用特定索引
$maxScan	限制扫描的文档数量
$maxTimeMS	指定处理游标操作的累积时间限制
$max	指定查询中使用索引的范围上限
$min	指定查询中使用索引的范围下限
$orderby	返回包含根据排序规范排序文档的游标
$query	包装查询文档
$returnKey	强制游标仅返回索引中包含的字段
$showDiskLoc	返回文档的磁盘位置的引用
$natural	使用磁盘上文档顺序对文档进行排序的特殊排序

db.user.find()._addSpecial('$showDiskLoc',true)

查询一致性

在我们通过查询获取数据之后再对数据进行处理并保存回数据库时，结果集比较大的话，MongoDB可能存在多次返回同一个文档。因为文档预留空间不足，导致原位置无法存放，MongoDB通常会将它们移动到集合尾端，当游标扫描到尾端时就会再次返回这部分数据。

应对这个问题可以设置snapshot，查询就在_id上遍历执行，保证每个文档只返回一次，但快照会使查询变慢，只在必要时使用，例如mongodump备份数据库。

db.user.find().snapshot();