标签:mongodb 表示 bsp 注意 发送 query set (()) 保存
转载请注明joymufeng,欢迎访问PlayScala社区(http://www.playscala.cn/)
MongoDB有一种特殊的Collection叫Capped collections,它的插入速度非常快,基本和磁盘的写入速度差不多,并且支持按照插入顺序高效的查询操作。Capped collections的大小是固定的,它的工作方式很像环形缓冲器(circular buffers), 当剩余空间不足时,会覆盖最先插入的数据。
Capped collections的特点是高效插入和检索,所以最好不要在Capped collections上添加额外的索引,否则会影响插入速度。Capped collections可以用于以下场景:
Capped collections的使用限制:
Capped collections可以使用$natural操作符按插入顺序的正序或反序返回结果:
db[‘oplog.rs‘].find({}).sort({$natural: -1})
Oplog是一种特殊的Capped collections,特殊之处在于它是系统级Collection,记录了数据库的所有操作,集群之间依靠Oplog进行数据同步。Oplog的全名是local.oplog.rs,位于local数据下。由于local数据不允许创建用户,如果要访问Oplog需要借助其它数据库的用户,并且赋予该用户访问local数据库的权限,例如:
db.createUser({
user: "play-community",
pwd: "******",
"roles" : [
{
"role" : "readWrite",
"db" : "play-community"
},
{
"role" : "read",
"db" : "local"
}
]
})
Oplog记录的操作记录是幂等的(idempotent),这意味着你可以多次执行这些操作而不会导致数据丢失或不一致。例如对于$inc操作,Oplog会自动将其转换为$set操作,例如原始数据如下:
{
"_id" : "0",
"count" : 1.0
}
执行如下$inc操作:
db.test.update({_id: "0"}, {$inc: {count: 1}})
Oplog记录的日志为:
{
"ts" : Timestamp(1503110518, 1),
"t" : NumberLong(8),
"h" : NumberLong(-3967772133090765679),
"v" : NumberInt(2),
"op" : "u",
"ns" : "play-community.test",
"o2" : {
"_id" : "0"
},
"o" : {
"$set" : {
"count" : 2.0
}
}
}
这种转换可以保证Oplog的幂等性。另外Oplog为了保证插入性能,不允许额外创建索引。
MongoDB有一种特殊的时间格式Timestamps,仅用于内部使用,例如上面Oplog记录:
Timestamp(1503110518, 1)
Timestamps长度为64位:
在开始同步Oplog之前,我们需要注意以下几点:
val tailingCursor =
oplogCol
.find(Json.obj("ns" -> Json.obj("$in" -> Set(s"${db}.common-doc", s"${db}.common-article")), "ts" -> Json.obj("$gte" -> lastTS)))
.options(QueryOpts().tailable.oplogReplay.awaitData.noCursorTimeout)
.cursor[BSONDocument]()
tailingCursor.fold(()){ (_, doc) =>
try {
val jsObj = doc.as[JsObject]
jsObj("op").as[String] match {
case "i" => // 插入
case "u" => // 更新
case "d" => // 删除
}
// 保存ts值,以备后用
if (tailCount.get() % 10 == 0) { }
} catch {
case t: Throwable =>
Logger.error("Tail oplog Error: " + t.getMessage, t)
}
}
另外提醒大家注意,ReactiveMongo-Streaming的Akka Stream实现有bug,如果首次查询没有数据返回,则会持续发送查询请求,大约每秒中发送几十次至几百次请求,因为Oplog的查询开销很大,最终会导致MongoDB内存溢出。详情参考Keep sending queries while the initial query result of a tailable cursor is empty.
标签:mongodb 表示 bsp 注意 发送 query set (()) 保存
原文地址:http://www.cnblogs.com/joymufeng/p/7403623.html