MongoDB 入门教程实战学习笔记-22-mongo bulk write 批量写操作

小编 2026-07-02 阅读:322 评论:0
概述 mongodb 为客户端提供了批量执行写入操作的能力。大容量写入操作会影响单个集合。mongodb 允许应用程序确定批量写入操作所需的可接受确认级别。 3.2 版中的新版本。 db.co...

概述

mongodb 为客户端提供了批量执行写入操作的能力。大容量写入操作会影响单个集合。mongodb 允许应用程序确定批量写入操作所需的可接受确认级别。

3.2 版中的新版本。

db.collection.bulkWrite() 方法提供了执行批量插入、更新和删除操作的能力。

mongodb 还支持批量插入 db.collection.insertMany()。

有序操作与无序操作

批量写入操作可以是有序的, 也可以是无序的。

使用有序的操作列表, mongodb 按顺序执行操作。如果在处理其中一个写入操作的过程中发生错误, mongodb 将返回, 而不处理列表中的任何剩余写入操作。

查看顺序写入

对于无序的操作列表, mongodb 可以并行执行操作, 但不能保证此行为。如果在处理其中一个写入操作的过程中发生错误, mongodb 将继续处理列表中剩余的写入操作。

请参阅无序写入

在共享集合上执行有序操作列表通常比执行无序列表要慢, 因为对于有序列表, 每个操作都必须等待上一个操作完成。

默认情况下, bulkwrite() 执行有序操作。

若要指定无序写入操作, 请在选项文档中按顺序设置: false。

参见 Execution of Operations

bulkWrite()

支持方法

  • insertOne()

  • updateOne()

  • updateMany()

  • replaceOne()

  • deleteOne()

  • deleteMany()

每个写入操作都作为数组中的文档传递给 bulkwrite ()。

例子

例如, 以下执行多个写入操作:

字符集合包含以下文档:

{ \"_id\" : 1, \"char\" : \"Brisbane\", \"class\" : \"monk\", \"lvl\" : 4 },
{ \"_id\" : 2, \"char\" : \"Eldon\", \"class\" : \"alchemist\", \"lvl\" : 3 },
{ \"_id\" : 3, \"char\" : \"Meldane\", \"class\" : \"ranger\", \"lvl\" : 3 }
  • 批量操作
try {
   db.characters.bulkWrite(
      [
         { insertOne :
            {
               \"document\" :
               {
                  \"_id\" : 4, \"char\" : \"Dithras\", \"class\" : \"barbarian\", \"lvl\" : 4
               }
            }
         },
         { insertOne :
            {
               \"document\" :
               {
                  \"_id\" : 5, \"char\" : \"Taeln\", \"class\" : \"fighter\", \"lvl\" : 3
               }
            }
         },
         { updateOne :
            {
               \"filter\" : { \"char\" : \"Eldon\" },
               \"update\" : { $set : { \"status\" : \"Critical Injury\" } }
            }
         },
         { deleteOne :
            { \"filter\" : { \"char\" : \"Brisbane\"} }
         },
         { replaceOne :
            {
               \"filter\" : { \"char\" : \"Meldane\" },
               \"replacement\" : { \"char\" : \"Tanys\", \"class\" : \"oracle\", \"lvl\" : 4 }
            }
         }
      ]
   );
}
catch (e) {
   print(e);
}

批量插入到集群集合中的策略

大型批量插入操作 (包括初始数据插入或常规数据导入) 可能会影响共享群集的性能。对于批量插入, 请考虑以下策略:

预拆分集合

如果共享集合为空, 则该集合只有一个初始块, 它驻留在单个分片上。

然后, mongodb 必须花费时间来接收数据、创建拆分并将拆分块分发到可用的分片。若要避免此性能成本, 可以预拆分集合, 如锐化群集中的拆分块中所述。

对 mongos 的无序写入

若要提高共享群集的写入性能, 请使用 bulkwrite(), 并将可选参数排序为 false。

mongos 可以尝试同时将写入发送到多个分片。

对于空集合, 首先预拆分集合, 如在 Split Chunks in a Sharded Cluster 所述。

避免单声道节流

如果您的分片键在插入过程中单调增加, 则所有插入的数据都将转到集合中的最后一个块, 这些块最终将始终位于单个分片上。

因此, 群集的插入容量永远不会超过该单个分片的插入容量。

如果插入卷大于单个分片可以处理的内容, 并且无法避免单调增加分片键, 请考虑对应用程序进行以下修改:

  • 反转分片键的二进制位。这将保留信息, 并避免将插入顺序与不断增加的值序列关联起来。

  • 将第一个和最后一个16位单词交换为 “洗牌” 插入。

例子

下面的示例, 在 c++ 中, 交换生成的 bson objecds 的前导和尾随16位单词, 使它们不再单调增加。

using namespace mongo;
OID make_an_id() {
  OID x = OID::gen();
  const unsigned char *p = x.getData();
  swap( (unsigned short&) p[0], (unsigned short&) p[10] );
  return x;
}

void foo() {
  // create an object
  BSONObj o = BSON( \"_id\" << make_an_id() << \"x\" << 3 << \"name\" << \"jane\" );
  // now we may insert o into a sharded collection
}

参考资料

bulk-write-operations

目录

MongoDB 入门教程实战学习笔记-00-目录

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

热门文章
  • Sequential Monte Carlo Methods (SMC) 序列蒙特卡洛/粒子滤波/Bootstrap Filtering

    Sequential Monte Carlo Methods (SMC) 序列蒙特卡洛/粒子滤波/Bootstrap Filtering
    Problem Statement 我们考虑一个具有马尔可夫性质、非线性、非高斯的状态空间模型(State Space Model):对于一个时间序列上的观测结果{yt,t∈N}\\{ y_t , t \\in N \\}{yt​,t∈N},我们认为每个观测结果yty_tyt​的生成依赖于一个无法直接观察的隐变量xt∈{xt,t∈N}x_t \\in \\{x_t , t \\in N \\}xt​∈{xt​,t∈N},即:p(...
  • 机房智能化温湿度解决方式之POE供电以太网温湿度传感器

    机房智能化温湿度解决方式之POE供电以太网温湿度传感器
    机房智能化温湿度解决方式之POE供电以太网温湿度传感器 北京盈创力和电子科技有限公司 智能型TCP网口温湿度记录仪 北京IP网络温湿度记录仪厂家,北京盈创力和 北京智能型TCP网口温湿度记录仪IP网络温湿度记录仪是一种新型的基于TCP/IP协议双绞线以太网标准温湿度采集模块,利用它可以实现现场温度值、相对湿度值的采集,同时利用其自身的RJ45通信接口可以方便地和机房监控主机或交换机集线器进行联网。 工作于-40℃~85℃工业级带...
  • Hive 系统函数及示例

    Hive 系统函数及示例
    查看所有系统函数 show functions; 函数分类 内置函数【系统函数】 数学函数: floor、round、ceil、cos、log2等 字符串函数: length、reverse、trim、lower、get_json_object、repeat等 收集函数: size 转换函数: cast 日期函数: year、month、datediff、date、date_add等 条件函数: coalesce、case…w...
  • CSRF的原理和防范措施

    CSRF的原理和防范措施
    a)攻击原理:i.用户C访问正常网站A时进行登录,浏览器保存A的cookieii.用户C再访问攻击网站B,网站B上有某个隐藏的链接或者图片标签会自动请求网站A的URL地址,例如表单提交,传指定的参数iii.而攻击网站B在访问网站A的时候,浏览器会自动带上网站A的cookieiv.所以网站A在接收到请求之后可判断当前用户是登录状态,所以...
  • HTTP状态保持的原理

    HTTP状态保持的原理
    a)在用户登录之后,浏览器返回响应的时候会在响应中添加上cookieb)浏览器接收到cookie之后会自动保存c)当用户再次请求同一服务器中的其他网页的时候,浏览器会自动带上之前保存的cookied)服务接收到请求之后可以请 request 对象中取到cookie 判断当前用户是否登录  Http是无状态的,就是连接时数据互通,关闭后...
标签列表