jjzjj

mongodb - 为什么 MongoDB db.col.count() 显示的文档多于插入的文档

coder 2023-11-06 原文

使用 MongoDB 的 Java 驱动程序我试图将 25,637,015 个文档插入 MongoDB 集群。这些文档是从 SQL Server 数据库中检索出来的,并以多线程方式(8 个并发线程)插入到最初为空的 MongoDB 分片集合(称为 col)中。该过程耗时2小时。有趣且令人费解的是,在程序结束后,某些事情持续了超过 6(!)小时。

首先,我的集群节点计算机中的硬盘继续疯狂旋转。 其次,更重要的是,以小于秒的间隔运行的 db.col.count() 继续呈现不同的结果:

mongos> db.col.count() 
25694898
mongos> db.col.count()
25694917
mongos> db.col.count()
25695154
mongos> db.col.count()
25695207
mongos> db.col.count()
25695422
mongos> db.col.count()
25695493
mongos> db.col.count()
25696024
mongos> db.col.count()
25696130
mongos> db.col.count()
25698565
mongos> db.col.count()
25695145

更有趣的是,所有这些计数器在上升和下降时都大于插入文档的数量:25,637,015。如果它们更小,我可以推测文档进入某种队列并且正在缓慢处理,但更大?!

就像我说的,六个小时后一切都稳定了:硬盘驱动器停止旋转,mongos> db.col.count() 终于呈现出正确的数字:25637015。

如果它有任何重要性。我的分片集群中有 2 个副本集。每个副本集有 2 个数据节点和 1 个仅仲裁节点。我运行 3 个配置服务器。和 3 个 mongos。所有这些都分布在运行在 Windows 主机上的 4 个 Centos 机器(虚拟)之间。源 SQL Server 位于另一台物理计算机上。在插入期间或之后的任何时间,平衡器都没有被禁用。我的 MongoDB 版本是 2.2.6 64 位。

知道 Java 程序完成插入后 6 小时内 MongoDB 做了什么吗?为什么计数这么高?

谢谢

最佳答案

对于大多数驱动程序,mongodb 使用内存来提高写入性能。您的插入首先进入内存和日志,然后立即返回。到那时你的数据还没有在磁盘上。有关更多信息,请查看 Write Concern MongoDB 手册的部分。这就是您的收藏不断增长的原因。

关于计数返回多于准确数字的问题,其实有一个JIRA issue关于它。看看它是否回答了你的问题。不幸的是,它尚未修复。

编辑:
关于花费的时间,很难确定。取决于您的硬件,尤其是您的磁盘。运行 mongostat 会很有帮助和 mongotop看看发生了什么。一旦知道插入是否仍在运行,您就会知道计数结果是否有意义。在这里我找到了另一个相关的JIRA Issue解释分片集群中的计数操作。这可能会导致你的情况。但是,它仅在服务器迁移时发生。在继续之前,请让我知道您的分片集群是如何构建的。你的片键是什么?

关于mongodb - 为什么 MongoDB db.col.count() 显示的文档多于插入的文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22340979/

有关mongodb - 为什么 MongoDB db.col.count() 显示的文档多于插入的文档的更多相关文章

  1. ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法? - 2

    类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc

  2. ruby-on-rails - Rails - 子类化模型的设计模式是什么? - 2

    我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

  3. ruby-on-rails - Rails 编辑表单不显示嵌套项 - 2

    我得到了一个包含嵌套链接的表单。编辑时链接字段为空的问题。这是我的表格:Editingkategori{:action=>'update',:id=>@konkurrancer.id})do|f|%>'Trackingurl',:style=>'width:500;'%>'Editkonkurrence'%>|我的konkurrencer模型:has_one:link我的链接模型:classLink我的konkurrancer编辑操作:defedit@konkurrancer=Konkurrancer.find(params[:id])@konkurrancer.link_attrib

  4. ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby​​ 中生成它们? - 2

    我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%

  5. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  6. ruby - 为什么 4.1%2 使用 Ruby 返回 0.0999999999999996?但是 4.2%2==0.2 - 2

    为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返

  7. ruby - ruby 中的 TOPLEVEL_BINDING 是什么? - 2

    它不等于主线程的binding,这个toplevel作用域是什么?此作用域与主线程中的binding有何不同?>ruby-e'putsTOPLEVEL_BINDING===binding'false 最佳答案 事实是,TOPLEVEL_BINDING始终引用Binding的预定义全局实例,而Kernel#binding创建的新实例>Binding每次封装当前执行上下文。在顶层,它们都包含相同的绑定(bind),但它们不是同一个对象,您无法使用==或===测试它们的绑定(bind)相等性。putsTOPLEVEL_BINDINGput

  8. ruby - Infinity 和 NaN 的类型是什么? - 2

    我可以得到Infinity和NaNn=9.0/0#=>Infinityn.class#=>Floatm=0/0.0#=>NaNm.class#=>Float但是当我想直接访问Infinity或NaN时:Infinity#=>uninitializedconstantInfinity(NameError)NaN#=>uninitializedconstantNaN(NameError)什么是Infinity和NaN?它们是对象、关键字还是其他东西? 最佳答案 您看到打印为Infinity和NaN的只是Float类的两个特殊实例的字符串

  9. ruby-on-rails - 如果 Object::try 被发送到一个 nil 对象,为什么它会起作用? - 2

    如果您尝试在Ruby中的nil对象上调用方法,则会出现NoMethodError异常并显示消息:"undefinedmethod‘...’fornil:NilClass"然而,有一个tryRails中的方法,如果它被发送到一个nil对象,它只返回nil:require'rubygems'require'active_support/all'nil.try(:nonexisting_method)#noNoMethodErrorexceptionanymore那么try如何在内部工作以防止该异常? 最佳答案 像Ruby中的所有其他对象

  10. ruby-on-rails - 使用 Sublime Text 3 突出显示 HTML 背景语法中的 ERB? - 2

    所以我在关注Railscast,我注意到在html.erb文件中,ruby代码有一个微弱的背景高亮效果,以区别于其他代码HTML文档。我知道Ryan使用TextMate。我正在使用SublimeText3。我怎样才能达到同样的效果?谢谢! 最佳答案 为SublimeText安装ERB包。假设您安装了SublimeText包管理器*,只需点击cmd+shift+P即可获得命令菜单,然后键入installpackage并选择PackageControl:InstallPackage获取包管理器菜单。在该菜单中,键入ERB并在看到包时选择

随机推荐