MongoDB并购了WiredTiger及其关系数据库存储引擎以来,很多技术专家一直翘首以待MongoDB何时提供对跨文档事务(multi-document transaction)的支持。MongoDB在本周宣布,跨文档事务有望于今年夏天加入到MongoDB 4.0中。
据MongoDB的Grigori Melnik宣称,“80%到90%的应用是完全不需要跨文档事务的”。然而他的说法有待商榷,在层次数据库中很有可能存在大量的反规范化(denormalized)数据,此类数据需要支持多地同时更新以确保一致性。Melnik继续指出:
此外,一些开发人员和数据库管理员受限于业已存在40多年的关系数据建模,总是误以为多表或多文档事务是所有数据库的要求,无论实际需要构建何种数据模型。其他一些人则担心,虽然他们的应用当前不需要跨文档事务,但将来可能会需要,他们不希望过度扩展他们的数据库。
跨文档事务是ACID的基石。MongoDB自3.0版起,开始支持跨文档事务。在3.0版中,MongoDB具备了多版本并发控制(MVCC)技术,该技术是一种快照隔离技术,通常是由PostgreSQL和Oracle等关系数据库提供。最新版本的SQL Server也使用MVCC实现其“内存优化”表。
MongoDB 3.2增加了对“读取关注”(Read Concern)的支持。在3.2版之前,客户只有知道进行通信的节点时,才会接收数据。读取关注功能允许客户请求为大多数节点所知的数据。需要注意的是,根据文档介绍,“无论读取的关注级别,节点上的最新数据可能并未反映系统中数据的最新版本。”
MongoDB之后在3.6版中提供了其所宣称的“因果一致性”。在以前的MongoDB版本中,并不能保证操作是按指定顺序进行的。例如,当删除一组记录后再执行一次读取操作时,可能会返回刚被删除的记录。使用因果一致性,用户可以指明读取操作取决于写操作的结果,确保了在执行读取操作之前先完成删除操作。
最后一点,MongoDB 4.0将提供执行一致性读取的能力。也就是说,MongoDB只返回数据库在读取操作开始时已知的数据。正如在InfoQ文章“[事务隔离级别和脏读的快速入门]http://www.infoq.com/cn/articles/Isolation-Levels)”中所介绍的,以前版本的MongoDB返回的结果可能和任何时间点都不一致。它甚至可能跳过一些文档,或是在一次查询中返回同一文档的多个版本。
希望想要试用跨文档事务的开发人员,积极加入到MongoDB 4.0 beta计划中。