背景
最近有一个业务需要同时写两个表,并且需要保证数据的正确性。我们的项目线上的 MongoDB 版本是 4.0,查了一下发现 4.0 版本的 MongoDB 已经支持副本集中的事务了,于是做了一下调研。
准备环境
鉴于 MongoDB 的事务支持需要在副本集中才生效,我用 Docker-Compose 部署了一个一主两从结构的 4.0 版本 MongoDB 副本集(部署过程参考了文章)。
初始化数据
假设有两个表,订单表(orders
)和库存表(inventory
), 对于一个下单行为:创建一个购买了商品 A x 件的订单,需要增加一条 orders 表记录表明购买了 x 件商品 A,同时商品 A 对应的库存表记录的库存也要减少 x 件。
123456 | import pymongoclient = pymongo.MongoClient(host="mongodb://root:123@localhost:37011")db = client.get_database("test")db.inventory.insert_one({"sku": "abc", "qty": 100000}) |
---|
在代码中我们初始化了十万件商品 abc。
编写事务代码
123456789101112131415161718192021222324252627282930313233343536 | import pymongoimport sysclient = pymongo.MongoClient(host="mongodb://root:123@localhost:37011")db = client.get_database("test")with client.start_session() as session: with session.start_transaction(): print( db.orders.insert_one( {"sku": "abc", "qty": 1000}, session=session, ).inserted_id ) # sys.exit(0) print( db.inventory.find_one_and_update( {"sku": "abc"}, {"$inc": {"qty": -1000}}, return_document=pymongo.ReturnDocument.AFTER, session=session, ) )print( list( db.orders.aggregate( [ {"$match": {"sku": "abc"}}, {"$group": {"_id": None, "total": {"$sum": "$qty"}}}, ] ) )[0]) |
---|
我们将增加订单
与修改库存
的操作放到一个事务里,并观察abc
商品在所有订单中的数量和和其库存剩余。
验证
可以看到在正常执行的情况下聚合的 abc 商品的销量与库存的 abc 商品的数量总和始终为 100000。
事务中断
我们取消对sys.exit(0)
所在行代码的注释,模拟创建订单后接口异常退出的情况(此时还没有修改商品的库存)。
我们可以检查一下事务中断前插入订单记录有没有被回滚删除掉。
结果是这两条记录并不存在,对于终端用户来说订单并没有创建成功。
我们再重新注释掉sys.exit(0)
语句,看一下现在的商品abc
的数量。
可以看到商品abc
的已售出数量和库存剩余数量之和仍然为十万,失败的事务并没有影响到数据正确。
总结
在 MongoDB 4.0 版本中,我们已经可以使用数据库事务来保证多表操作下数据的正确性了,不过事务始终会对数据库性能造成一定的影响,能在业务层面避免同时操作多表就再好不过了。