MongoDB Clustered Collection

2024-06-03 10:51:23 浏览数 (2)

Hi~朋友,关注置顶防止错过消息

Clustered Collection在MongoDB中索引和Document存储在同一个WiredTiger文件中,存储和索引更加高效,MongoDB 5.3以后支持创建聚簇集合,创建方式如下:

  1. db.createCollection(
  2. "stocks",
  3. { clusteredIndex: { "key": { _id: 1}, "unique": true, "name": "stocks clustered key"} }
  4. )

创建该类型的结合时需要指定clusteredIndex此参数,已经存在的表可以通过以下命令检测是否时聚簇集合:

  1. db.getCollectionInfos({name: "collection name"});

Clustered Collection好处

  • 不需要二级索引即可对集合进行快速查找
  • 具有更小的存储大小,更高的查询和批量插入性能
  • 不需要TTL Index,在clusteredIndex可以指定expireAfterSeconds,但是当作为TTL index来使用的时候_id字段必须为date类型,删除性能更加高效
  • 插入、删除、更新和查询有额外的性能改进,聚簇集合按照id将索引和文档存储在一起,只需要一次查询即可完成读取,一次写入完成更新,但是非聚簇集合将id索引和文档分开存储,写入和读取都需要两次。

Clustered Collection限制

  • index key必须是{_id: 1}
  • 不可以将一个非聚簇集合转换为聚簇集合
  • 不可以隐藏cluster index
  • 在有二级索引的情况下,聚簇集合可能比非聚簇集合占用更大空间,因为二级索引需要更多的存储来存储聚簇键的引用,尤其时当聚簇键比较大时
  • 聚簇集合不可以是Capped集合

Clustered Collection自定义Index Key和value

通常情况下, clustered index key values会使用Document的ObjectId,但是也可以自定key value,但是key需要满足以下条件:

  • 值必须唯一
  • 值不可变
  • 值尽可能递增,递增的值会提高插入性能
  • key所占的空间尽可能小,更小的key,集合和二级索引占用空间会更加小

0 人点赞