Hi~朋友,关注置顶防止错过消息
Clustered Collection在MongoDB中索引和Document存储在同一个WiredTiger文件中,存储和索引更加高效,MongoDB 5.3以后支持创建聚簇集合,创建方式如下:
db.createCollection(
"stocks",
{ clusteredIndex: { "key": { _id: 1}, "unique": true, "name": "stocks clustered key"} }
)
创建该类型的结合时需要指定clusteredIndex此参数,已经存在的表可以通过以下命令检测是否时聚簇集合:
db.getCollectionInfos({name: "collection name"});
Clustered Collection好处
- 不需要二级索引即可对集合进行快速查找
- 具有更小的存储大小,更高的查询和批量插入性能
- 不需要TTL Index,在clusteredIndex可以指定expireAfterSeconds,但是当作为TTL index来使用的时候_id字段必须为date类型,删除性能更加高效
- 插入、删除、更新和查询有额外的性能改进,聚簇集合按照id将索引和文档存储在一起,只需要一次查询即可完成读取,一次写入完成更新,但是非聚簇集合将id索引和文档分开存储,写入和读取都需要两次。
Clustered Collection限制
- index key必须是{_id: 1}
- 不可以将一个非聚簇集合转换为聚簇集合
- 不可以隐藏cluster index
- 在有二级索引的情况下,聚簇集合可能比非聚簇集合占用更大空间,因为二级索引需要更多的存储来存储聚簇键的引用,尤其时当聚簇键比较大时
- 聚簇集合不可以是Capped集合
Clustered Collection自定义Index Key和value
通常情况下, clustered index key values会使用Document的ObjectId,但是也可以自定key value,但是key需要满足以下条件:
- 值必须唯一
- 值不可变
- 值尽可能递增,递增的值会提高插入性能
- key所占的空间尽可能小,更小的key,集合和二级索引占用空间会更加小