通过上面2节,大家了解到了RDBMS遇到的问题,以及对Cassandra有了基本的了解。下面将介绍下Cassandra内部简单结构。
通过本章,大家应该了解到:
- Cassandra Write流程
- 什么是SSTable
- Cassandra Read流程
- Cassandra Write流程
- Writes可以被写入到集群中的任意节点
- Writes被写入到commit log,同时写到memtable
- 每一个write包含一个timestamp
- Memtable定期flush到硬盘中(sstable) 当memtable的内容超过了其配置的限制,它包含的数据就会被放到一个队列中并刷新到磁盘。你可以通过修改cassandra.yaml中 memtable_flush_queue_size的值来改变队列的长度
- 新的memtable在内存中创建
- 删除是一种特殊write,称之为”tombstone”(墓碑)
- 什么是SSTable
SSTable有序字符串表(Sorted String Table),是从Google的Bigtable里借鉴过来的概念。一旦memtable被刷写入磁盘,成为一个SSTable,它就是不可变的了。
特点如下:
- 数据文件:存储记录,不可变
- 每一个write包含一个timestamp
- Partition被分割到多个SSTable
- 新的memtable在内存中创建
- 通过compaction合并,只保存最新的timestamp
- 删除被标记为tombstone
- Cassandra Read流程
- 任何server都可以作为coordinator被查询
- 通过查询key定位交互的nodes
- 在每一个node上,数据都是从SSTable拉取并合并
- 一致性< ALL时,将会在后台执行read repaire(read_repaire_chance)