Redis开发与运维
付磊,张益军 著
- 出版社: 机械工业出版社
- ISBN:9787111557975
- 版次:1
- 商品编码:12121730
- 品牌:机工出版
- 包装:平装
- 丛书名: 数据库技术丛书
- 开本:16
- 出版时间:2017-03-01
- 用纸:胶版纸
编辑推荐
从开发、运维两个角度总结了Redis实战经验,深入浅出地剖析底层实现,包含大规模集群开发与运维的实际案例、应用技巧。
全面覆盖Redis 3及以上版本的基本功能及应用,提供了大量手绘版图片,细腻讲解底层实现机制
内容简介
本书全面讲解Redis基本功能及其应用,并结合线上开发与运维监控中的实际使用案例,深入分析并总结了实际开发运维中遇到的“陷阱”,以及背后的原因, 包含大规模集群开发与管理的场景、应用案例与开发技巧,为高效开发运维提供了大量实际经验和建议。本书不要求读者有任何Redis使用经验对入门与进阶DevOps的开发者提供有价值的帮助。主要内容包括:Redis的安装配置、API、各种高效功能、客户端、持久化、复制、高可用、内存、哨兵、集群、缓存设计等,Redis高可用集群解决方案,Redis设计和使用中的问题,最后提供了一个开源工具:Redis监控运维云平台CacheCloud。
作者简介
付磊 搜狐视频高级研发工程师,CacheCloud项目联合创始人。拥有多年Redis开发运维经验,为公司多个核心业务提供Redis服务,同时热衷于技术传播和分享,撰写了大量关于Redis开发运维的技术文章。微博号carlosfl,博客地址是http://carlosfu.iteye.com。
张益军 搜狐视频资深研发工程师,CacheCloud项目联合创始人,曾就职于美团、阿里巴巴等公司。搜狐视频投放组负责人,目前从事投放平台、反作弊等系统的架构设计和优化工作。研究兴趣包括海量峰值访问、分布式存储等。微博号益军YJ, 博客地址是http://hot66hot.iteye.com。
精彩书评
Redis在当今高性能架构中,发挥越来越重要的作用。本书对于体系性学习及掌握Redis,有非常好的参考作用。
——杨卫华(Tim Yang),新浪微博研发副总经理
作者对内存的介绍做到了深入浅出,讲清楚了重要的What、How。由于我从事分布式系统的开发,因此非常欣慰地看到写底层/infra领域的书籍,期待更多这方面的作品。写书是非常辛苦的,需要投入大量的时间,非常感谢两位作者艰苦卓绝的工作。
——刘奇,PingCAP CEO && TiDB/TiKV 创始人,Codis联合作者
本书是付磊和张益军在几个大型项目中积累的Redis开发与运维的宝贵经验,既有原理功能使用详解,又有实际踩坑排雷经验分享,最后一章对开源项目CacheCloud作了详细的讲解,是Redis开发、运维人员值得收藏的好书。
——田文宝,搜狐视频技术总监
这本书不仅介绍了Redis的使用方法 ,更难能可贵的是,作者在书中把使用和维护Redis时经常会碰到的问题一一列举了出来,并给出了相应的解决方案。通过了解这些方案,读者可以有效地避免使用Redis时会遇到的一些陷阱,并学会如何更好地使用Redis。
——黄健宏,《Redis设计与实现》作者
Redis是目前*流行的kv存储。本书从Redis的客户端使用,到内部的实现原理,最后到运维,都给出翔实的解决方案,是Redis从入门到精通的一本好书。
——陈宗志,360基础架构组技术经理,pika作者
作者不仅详细地介绍Redis运维经验,而且深入浅出地剖析底层实现,让读者不仅知其然,也知其所以然。Redis的集群运维绝非是一件容易的事儿,读此书,可以少走一些弯路,绕过一些“坑”。
——张海雷,优酷土豆广告团队资深工程师
这本书中Redis集群、开发运维陷阱、缓存设计和CacheCloud章节尤为精彩,都来自一线运维开发Redis的宝贵实战经验。相信无论是DBA还是研发工程师都能从本书收获新的知识。
——卓汝林,小米高级DBA
DevOps文化盛行,开发和运维的界线越来越模糊,在Redis的实践中本书应运而生。本书通过Redis开发运维详实的介绍,结合真实项目凝聚*佳实战经验,值得细细品味。
——李成武,阿里巴巴技术专家
目录
序 言
前 言
致 谢
第1章 初识Redis 1
1.1 盛赞Redis 1
1.2 Redis特性 2
1.3 Redis使用场景 5
1.3.1 Redis可以做什么 5
1.3.2 Redis不可以做什么 5
1.4 用好Redis的建议 6
1.5 正确安装并启动Redis 6
1.5.1 安装Redis 7
1.5.2 配置、启动、操作、关闭Redis 8
1.6 Redis重大版本 11
1.7 本章重点回顾 14
第2章 API的理解和使用 15
2.1 预备 15
2.1.1 全局命令 15
2.1.2 数据结构和内部编码 18
2.1.3 单线程架构 19
2.2 字符串 21
2.2.1 命令 22
2.2.2 内部编码 27
2.2.3 典型使用场景 28
2.3 哈希 31
2.3.1 命令 32
2.3.2 内部编码 35
2.3.3 使用场景 36
2.4 列表 38
2.4.1 命令 38
2.4.2 内部编码 43
2.4.3 使用场景 44
2.5 集合 46
2.5.1 命令 46
2.5.2 内部编码 50
2.5.3 使用场景 51
2.6 有序集合 52
2.6.1 命令 53
2.6.2 内部编码 59
2.6.3 使用场景 59
2.7 键管理 60
2.7.1 单个键管理 60
2.7.2 遍历键 67
2.7.3 数据库管理 70
2.8 本章重点回顾 73
第3章 小功能大用处 74
3.1 慢查询分析 74
3.1.1 慢查询的两个配置参数 75
3.1.2 最佳实践 77
3.2 Redis Shell 78
3.2.1 redis-cli详解 78
3.2.2 redis-server详解 82
3.2.3 redis-benchmark详解 83
3.3 Pipeline 84
3.3.1 Pipeline概念 84
3.3.2 性能测试 85
3.3.3 原生批量命令与Pipeline对比 86
3.3.4 最佳实践 87
3.4 事务与Lua 87
3.4.1 事务 87
3.4.2 Lua用法简述 90
3.4.3 Redis与Lua 92
3.4.4 案例 94
3.4.5 Redis如何管理Lua脚本 96
3.5 Bitmaps 98
3.5.1 数据结构模型 98
3.5.2 命令 98
3.5.3 Bitmaps分析 101
3.6 HyperLogLog 102
3.7 发布订阅 105
3.7.1 命令 106
3.7.2 使用场景 108
3.8 GEO 109
3.9 本章重点回顾 112
第4章 客户端 113
4.1 客户端通信协议 113
4.2 Java客户端Jedis 117
4.2.1 获取Jedis 117
4.2.2 Jedis的基本使用方法 118
4.2.3 Jedis连接池的使用方法 122
4.2.4 Redis中Pipeline的使用方法 125
4.2.5 Jedis的Lua脚本 126
4.3 Python客户端redis-py 128
4.3.1 获取redis-py 128
4.3.2 redis-py的基本使用方法 128
4.3.3 redis-py中Pipeline的使用方法 130
4.3.4 redis-py中的Lua脚本使用方法 130
4.4 客户端管理 131
4.4.1 客户端API 132
4.4.2 客户端相关配置 145
4.4.3 客户端统计片段 145
4.5 客户端常见异常 146
4.6 客户端案例分析 149
4.6.1 Redis内存陡增 149
4.6.2 客户端周期性的超时 151
4.7 本章重点回顾 153
第5章 持久化 154
5.1 RDB 154
5.1.1 触发机制 154
5.1.2 流程说明 155
5.1.3 RDB文件的处理 156
5.1.4 RDB的优缺点 156
5.2 AOF 157
5.2.1 使用AOF 157
5.2.2 命令写入 157
5.2.3 文件同步 158
5.2.4 重写机制 159
5.2.5 重启加载 161
5.2.6 文件校验 162
5.3 问题定位与优化 162
5.3.1 fork操作 162
5.3.2 子进程开销监控和优化 163
5.3.3 AOF追加阻塞 165
5.4 多实例部署 166
5.5 本章重点回顾 167
第6章 复制 168
6.1 配置 168
6.1.1 建立复制 168
6.1.2 断开复制 170
6.1.3 安全性 170
6.1.4 只读 170
6.1.5 传输延迟 171
6.2 拓扑 171
6.3 原理 172
6.3.1 复制过程 172
6.3.2 数据同步 175
6.3.3 全量复制 178
6.3.4 部分复制 181
6.3.5 心跳 183
6.3.6 异步复制 184
6.4 开发与运维中的问题 184
6.4.1 读写分离 184
6.4.2 主从配置不一致 186
6.4.3 规避全量复制 186
6.4.4 规避复制风暴 187
6.5 本章重点回顾 188
第7章 Redis的噩梦:阻塞 189
7.1 发现阻塞 189
7.2 内在原因 191
7.2.1 API或数据结构使用不合理 191
7.2.2 CPU饱和 193
7.2.3 持久化阻塞 194
7.3 外在原因 195
7.3.1 CPU竞争 195
7.3.2 内存交换 195
7.3.3 网络问题 196
7.4 本章重点回顾 199
第8章 理解内存 200
8.1 内存消耗 200
8.1.1 内存使用统计 200
8.1.2 内存消耗划分 201
8.1.3 子进程内存消耗 203
8.2 内存管理 204
8.2.1 设置内存上限 204
8.2.2 动态调整内存上限 204
8.2.3 内存回收策略 205
8.3 内存优化 209
8.3.1 redisObject对象 209
8.3.2 缩减键值对象 210
8.3.3 共享对象池 211
8.3.4 字符串优化 213
8.3.5 编码优化 216
8.3.6 控制键的数量 223
8.4 本章重点回顾 225
第9章 哨兵 226
9.1 基本概念 226
9.1.1 主从复制的问题 227
9.1.2 高可用 227
9.1.3 Redis Sentinel的高可用性 229
9.2 安装和部署 232
9.2.1 部署拓扑结构 232
9.2.2 部署Redis数据节点 233
9.2.3 部署Sentinel节点 234
9.2.4 配置优化 236
9.2.5 部署技巧 243
9.3 API 244
9.4 客户端连接 249
9.4.1 Redis Sentinel的客户端 249
9.4.2 Redis Sentinel客户端基本实现原理 249
9.4.3 Java操作Redis Sentinel 251
9.5 实现原理 254
9.5.1 三个定时监控任务 254
9.5.2 主观下线和客观下线 256
9.5.3 领导者Sentinel节点选举 258
9.5.4 故障转移 261
9.6 开发与运维中的问题 262
9.6.1 故障转移日志分析 262
9.6.2 节点运维 268
9.6.3 高可用读写分离 271
9.7 本章重点回顾 272
第10章 集群 274
10.1 数据分布 274
10.1.1 数据分布理论 274
10.1.2 Redis数据分区 277
10.1.3 集群功能限制 278
10.2 搭建集群 278
10.2.1 准备节点 278
10.2.2 节点握手 280
10.2.3 分配槽 282
10.2.4 用redis-trib.rb搭建集群 284
10.3 节点通信 287
10.3.1 通信流程 287
10.3.2 Gossip消息 287
10.3.3 节点选择 290
10.4 集群伸缩 291
10.4.1 伸缩原理 291
10.4.2 扩容集群 293
10.4.3 收缩集群 301
10.5 请求路由 305
10.5.1 请求重定向 305
10.5.2 Smart客户端 309
10.5.3 ASK重定向 318
10.6 故障转移 323
10.6.1 故障发现 323
10.6.2 故障恢复 329
10.6.3 故障转移时间 334
10.6.4 故障转移演练 334
10.7 集群运维 336
10.7.1 集群完整性 336
10.7.2 带宽消耗 337
10.7.3 Pub/Sub广播问题 337
10.7.4 集群倾斜 338
10.7.5 集群读写分离 339
10.7.6 手动故障转移 341
10.7.7 数据迁移 344
10.8 本章重点回顾 344
第11章 缓存设计 346
11.1 缓存的收益和成本 346
11.2 缓存更新策略 347
11.3 缓存粒度控制 349
11.4 穿透优化 350
11.5 无底洞优化 352
11.6 雪崩优化 359
11.7 热点key重建优化 360
11.8 本章重点回顾 364
第12章 开发运维的“陷阱” 365
12.1 Linux配置优化 365
12.1.1 内存分配控制 365
12.1.2 swappiness 367
12.1.3 THP 369
12.1.4 OOM killer 370
12.1.5 使用NTP 371
12.1.6 ulimit 371
12.1.7 TCP backlog 372
12.2 flushall/flushdb误操作 372
12.2.1 缓存与存储 373
12.2.2 借助AOF机制恢复 373
12.2.3 RDB有什么变化 374
12.2.4 从节点有什么变化 374
12.2.5 快速恢复数据 374
12.3 安全的Redis 375
12.3.1 Redis密码机制 377
12.3.2 伪装危险命令 378
12.3.3 防火墙 380
12.3.4 bind 380
12.3.5 定期备份数据 381
12.3.6 不使用默认端口 381
12.3.7 使用非root用户启动 381
12.4 处理bigkey 382
12.4.1 bigkey的危害 382
12.4.2 如何发现 382
12.4.3 如何删除 383
12.4.4 最佳实践思路 386
12.5 寻找热点key 386
12.6 本章重点回顾 391
第13章 Redis监控运维云平台CacheCloud 392
13.1 CacheCloud是什么 392
13.1.1 现有问题 393
13.1.2 CacheCloud基本功能 393
13.2 快速部署 395
13.2.1 CacheCloud环境需求 395
13.2.2 CacheCloud快速开始 395
13.3 机器部署 397
13.3.1 部署脚本 398
13.3.2 添加机器 399
13.4 接入应用 400
13.4.1 总体流程 401
13.4.2 账户申请和审批 401
13.4.3 应用申请和审批 402
13.4.4 客户端接入 405
13.5 用户功能 407
13.5.1 应用统计信息 408
13.5.2 实例列表 409
13.5.3 应用详情 409
13.5.4 命令曲线 409
13.5.5 CacheCloud Redis Shell控制台 410
13.5.6 慢查询 410
13.5.7 应用拓扑 411
13.6 运维功能 413
13.6.1 应用运维 413
13.6.2 接入已存在的Redis节点 415
13.6.3 Redis配置模板 416
13.6.4 迁移工具 417
13.6.5 监控报警 420
13.6.6 系统配置管理 422
13.7 客户端上报 423
13.7.1 客户端上报整体设计 424
13.7.2 Jedis核心代码修改 424
13.7.3 带上报功能的客户端 426
13.7.4 CacheCloud客户端统计 427
13.8 本章重点回顾 429
第14章 Redis配置统计字典 430
14.1 info系统状态说明 430
14.1.1 命令说明 430
14.1.2 详细说明 431
14.2 standalone配置说明和分析 436
14.2.1 总体配置 436
14.2.2 最大内存及策略 437
14.2.3 AOF相关配置 437
14.2.4 RDB相关配置 438
14.2.5 慢查询配置 438
14.2.6 数据结构优化配置 439
14.2.7 复制相关配置 439
14.2.8 客户端相关配置 440
14.2.9 安全相关配置 440
14.3 Sentinel配置说明和分析 440
14.4 Cluster配置说明和分析 441
前言/序言
序 言Preface
近几年,随着移动互联网的飞速发展,我们享受着整个社会的技术进步带来的便利,但同时也给从业者带来了如何保证项目的高并发、低延时的技术挑战,相应的互联网技术也随之发生了重大变革,NoSQL技术得到了蓬勃的发展。Redis以其出色的性能、丰富的功能、良好的稳定性、分布式架构的支持等特性,得到了业界广泛的关注和应用。毫不夸张地说,Redis已经成为IT互联网大型系统的标配,熟练掌握Redis成为开发、运维人员的必备技能。
本书是作者近三年Redis开发运维的经验结晶和技术沉淀,书中对于Redis的相关知识做了系统全面的介绍,因此,可以帮助Redis初学者快速入门和提高。同时,纵观全书,作者的视角未局限于Redis本身,还融入了大量高并发系统的设计、开发及运维调优经验,而是深入浅出的剖析底层实现,让读者不仅知其然,也知其所以然。因此,对于有一定Redis使用经验的从业者,本书也有学习参考价值。
两位作者是搜狐视频的技术架构专家,始终保持对技术的热忱和严谨,对搜狐视频大型分布式系统的技术选型、架构设计、开发运维提供了坚实的保障。在承担搜狐视频个性化推荐系统等多个核心系统的设计开发运维工作期间,两位作者对高并发、低延时的大型分布式系统积累了丰富的经验,其中就包含了大量Redis的实践经验。作为公司开发运维的开拓者,从项目中抽离出Redis集群的自动运维系统CacheCloud,在公司内部多个业务线推广使用,积累了丰富的Redis大规模集群的运维优化经验。所在团队于2016年3月将该项目在GitHub上开源,由于其具有快速部署、全面监控、一键运维等特性,一开源即受到广大Redis开发运维人员的欢迎和认可。
以我对两位作者的优秀技术素养的熟知,及对他们负责项目的了解,我相信这本书会给大家带来耳目一新的感觉。感谢两位作者对开源项目CacheCloud的贡献,更难能可贵的是他们将其开发运维的宝贵经验汇聚成册,给我们带来了这样一本好书。
马义
搜狐视频产品技术中心总经理、56网总经理
2016年11月
前 言Introduction
Redis作为基于键值对的NoSQL数据库,具有高性能、丰富的数据结构、持久化、高可用、分布式等特性,同时Redis本身非常稳定,已经得到业界的广泛认可和使用。掌握Redis已经逐步成为开发和运维人员的必备技能之一。
本书关注了Redis开发运维的方方面面,尤其对于开发运维中如何提高效率、减少可能遇到的问题进行详细分析,但本书不单单介绍怎么解决这些问题,而是通过对Redis重要原理的解析,帮助开发运维人员学会找到问题的方法,以及理解背后的原理,从而让开发运维人员不仅知其然,而且知其所以然。
本书涵盖内容
第1章 初识Redis,带领读者进入Redis的世界,了解它的前世今生、众多特性、应用场景、安装配置、简单使用,最后对Redis发展过程中的重要版本进行说明,可以让读者对Redis有一个全面的认识。
第2章 API的理解和使用,全面介绍了Redis提供的5种数据结构字符串(string)、哈希(hash)、列表(list)、集合(set)、有序集合(zset)的数据模型、常用命令、典型应用场景,并且每个小节都会给出在Redis开发过程可能要注意的坑和技巧。同时本章还会对Redis的单线程处理机制、键值管理做一个全面介绍,通过对这些原理的理解,读者可以在合适的应用场景选择合适的数据结构和命令进行开发,有效提高程序效率,降低可能产生的问题和隐患。
第3章 小功能大用处,除了5种数据结构外,Redis还提供了诸如慢查询、Redis Shell、Pipeline、Lua脚本、Bitmaps、HyperLogLog、发布订阅、GEO等附加功能,在这些功能的帮助下,Redis的应用场景更加丰富。
第4章 客户端,本章重点关注Redis客户端的开发,介绍了Redis的客户端通信协
议、详细讲解了Java客户端Jedis的使用技巧,同时通过从原理角度剖析在开发运维中,客户端的监控和管理技巧,最后给出客户端开发中常见问题以及案例讲解。
第5章 持久化,Redis的持久化功能有效避免因进程退出造成的数据丢失问题,本章首先介绍RDB和AOF两种持久化配置和运行流程,其次对常见的持久化问题进行定位和优化,最后结合Redis常见的单机多实例部署场景进行优化。
第6章 复制,在分布式系统中为了解决单点问题,通常会把数据复制多个副本部署到其他机器,用于故障恢复和负载均衡等需求,Redis也是如此。它为我们提供了复制(replication)功能,实现了多个相同数据的Redis副本。复制功能是高可用Redis的基础,后面章节的哨兵和集群都是在复制的基础上实现高可用。
第7章 Redis的噩梦:阻塞,Redis是典型的单线程架构,所有的读写操作都在一条主线程中完成的。当Redis用于高并发场景时这条线程就变成了它的生命线。如果出现阻塞哪怕是很短时间对于我们的应用来说都是噩梦。导致阻塞问题的场景大致分为内在原因和外在原因,本章将进行详细分析。
第8章 理解内存,Redis所有的数据存在于内存中,如何高效利用Redis内存变得非常重要。高效利用Redis内存首先需要理解Redis内存消耗在哪里,如何管理内存,最后再深入到如何优化内存。掌握这些知识后相信读者能够实现用更少的内存存储更多的数据从而降低成本。
第9章 哨兵,Redis从2.8版本开始正式提供了Redis Sentinel,它有效解决了主从复制模式下故障转移的若干问题,为Redis提供了高可用功能。本章将一步步解析Redis Sentinel的相关概念、安装部署、配置、命令使用、原理解析,最后分析了Redis Sentinel运维中的一些问题。
第10章 集群,是本书的重头戏,Redis Cluster是Redis 3提供的Redis分布式解决方案,有效解决了Redis分布式方面的需求,理解应用好Redis Cluster将极大的解放我们对分布式Redis的需求,同时它也是学习分布式存储的绝佳案例。本章将针对RedisCluster的数据分布,搭建集群,节点通信,请求路由,集群伸缩,故障转移等方面进行分析说明。
第11章 缓存设计,缓存能够有效加速应用的读写速度,以及降低后端负载,对于开发人员进行日常应用的开发至关重要,但是将缓存加入应用架构后也会带来一些问题,本章将介绍缓存使用和设计中遇到的问题,具体包括:缓存的收益和成本、缓存更新策略、缓存粒度控制、穿透问题优化、无底洞问题优化、雪崩问题优化、热点key优化。
第12章 开发运维的“陷阱”,介绍Redis开发运维中的一些棘手问题,具体包括:Linux配置优化、flush误操作数据恢复、如何让Redis变得安全、bigkey问题、热点key问题。
第13章 Redis监控运维云平台CacheCloud,介绍笔者所在团队开源的Redis运维工具CacheCloud,它有效解决了Redis监控和运维中的一些问题,本章将按照快速部署、机器部署、接入应用、用户功能、运维功能多个维度全面的介绍CacheCloud,相信在它的帮助下,读者可以更好的监控和运维好Redis。
第14章 Redis配置统计字典,会对Redis的系统状态信息以及全部配置做一个全面的梳理,希望本章能够成为Redis配置统计字典,协助大家分析和解决日常开发和运维中遇到的问题。
目标读者
本书深入浅出地介绍了Redis相关知识,因此可以作为Redis新手的入门教程,同时本书凝聚了两位笔者在Redis开发运维的多年经验,对于需要进一步提高Redis开发运维能力的读者也非常适合。读者可以参考下图,结合自身对于开发运维的需求进行阅读,但笔者依然建议读者对每一章都进行阅读。
读者反馈和勘误
由于笔者能力有限,书中难免会存在错误和疏漏,读者有任何意见和建议可以通过发送邮件、网站留言,或者直接在QQ群留言,我们会在第一时间进行反馈。
邮箱:redis_devops_book@163.com
网站:https://cachecloud.github.io/,该网站持续更新Redis开发运维的相关知识和经验。
QQ群:534429768
著者
2016年9月
致 谢Acknowledgements
感谢业内众多Redis专家对于本书的审阅,他们分别是黄健宏、杨卫华(Tim Yang)、刘奇、卓汝林、黄鹏程、张海雷、诸超、陈宗志、李成武,他们为本书提出很宝贵的意见和建议。
感谢我们公司的领导和同事,没有他们的帮助和支持,本书无法按时完成,他们是马义、田文宝、闵博、陈实、张啸丰、赵欣莅、张文、董刚锋 、赵路、高永飞、曾旭、孙孟萌、田文龙、庞云龙、李明月、戴育东、单颖博、唐虎、贺永明、郭岭、谷海波。
我们要感谢机械工业出版社的吴怡编辑对我们写作的支持、鼓励和指导,她一丝不苟的工作态度让人钦佩。
最后,我们要感谢家人和朋友,感谢在写书期间他们的支持和鼓励,从而让本书顺利完成。