文章目录
- AOF
- 概念
- 如何使用AOF
- AOF工作流程
- 命令写入演示
- 文件同步策略
- `AOF`的重写机制
- 概念
- 触发重写机制
- `AOF`重写流程
- 启动时数据恢复
- 混合持久化
- 总结
AOF
概念
AOF
持久化:以独立日志的方式记录每次的写命令,重启时再重新执行AOF
文件中的命令达到恢复数据的目的.AOF
的主要作用是解决了数据持久化的实时性,目前已经是Redis
持久化的主流方式.
如何使用AOF
开启AOF
功能需要修改配置文件:appendonly yes
,默认情况下不开启.AOF
文件名通过appendfilename
配置(默认是appendonly.aof
)设置.保存目录同时RDB
持久化方式一致,通过dir
配置指定.(注意:当开启AOF
的时候,RDB
一般就不会生效了)
-
打开配置文件
vim /etc/redis/redis.conf
,将该位置修改为appendonly yes
-
可修改
AOF
文件名:
-
保存目录:
AOF工作流程
- 所有的写入命令会追加到
aof_buf
缓冲区中 AOF
缓冲区根据对应的策略向硬盘做同步操作- 随着
AOF
文件越来越大,需要定期对AOF
文件进行重写,达到压缩目的- 重写:在最终结果一致的情况下,可以剔除命令中一些比较冗余的操作
- 当
Redis
服务器启动实词,可以加载AOF
文件进行数据恢复
命令写入演示
- 我们在配置文件中打开
AOF
持久化后,当我们输入命令时,在var/lib/redis
目录中自动出现了一个新的目录:appendonlydir
- 打开
appendonlydir
目录
-rw-r--r-- 1 root root 88 Oct 6 20:39 appendonly.aof.1.base.rdb
-rw-r--r-- 1 root root 73 Oct 6 20:39 appendonly.aof.1.incr.aof
-rw-r--r-- 1 root root 88 Oct 6 20:39 appendonly.aof.manifest
-
appendonly.aof.1.base.rdb
:这是Redis AOF
文件的基础RDB
(Redis Database Backup
)文件,通常用于在AOF
恢复时提供一个初始的数据库状态。 -
appendonly.aof.1.incr.aof
:这是增量AOF
文件,包含自上次RDB
快照以来对数据库的所有写操作。它是AOF
的核心部分。 -
appendonly.aof.manifest
:这是AOF
文件的清单,包含有关AOF
文件的元数据,如版本、文件大小等。
注意:AOF
命令写入的内容直接是文本协议格式.例如:set key111 11111111111111111;
这条命令,在AOF
文件中会追加如下文本:
疑问1:AOF
作为一种实时备份的持久化方式,是否会影响Redis
的性能呢?
答案: 不会
原因:
AOF
会先写入内存缓冲区aof_buf
中,然后一次性刷入磁盘中,这样可以减少磁盘IO
AOF
在磁盘中时顺序读写,新的命令会追加到原本的文件中
疑问2:AOF
过程中为什么需要aof_buf
这个缓冲区?
Redis
使用单线程响应命令,如果每次写AOF
文件都直接同步到硬盘中,性能就会从内存的读写变成IO
读写,性能必然下降.所以,先写入缓冲区中可以有效减少IO
次数,同时,Redis
还可以提供多种缓冲区同步策略,让用户根据自己的需求做出合理的平衡.
文件同步策略
Redis
提供了多种AOF
缓冲区同步文件策略,由参数appendfsync
来控制.
在配置文件中:
可配置值 | 说明 |
---|---|
always | 命令写入aof_buf 后调用fsync 同步,完成后返回 |
everysec (默认设置) | 命令写入aof_buf 后只执行write 操作,不进行fsync .每秒由同步线程进行fsync |
no | 命令写入aof_buf 后只执行write 操作,由OS 控制fsync 的频率 |
上述的同步文件策略,数据写入磁盘的频率由高到低,性能由低到高
系统调用write
和fsync
说明:
write
会触发延迟写机制.Linux
在内核提供页缓冲区用来提升硬盘IO
性能.write
操作在写入系统缓冲区后立即返回.同步硬盘操作依赖于系统调度控制,例如:缓冲区页空间写满或者达到了特定的时间周期.同步文件之前,如果此时系统故障宕机,缓冲区内数据将会丢失.(即 将内存中的数据先写入到内核的页缓冲区中,再由系统调度控制同步硬盘操作)Fsync
针对单个文件操作,做强制硬盘同步,fsync
将阻塞直到数据写入到硬盘
- 配置
always
时,每次写入都要同步AOF
文件,性能很差,在一般的SATA
硬盘上,只能支持大约几百TPS
写入.除非是非常重要的数据,否则不建议配置. - 配置为
no
时,由于操作系统同步策略不可控,虽然提高了性能,但是数据丢失风险大增,除非数据的重要程度很低,否则不建议配置 - 配置为
svseysec
,是默认配置,也是推荐配置,兼顾了数据安全性和性能.理论上最多丢失1
秒的数据
AOF
的重写机制
概念
随着命令不断写入AOF
,文件会越来越大,为了解决这个问题,Redis
引入了AOF
重写机制用来压缩文件的体积.AOF
文件重写是把Redis
进程内的数据转化为写命令同步到新的AOF
文件中
重写后的AOF
文件体积为什么可以变小:
- 进程内已经超时的数据不再写入到文件中
- 旧的
AOF
中的无效命令,例如del
,hdel
,srem
等重写后将会删除,只需要保留数据的最终版本 - 多条写操作合并为一条,例如:
lpush list a
,lpush list b
,lpush list c
可以合并为lpush list a b c
.
较小的AOF
文件一方面降低了硬盘空间的占用,一方面可以提升启动Redis
时数据恢复的速度
触发重写机制
触发重写机制分为:手动触发和自动触发
- 手动触发:调用
bgrewriteaof
命令 - 自动触发:根据
auto-aof-rewrite-min-size
和auto-aof-rewrite-percentage
参数确定自动触发的时机(在配置文件中可自行配置)auto-aof-rewrite-min-size
:表示触发重写时AOF
的最小文件大小,默认为64MB
auto-aof-rewrite-percentage
:代表当前AOF
占用大小相比较上次重写时增加的比例
AOF
重写流程
- 执行
AOF
重写请求:如果当前进程正在执行AOF
重写,请求不执行.如果当前进程正在执行bgsave
操作,冲写命令延迟到bgsave
执行结束之后再执行 - 父进程执行
fork
创建子进程 - 重写:不关心原来的
AOF
文件的状态,子进程只需要把内存中当前的数据获取出来,再以AOF
的格式写入到一个新的AOF
文件中- 主进程
fork
之后,继续响应其他命令.所有修改操作写入AOF
缓冲区之后再根据appendfsync
策略同步到硬盘中,保证旧AOF
文件机制正确 - 子进程只有
fork
之前的所有内存信息,父进程中需要将fork
之后这段时间的修改操作写入到AOF
重写缓冲区中
- 主进程
- 子进程根据内存快照,将命令合并到新的
AOF
文件中去 - 子进程完成重写
- 新文件写入后,子进程发送信号给父进程
- 父进程把
AOF
重写缓冲区内临时保存的命令追加到新的AOF
文件中 - 用新
AOF
文件替换老的AOF
文件
启动时数据恢复
当Redis
启动时,会根据RDB
和AOF
文件的内容,进行数据恢复
根据持久化文件进行数据恢复
混合持久化
混合持久化结合了RDB
和AOF
的特点,按照aof
的方式,每一个请求/操作,都记录写入aof-use-rdb-preamble
文件中,在触发aof
重写之后,就会把当前的内存状态按照rdb
的二进制格式写入到新的AOF
文件中,后续在进行操作,仍然是按照aof
的文本格式追加到文件后面
总结
Redis
提供了两种持久化的方案:RDB
和AOF
RDB
视为内存快照,产生的内容更为紧凑,占用空间小,恢复速度更快.但是产生RDB
的开销较大,不适合进行实时持久化,一般用于冷备和主从复制AOF
视为对修改命令保存,在恢复时需要重放命令.并且有重写机制来定期压缩AOF
文件RDB
和AOF
都是用fork
来创建子进程,利用Linux
子进程拥有父进程内存快照的特点来进行持久化,尽可能不影响主进程继续处理后续命令.