您的位置:首页 > 汽车 > 新车 > 自建房设计网站推荐_最好免费观看高清视频直播_网站推广优化网址_seo网络推广员招聘

自建房设计网站推荐_最好免费观看高清视频直播_网站推广优化网址_seo网络推广员招聘

2025/1/7 14:39:13 来源:https://blog.csdn.net/mirai_D_zoro/article/details/142532700  浏览:    关键词:自建房设计网站推荐_最好免费观看高清视频直播_网站推广优化网址_seo网络推广员招聘
自建房设计网站推荐_最好免费观看高清视频直播_网站推广优化网址_seo网络推广员招聘

数据库在发生故障时,内存中的脏数据库可能还没有刷入磁盘,所以有部分数据是丢失的,此时直接启动数据库可能就会因为数据的不一致而导致数据库启动失败。但是,由于WAL日志都已经写入磁盘,因此就需要在启动时借助WAL日志恢复数据使数据库处于一致状态。
数据库在重启时会调用startupXog函数进行故障恢复。故障恢复的类型主要有三种:

  • 备节点恢复: 主备模式下,备节点启动时重启流复制时的恢复动作,当数据目录下存在stanby.signal文件时触发。
  • PITR恢复: 通过归档的日志文件进行恢复,当数据目录下存在recovery.signal文件时触发,数据库进行PITR操作,会根据recovery_taget进行回访。
  • 普通的故障恢复,回放redo后的日志,使数据库处于一致状态。

流程

  • 预处理
    • 判断数据库状态,是否为异常关闭
    • 判断pg_wal/archive_status目录是否存在,不存在就创建
    • 清理pg_wal下的临时文件
    • 判断恢复类型,通过判断是否存在standby.signal或recovery.signal文件确定,如果是备机恢复设置 ArchiveRecoveryRequested和StandbyModeRequested为true,如果是PITR设置ArchiveRecoveryRequested为true。
  • 启动XLOG读取器,注册XLOG读取函数
  • 如果存在backup_label文件,优先从backup_label文件中获取checkpoint位置信息,如果不存在就从pg_control文件中读取相关信息。
  • 根据读取到的checkpoint信息初始化全局共享变量
  • 初始化其他日志,如CLOG,MultiXact日志等
  • 更新redo LSN信息
  • 开始进行故障恢复
    • 更新pg_control文件
    • 恢复前检查,如确认GUC参数是否有效,快照是否删除
    • 初始化XLogCtl
    • 从redo位置开始读取XLOG记录
    • 调用对应日志类型的redo函数,进行回放
    • 读取下一条XLOG记录
  • 执行cleanup函数清理相关日志
  • 执行其他清理工作
  • 立即执行一次checkpoint

故障恢复

函数流程

- StartupXLOG

故障恢复主函数

  • 判断上一次数据库结束时的状态,从而判断故障类型:比如正常关机时shutdown,突然宕机是in production。
  • 清理临时文件,上一次数据库停止时残留的临时文件,如pg_wal目录下的临时日志文件(xlogtemp.xx)
  • 判断故障恢复类型,调用readRecoverySignalFile函数,通过判断数据目录下的恢复文件来判断,判断结果保存到全局变量ArchiveRecoveryRequested和StandbyModeRequested下。
    • 存在standby.signal文件:表明是standby流复制模式下的恢复
      ArchiveRecoveryRequested=true
      StandbyModeRequested=true
    • 存在recovery.signal文件:表明是正常模式下的恢复
      ArchiveRecoveryRequested=true
      StandbyModeRequested=false
  • 启动XLOG日志文件读取器,通过xlogreader创建一个读取流,下面会循环读取WAL日志中的每一个XLOG record,解析其数据后进行回放。
  • 判断恢复位置,即重放WAL日志的redo位置。主要通过两种途径获取:backup_label和pg_control,如果数据目录下存在backup_label文件,将会从backup_label文件中读取最近一次Checkpoint的位置;如果backup_label文件不存在,则会从pg_control中记录的最近一次Checkpoint位置。
    • backup_label文件:一般用于归档恢复,记录了恢复所需的一些关键信息,比如恢复的起始位置,Checkpoint位置、开始时间、时间线等信息。
    • pg_control文件:记录这数据库运行过程中的关键信息,包括数据库状态,ID、Checkpoint位置等信息,在数据库运行过程中实时更新。
  • 根据最近的Checkpoint位置,从WAL日志中读出Checkpoint记录,获取相关数据库信息。
  • 根据获取的数据库信息,初始化数据库全局的信息,如ShmemVariableCache变量保存的nextXid,nextOid等信息。
  • 启动其他组件,如:replicationSlots,RecordBuffer,CLOG ,MultiXact,CommitTs,ReplicationOrigin等;重新加载两阶段提交数据
  • 判断是否进入恢复模式,进入恢复模式的条件:
    • Checkpoint中记录的redo位置小于pg_control中记录的位置,说明记录有问题,需要通过WAL恢复。
    • 数据库不是正常关机,即数据库的状态不能是shutdown。
    • ArchiveRecoveryRequested为true,即存在recovery.signal或standby.signal
  • 进入恢复流程:不是恢复模式的话,这里跳过
    • 更新pg_control的中数据库的状态,如果是归档恢复,将状态更新为DB_IN_ARCHIVE_RECOVERY;如果是故障恢复,将状态更新为DB_IN_CRASH_RECOVERY;
    • 更新pg_control的中其他信息:如Checkpoint,checkPointCopy,time等信息。更新完之后写入pg_control文件中。
    • 恢复前的其他处理:如GUC参数检查,重置unlogged表,删除保存的快照文件等。
    • 初始化资源管理器,调用每种资源管理器的startup函数。
    • 初始化XLOG读写相关的全局变量,如XLogCtl,CLogReceiptTime。
    • 检查恢复是否处于一致状态,如果是,这时候就可以接受只读的连接了。
    • 读取一个XLOG Record记录,通过函数ReadRecord函数读取。
    • 解析XLOG Record中的数据,并进行回放
    • 回放操作流程:循环读取XLOG Record数据并根据XLOG类型调用对应的redo函数进行回放。
      • 处理中断信息
      • 更新时间线
      • 调用对应日志类型的redo函数,进行回放
    • 回放结束,调用资源管理中的cleanup函数,清理相关资源
  • 先关闭WAL receiver进程,因为我们还没有写入关键的Checkpoint数据
  • 如果是恢复模式的话,还需要重置unlogged表。
  • 确定下一次要写的XLOG Record位置。
  • 判断是否需要分配新的时间线。如果是归档恢复模式,必须分配一个新的时间线;正常的故障恢复的话,可以沿用原来的时间线。
  • 更新XLOG插入相关的全局变量,如Insert下的PrevBytePos和CurrBytePos,XLOGCtl下的LogwrtResult和LogwrtRqst。
  • 如果在恢复模式下,主动触发一次checkpoint
  • 如果在归档恢复下,执行一次归档命令,归档对应的WAL日志文件,删除旧的日志文件。
  • 向前预分配一个日志文件。目前这种方法极为保守,因为它仅强制预分配一个未来的日志段,即便如此也只有在当前日志段已完成 75% 的情况下才会这样做。这种做法仅适用于 WAL 产生量极低的系统。对于高 WAL 产生量的系统,在它们建立起足够数量的循环使用的日志段之后将会运行良好,但在启动初期可能会频繁由前台进程创建日志段,这不是特别理想。
  • 恢复完成,清理相关资源,更新信息到pg_control中,如果是备机被提升为主机时,上面并没有完全触发checkpoint,这里需要再触发一次checkpoint

- XLogReaderAllocate

XLOGReader初始化函数

- XLogBeginRead

XLOGReader读取器启动函数
启动读取器,就是将要读取的位置信息存入state->EndRecPtr中,然后重置ReadRecPtr和Record相关的记录,为真正读取做准备

void
XLogBeginRead(XLogReaderState *state, XLogRecPtr RecPtr)
{Assert(!XLogRecPtrIsInvalid(RecPtr));ResetDecoder(state);//重置Record的相关记录,一般在读取Record间隙执行/* Begin at the passed-in record pointer. */state->EndRecPtr = RecPtr;//更新最后一个读取的结束位置,下一次从此为止开始读取state->ReadRecPtr = InvalidXLogRecPtr;
}

ReadRecord

读取一个XLOG Record记录。

  • 获取private数据,回调的时候传入
  • 启动FOR循环读取数据
    • 调用XLogReadRecord读取一个Record
    • 如果读取到的record为空,关闭当前打开的WAL文件
    • 如果读取到的record的时间线与预期的不一致,记录无效
    • 返回record
    • 如果读取到record仍旧为空,此时如果不是在归档恢复模式,会尝试进入归档模式,获取对应值并更新pg_control文件,然后重试
    • 如果是在standby模式,会重新尝试读取,其他情况直接返回NULL

XLogReadRecord

入参只有XLogReaderState和errormsg,读取的位置信息要从XLogReaderState中获取。

  • 初始化state的一些变量,并从state->EndRecPtr中获取要读取的位置
  • 判断state->ReadRecPtr(上一次读取的记录的起始位置),如果不为0,表示是从我们刚读过的位置进行读取;如果为0,判断state->EndRecPtr是否有效,并将randAccess设置为true
  • 启动loop循环读取
    • 根据state->EndRecPtr位置计算出要读的页位置,页内偏移等信息
    • 调用ReadPageInternal函数读取指定位置的数据,会将数据读取到state->readBuf中。
    • 跳过页头长度,并判断record偏移是否有效或者是否跨页。
    • 去掉页头找到record数据的位置
    • 校验长度
    • 如果record跨页了,将当前读到的数据拷贝到state->readRecordBuf中,继续读下一页的数据;如果遇到XLP_FIRST_IS_OVERWRITE_CONTRECORD标记,表明我们之前读取的数据可能已经被覆盖了,这是需要重新读取数据。
    • 最终的record数据保存在state->readRecordBuf中。
    • 如果没有跨页,直接读取数据
    • 更新state->EndRecPtr
    • 返回record数据

ReadPageInternal

将页中指定长度的内容读取到state的readBuf中。

  • 计算段号,段内偏移等信息,段号是通过state->segcxt.ws_segsize计算
  • 判断是否已经读取过,如果已经读取过,返回已读取的长度
  • 如果要读的段不是当前正在读的段,调用page_read(XLogPageRead)将段的第一页数据读取到readBuf中,主要是用于校验页头数据
  • 调用page_read(XLogPageRead),读取要读的数据。
  • 获取页头并校验。
  • 更新state的对应信息。

XLogPageRead

读取一页的数据。
将指定页的指定位置的数据读取到readBuf中,参数列表如下:

  • xlogreader: 读取器
  • targetPagePtr:要读取的目标页的地址
  • reqLen:要读取的长度
  • targetRecPtr:要读取的目标位置
  • readBuf: 保存读取数据的位置
  • 返回:读取的长度
    函数流程:
  • 根据targetPagePtr获取要读取的段号和段内偏移
  • 如果要读的段文件不是当前已经打开的那个,先将已打开的的段相关的数据刷入磁盘,然后关闭该段文件。
  • 打开期望的段文件
  • 调用pg_read函数,将对应数据读入到buffer中
  • 返回readLen

ReadCheckpointRecord

读取指定为止的Checkpoint的XLOG数据。
其中入参RecPtr,在StartupXlog函数中是从backup_label中读取的Checkpoint的位置

  • 判断RecPtr是否有效,如果其页内偏移还没有头大,那肯定是有问题的
  • 调用XLogBeginRead开始启动读取器,读取对应位置数据
  • 调用ReadRecord函数读取RecPtr位置处的XLOG数据
  • 如果读取的Record为空,返回NULL
  • 如果读取Record的xl_rmid不是RM_XLOG_ID(XLOG的标识符),返回NULL
  • 如果读取的Record的xl_info的标志位不是XLOG_CHECKPOINT_SHUTDOWN或XLOG_CHECKPOINT_ONLINE,返回NULL
  • 如果读取的Record的长度校验不一致,返回NULL
  • 返回正确的record数据

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com