容灾

刘超 10月前 ⋅ 5315 阅读   编辑

一、为什么做容灾
  1、意外故障
    系统故障:机房/网络环境故障、集群级故障( Namenode, Metadata)、存储级故障(HDFS, Hbase)
    数据故障:数据误操作、性能瓶颈导致数据写入失败、数据同步异常、内存/交换空间占满
  2、计划停机
    系统变更:大版本升级、集群扩容、部署变更
    数据变更:数据量变化,数据风暴、长期使用后的数据分布不平均、扩容后数据的重新分布、索引空间和查询时间的平衡

二、容灾指标
  1、RTO复原时间指标:是指灾难发生后,从系统宕机导致业务停顿之刻开始,到系统恢复至可以支持业务部门运作、业务恢复运营之时,此两点之间的时间。也就是能够容忍的服务中断时间
  2、RPO复原点目标:是指灾难发生后,容灾系统能把数据恢复到灾难发生前时间点的数据,它是衡量企业在灾难发生后会丢失多少生产数据的指标。也就是在一次服务失败之后,能够容忍的数据丢失量

三、组件

  1、MySQL
    a、binlog备份
    b、主从复制与主主复制

简单备注

1、cdh要用bdr做灾备(收费,需要lisences)


注意:本文归作者所有,未经作者允许,不得转载

全部评论: 0

    我有话说: