定时备份——是指有时间间隔的数据备份方式,比如一天一次,一周一次,或者一个月一次,定时备份不能保证数据的零丢失。 实时备份——是指无时间间隔的数据备份方式,通过实时数据复制,保证主备两端的数据读写一致,确保数据的零丢失。
一、数据库备份基本概念
1、简单备份
备份就是复制一份另外存放备用。 但问题的关键是复制什么?像备份一张照片一样直接复制整个数据库文件?对数据库而言,从前数据库很小且处于关闭状态是可以的。以前用磁带库处理的就是简单备份。 2、冷备份 数据库处于打开并活动状态是无法全复制的,原因很简单有的数据还在内存中,仅复制磁盘中的库文件是不够的,而且磁盘的数据随时变化,复制它如同扑风捉影。 因此,以前有的公司专门在半夜业务量最少的时候,关闭数据库(这时库文件就是不再变化的磁盘文件,所以叫冷),花一段时间来复制,这个时间叫窗口时间。
3、热备份
如果数据库处于打开并活动状态,不能停但也必须备份,就叫热备份,但需要用到后面特殊的技术来进行。
4、实时备份
在热备份时,还需要连续不断、实时进行备份,叫实时备份。
5、增量备份 那库文件太大怎么解决呢?第一次备份再大也要全量备份Base。以后可以只备份变化后的数据,Delta1, Delta2,...DeltaN, 再过一段时间可以把Base 和 DeltaX整合一下,变成又一个全量Base1.
二、MySQL的实时备份
1、原理
在保证开始数据库内容一样的条件下,主机Master运行时不断产生的新变化,把那些已经提交成功的确定变化记录到Binary Log(BinLog), 备份机Slave 则用I/Othread线程通过网络实时不断读取之,抓到自己这里当作ReplayLog(RedoLog)在本地给SQL thread源源不断地重演Master的变化过程。这显然达到了热备份、实时备份 ,同时还类似于增量备份。
为什么Master不把SQL直接给Slave,而只给Log呢?因为有部分SQL内容在不同时间在不同的机器上执行结果是不同的,比如取当前时间、随机数、Mac地址等。而Master的BinLog已经是执行SQL结果,板上钉钉,不怕它变化了。
2、BinaryLog 和 ReplayLog
它们的格式是相同的,所以Slave可以把Master的BinLog当RedoLog用。但RedoLog主要功能是记录数据成功提交但还未写入磁盘之前(BinLog却在写入磁盘后)的数据变化,一旦此时停电或硬盘损坏,可以用RedoLog来恢复数据。BinLog记录所有木已成舟的确定性变化。 所以Binlog可以作为全程恢复或备份数据使用,RedoLog可以作为异常down机或者介质故障后的数据恢复使用。 3、RedoLog和UndoLog
UndoLog记录的是在数据被修改之前的值, RedoLog记录的是在数据被修改之后的值,二者记录都发生在提交数据、存盘之前。UndoLog主要用来防止意外,以便回退到修改之前,不管最新修改了什么;RedoLog也用来防止意外,以便能保留最新修改,而不管旧数据是什么。二者联合保证:只要逻辑合法,不管发生什么软硬件意外,既能回到修改前,也能保留修改后的数据。
UCache灾备云,这个是线上的一款数据备份云平台,可以实现的功能:
1、适用场景:TB-EB 级海量数据规模下的全栈超可用
2、备份对象:数据、平台、应用级
3、灾难恢复能力等级:1-6级全等级覆盖
4、核心技术:1-3级灾难恢复能力:备份集技术、4-5级灾难恢复能力:副本数据管理、持续数据保护等技术、6级灾难恢复能力:网关&存储双活、业务连续性服务等
5、RPO&RTO级别:小时级、分钟级、秒级
6、数据有效性验证:即时的数据验证
7、数据有效性验证:统一编排恢复验证计划,自动测试并输出详细报告
8、数据利用:任意时间点的分钟级数据挂载,以进行开发测试、查询分析等
9、数据加密:云采用从传输层、存储层、数据库层全程加密的方式,保障数据全程处于加密状态;且加密密钥可由客户自主管理,并支持定期进行密钥更新
10、操作方式:一站式灾备数据管理WEB平台,一键管理
11、备份功能设置:定时备份、增量备份、永久增量数据备份
12、数据压缩、重删比例:可达到7:1,实际700G的数据(意思是经过加密切块压缩,及并行重删备份后实际在UCache灾备云平台上显示的占用容易仅为100G)。
13、操作界面设置:数据保留策略、流量控制、任务告警、任务日志、FusionCloud 云平台备份/恢复、FusionCloud 云平台备份/恢复、VMware架构虚拟化备份/恢复、H3C CAS云平台备份/恢复、OpenStack云平台备份/恢复、XenServer虚拟化备份/恢复、Hyper-v虚拟化平台、公有云实例备份/恢复、操作系统备份(windows、linux)备份/恢复、文件系统备份/恢复、卷级备份/恢复、并行重删、并行重删DB2\GaussDB\GBase\MySQL\Oracle\SAP HANA\SQL\ Sybase\TimesTen备份/恢复等。
14、硬件及基础设施架构:英特尔® 至强® 金牌系列IO型服务器、灾备存储集群式架构。
15、数据中心基础设施:华北国标A类数据中心—京北T3 级数据中心
16、带宽出口及数据搬迁服务:不限流量、北京核心骨干BGP带宽、端口速率1000Mbps
17、在线运管服务:支持7*24小时
18、收费标准 :按需购买授权容量,100GB免费容量,可备份700GB数据,超出部分按需付费,支持数据备份定制服务。
19,几乎所有系统适用