灾难恢复计划
一、灾难的定义
灾难分为自然灾害和非自然灾害。
自然灾害是指由火灾、地震等引发的一系列灾害直接导致公司的业务中断、电力故障、网络故障等。
非自然灾害是指人为的造成的如服务器断电、软件错误、人为故意破坏、恶意代码、木马植入、恐怖袭击等。
二、灾难恢复项目小组的制定和职能
1.管理组:统筹规划,指挥各小组按照既定计划进行执行。
2.部门恢复组:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。
3.计算机恢复组:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。
4.损坏评估组:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。
5.安全组:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。
6.设备支持组:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。
7、数据恢复组:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。
8、市场和客户关系组:负责对外进行信息发布、制定相应应急措施应对客户疑问等。
…… …… 余下全文
1.没有考虑到可能会破坏基础设施和数据运行的所有可能性。除了显而易见的病毒,木马,蠕虫等威胁,还需要想到您所处的地理位置发生自然灾害的可能性,比如是否处于地震断层或是在洪水区,风暴多发区,或拉闸限电等等。在制定灾备计划时,一定要把这些看似与IT无关的因素也考虑进去,如果自然条件实在太恶劣,劝您可以考虑换个地方建设数据中心。
2.灾备计划过于依赖很少的某几个员工。常常看到有些企业的灾难恢复计划依赖于某几个甚至一个IT员工,这很危险。万一如果该人由于某种原因无法工作或者刚好找不到他/她怎么办?您需要确定员工也得有“备份”,矩阵式结构的雇员组织形式会更好的做出应急响应。而且负责灾备的员工分布的地理位置最好是分散的,以防某一地区发生重大灾害。
3.故障或灾难来临时,依靠手工流程通知工作人员。假设您的设备由于停电而终断运行,可是现场又没有人,负责灾备的IT人员怎么会知道机房停电了?您需要建立一套自动化的系统,发生灾难或者服务终断时它可以自动的通知您的IT员工。你还可以选择第三方服务,请服务商来监控您的设施并且指派受过灾备培训的专业人员来帮你执行你的灾难恢复计划。
4。未能提供充足的后备电源。如果您的机房所在地常受到断电影响,一定要购买寿命最长的、最不易受干扰而间断的电力供应。还要准备好额外的备用电池以保证业务的持续能力。
5。忘记安排哪些资源需要优先恢复。您的IT应用中,哪些是最重要的?是否有一些可以等待一两天也不会影响到业务?你需要事先安排好应用与服务的恢复顺序。比如,你可以选择首先重启您公司的电子邮件应用,然后再恢复部门文件服务器。在安排这个顺序时,你需要考虑到相关的法规遵从要求。
6。未制定规范灾难恢复计划流程文档。在制订了一套灾备计划之后,您一定要把如何执行恢复计划的步骤写下来,要详细到每一个进程以及记录,描述所有系统资源的位置。这个灾备恢复步骤手册一定要多印几份,并且存储在多个不同的地方,并确保所有关键恢复人员人手一份。
7。忘记测试灾难恢复计划。确保恢复计划在有紧急状况时真的可以恢复出来!虽然这似乎是显而易见的事,但是许多企业都忽视了这一点,没有充分测试他们的灾备恢复计划。应该定期进行灾难演习,测试每种可能发生的情况,从基本的电力故障到可能导致持续几个月的重大灾难性事件。
8。密码也很难找到。虽然密码保护是数据安全的重要环节,不过还是建议您最好至少在两个不同的、安全的地方保存您的系统密码。确保一个以上的IT工作人员的人有机会进入那里,并能获得所有密码。并且,如果这些关键人员辞职了,一定要及时更改密码。
9。未能保持恢复计划的更新。您需要不断更新您的灾难恢复计划,至少一个季度要再看一次。确定调用该计划的触发点,如人员、设备、地点或应用的改变等等。这不仅有利于IT工作人员的技能保持更新,还将让你有机会发现灾备计划程序中的漏洞并优化之。
…… …… 余下全文
损失减少 企业灾难恢复计划七步曲
正如现实生活中其它事物的不可预料性一样,企业很难预先知道其网络、数据中心运作过程中何时会受到威胁。
但减轻灾难的后果并不是一个轻松的过程。下面笔者给出可以帮助企业提供实用指南并实现高效的业务连续性和灾难恢复计划的七个步骤:
第一步:承认灾难的可能性
业务连续性及灾难恢复的第一步是承认自己的单位会碰到可以损害企业发展的现实性威胁。如果企业没有在一个高级的层次上采取这一步,其它的步骤就免谈。
第二步:列表并分类企业面临的威胁
企业及其社会环境的性质能够影响一个单位所面临的威胁类型。在列示了威胁之后,单位应当根据这些威胁对不同系统的可能影响对其分类。应当在灾难的响应成本和可容忍的“宕机时间”之间实现平衡,可容忍的“宕机时间”越少,则企业就需要越多的成本来创建恰当的响应。比如,一些系统必须在几分钟或几秒内实现功能恢复,还有一些系统可容忍的“宕机时间”为几小时,还有其它系统即使“宕机时间”多达几天也不会产生严重的后果。
第三步:概要描述单位的业务连续性和灾难恢复技术的基础结构
业务连续性和灾难恢复技术基础结构的关键技术要素由以下几部分组成:关键数据中心、一个可以备份主要数据中心资源的远程站点、高带宽的网络连接等部分组成。在整个数据中心,业务连续性和灾难恢复的最佳策略都要遵循所有要素成分都保持冗余性的观点。在生产性和备份数据设施中都应当运行多台主机和服务器。如果一个生产性系统的一个组件碰到了一个问题,此系统组件就立即将其功能转移给本地的备份系统,这可以作为对付灾难的第一道防线。
…… …… 余下全文
灾难恢复计划
一. 日常备份检查
1. 日常服务主机按时定期做备份,分为两类:
主机备份:主机备份应在每周,确认服务运行正常后,制定备份计划和类型,并指定备份时间应为网络最空闲时。在自动执行计划后,应确认备份是否完整,是否有错误
数据备份:数据备份应做每日备份,确定需要备份的数据库,制定每日备份和备份类型。每日,数据库管理人员应对前一日的备份,进行检查,确认备份是否成功完整。
2. 日常备份检查
日常备份检查应由网络部主管人员不定期或定期指定检查,查看备份时间是否符合备份规定,备份文件是否完整,存放是否规整。
3. 备份空间检查
日常由网络管理人员检查备份空间是否充足,如空间紧张,应提前把距离最远的备份文件,存放至指定存储介质中,网络部管理人员应对存储介质存放进行检查,查看存放空间是否达到防潮防磁,并对存储介质进行封存
二.灾难恢复小组:
组长:梁群
灾难鉴定:梁群、王剑
恢复实施人员:王剑、张建东
恢复后检查人员:梁群、王剑、张建东、赵丽娟
灾难恢复制度:
1.灾难级别划分
A类:计算机软硬件故障
发生概率:对于企业,发生可能性最大。由于设备长时间运行,升级硬件所造成。状况有(服务停止,正常业务不能办理)
…… …… 余下全文
1. 目的:
为保障在紧急状况下客户的生产供应不受影响,我们编制了这份《业务持续计划和灾难恢复计划》,目的在于对公司内可能发生的、影响生产的自然灾害及其他人力不可抗力因素,如火灾、断水、断电、台风、劳动力缺失、关键性设备实效等影响,制定应急及补救措施,维护生产活动的正常进行,保证客户产品的供应。
此程序适用于公司所有部门。
2. 定义:
2.1“自然灾害”是指在自然界发生的、具有一定破坏性的异常现象。自然灾害通常以洪水、干旱、地震、台风等形式出现。
2.2“不可抗力事件”是指由自然或社会原因所造成的不可预见、无法避及控制的客观事件。
3. 应急小组
3.1组织架构图
…… …… 余下全文
灾后的恢复计划
1.0生产厂房经修复后,有资质的建筑结构监测部门鉴定达到安全使用标准,取
得合格的鉴定报告。
2.0生产设备、设施找相关行业部门鉴定和修复后,经地方安监局鉴定达到国家安全生产标准。
3.0企业环保设施经修复后须由环保局进行验收,取得合格的验收报告方可投入生产。
4.0配电设备、设施经抢建修复,具备安全通电条件,并经供电单位验收合格方可进行使用。
具备上述条件以后,由企业向供电局上报生产用电计划。未经供电局批准同意的用电企业,各供电企业不能擅自提供生产用电给工厂。
4.1 准备活动
4.1.1 成立紧急事故反应小组(ERT)/灾难恢复小组
为准备一份成功的灾难恢复计划,应成立一个小组。在完成计划之后,他们必须至少每年一次或在发生灾难时召开会议。成员 将包括ERT加上MIS、生产、物料、设备、环境/健康/安全、保安、销售、工程和品质部门的人员。
4..1.2 生产现场资源的确认
应制定一份重要设备和资源清单。如果工厂被部分或完全破坏,这份清单将有助于说明哪些需迅速替补。清单应包含人员、文件、产品和原材料等的说明,它可能从现时文件中汇编出来。
4..1.3 影响评估
…… …… 余下全文
1. 目的:
为保障在紧急状况下客户的生产供应不受影响,我们编制了这份《业务持续计划
和灾难恢复计划》,目的在于对公司内可能发生的、影响生产的自然灾害及其他
人力不可抗力因素,如火灾、断水、断电、台风、劳动力缺失、关键性设备实效
等影响,制定应急及补救措施,维护生产活动的正常进行,保证客户产品的供应。
此程序适用于公司所有部门。
2. 定义:
2.1“自然灾害”是指在自然界发生的、具有一定破坏性的异常现象。自然灾害通
常以洪水、干旱、地震、台风等形式出现。
2.2“不可抗力事件”是指由自然或社会原因所造成的不可预见、无法避及控制的
客观事件。
3. 应急小组
3.1组织架构图
…… …… 余下全文
机房服务服务器备份、灾难恢复计划书
俗话说,有备无患,一个机房要有一个良好的备份和灾难恢复计划,当服务器出现问题 的时候不致于惊慌失措,呆在机房发呆,无从下手,不致于让公司的生产作业停滞从而影响 公司的正常运作。从而给公司造成不可估量的损失。
以下是上海俊达汽车装饰有限公司机房服务服务器备份、灾难恢复书
一、 日常维护
1、 要经常整理硬盘
2、 要每天查看系统日志,查看系统状况,发现问题及时解决
3、 每天查看硬盘使用情况。
4、 每天查看 Raid1 中的磁盘工作是否正常,是否有报警。
二、 备份
1、 域控制器(win2k 的 FMSO 五种角色)PTSERVER
主要功能:1、DNS 2、DHCP 3、FMSO 五种角色
a、 每个月做一张紧急修复磁盘;当对系统有重大修改与设置的时候也要重新生成紧急修复 盘,防止以后,DC(FMSO)不能启动的时候,发挥他的作用
b、 每二周做一次系统状态备份,当有新增用户等动作时要重新备份系统状态。
2、 域控制器(win2k 的 GC 角色)mailserver
主要功能:1、GC 角色 2、邮件服务(exchange2000 server)
…… …… 余下全文