本书是一种系统地、地阐述IT服务连续性知识体系的专著,旨在为社会培养IT服务连续性领域的人才,为数据中心开展IT服务连续性活动提供详细指引,帮助数据中心实现"少停机、少丢数、少花钱"的夙愿。
本书基于大量图表,直观地阐述以下内容:IT服务连续性涉及的IT服务、业务、IT资源、IT流程、IT组织和IT事件等方面的基础概念和知识。企业各条线的IT事件应急处置行动框架与IT事件应急处置机制。以IT服务连续性目标为导向建设IT应急响应机制、高可用恢复机制和灾难恢复机制的活动框架。IT服务连续性管理活动框架,包括实现IT服务连续性所必须具备的项目管理、运维管理、IT应急处置机制就绪管理、风险管理、IT应急处置机制持续更新管理、绩效管理、内部控制和内部审计活动。
本书的读者对象包括IT应急管理人员、IT规划设计人员、IT项目管理人员、IT运维管理人员、IT风险管理人员、IT绩效管理人员、IT内部控制人员、IT内容审计人员以及准备迈入数据中心大门的所有IT人士。
本书是一种系统地、地阐述IT服务连续性知识体系的专著,旨在为社会培养IT服务连续性领域的人才,为数据中心开展IT服务连续性活动提供详细指引,帮助数据中心实现"少停机、少丢数、少花钱"的夙愿。 本书基于大量图表,直观地阐述以下内容:IT服务连续性涉及的IT服务、业务、IT资源、IT流程、IT组织和IT事件等方面的基础概念和知识。企业各条线的IT事件应急处置行动框架与IT事件应急处置机制。以IT服务连续性目标为导向建设IT应急响应机制、高可用恢复机制和灾难恢复机制的活动框架。IT服务连续性管理活动框架,包括实现IT服务连续性所必须具备的项目管理、运维管理、IT应急处置机制就绪管理、风险管理、IT应急处置机制持续更新管理、绩效管理、内部控制和内部审计活动。 本书的读者对象包括IT应急管理人员、IT规划设计人员、IT项目管理人员、IT运维管理人员、IT风险管理人员、IT绩效管理人员、IT内部控制人员、IT内容审计人员以及准备迈入数据中心大门的所有IT人士。
姚强,华北电力学院计算机及其应用专业92届毕业生,DRII认证业务连续性专家(认证号:10180),曾服务于IBM、EMC、 SUN(ORACLE)、CENTRIN、TEAMSUN等多家知名企业,曾在中国民生银行、中国国航、中国银联、苏格兰皇家银行、广州电信等企业的IT服务连续性项目中担任首席咨询顾问,多年来以"促进靠前数据中心少停机、少丢数、少花钱"为使命,坚守在数据中心靠前线,坚定不移地致力于IT服务连续性理论及靠前很好实践的研究、引进和推广工作,开创性地建立了IT服务连续性知识体系。
目 录
第1章 IT服务剖析 1
1.1 IT服务 1
1.2 业务 3
1.3 IT资源 6
1.3.1 IT资源框架 6
1.3.2 应用系统 7
1.3.3 IT基础设施 10
1.3.4 IT资源的属性 10
1.3.5 IT资源属性与IT服务属性的映射关系 11
1.4 IT流程 12
1.5 IT组织 13
第2章 IT事件剖析 16
2.1 IT事件定义 16
2.2 IT事件前因 16
2.2.1 IT威胁源 17
2.2.2 IT威胁源消减措施 18
2.3 IT事件类别 19
2.4 IT事件后果 20
2.4.1 IT损害 20
2.4.2 IT事件影响 21
2.5 IT事件级别 23
2.6 IT服务连续性的意义 24
第3章 IT事件应对过程 26
3.1 IT事件闭环应对过程 26
3.2 IT事件防范 27
3.3 IT事件监测预测 27
3.4 IT事件应急处置 28
3.4.1 重大IT事件应急处置案例 28
3.4.2 IT事件应急处置行动框架 35
3.4.3 IT事件预警与预警响应 35
3.4.4 IT事件先期处置 39
3.4.5 IT事件后果评估 41
3.4.6 IT事件恢复决策 46
3.4.7 IT事件恢复 48
3.4.8 重大IT事件应急保障 52
3.5 重续运行 52
第4章 IT事件应急处置机制 55
4.1 IT应急处置机制 55
4.1.1 IT应急响应机制 56
4.1.2 高可用恢复机制 58
4.1.3 灾难恢复机制 61
4.2 企业层面IT事件应急处置机制 68
4.3 业务条线IT事件应急处置机制 71
第5章 IT应急处置机制开发过程 74
5.1 IT应急处置机制开发活动框架 74
5.2 风险分析 75
5.3 业务影响分析 77
5.3.1 获取企业层面和业务条线的BIA结果 78
5.3.2 IT关联性分析 78
5.3.3 应用系统影响分析 79
5.3.4 定义重要信息系统 80
5.3.5 定义重要信息系统的启停顺序 80
5.3.6 定义信息系统灾难RTO 81
5.3.7 定义信息系统灾难RPO 81
5.4 IT应急处置策略开发 82
5.4.1 IT应急响应策略开发 83
5.4.2 高可用恢复策略开发 85
5.4.3 灾难恢复策略开发 86
5.5 灾备中心选址 94
5.5.1 确定候选城市 94
5.5.2 初步筛选候选城市 94
5.5.3 比对并确定异地灾备中心所在城市 95
5.5.4 确定灾备中心的具体地址 96
5.6 IT应急处置资源设计 97
5.6.1 关键技术POC 98
5.6.2 生产环境改造设计 98
5.6.3 高可用备份系统设计 100
5.6.4 灾备系统设计 103
5.6.5 自动化灾备指挥与切换平台设计 115
5.6.6 IT应急指挥中心设计 116
5.7 IT应急处置资源实施 116
5.8 IT应急预案开发 118
5.8.1 IT总体应急预案开发 118
5.8.2 IT先期处置预案开发 120
5.8.3 高可用恢复手册开发 120
5.8.4 灾难恢复预案开发 121
5.8.5 其他条线的IT事件应急预案开发 122
5.9 应急演练 123
5.9.1 高可用备份系统切换演练 123
5.9.2 灾备演练 124
第6章 IT服务连续性管理过程 130
6.1 IT服务连续性管理活动框架 130
6.2 IT应急处置机制开发项目管理 131
6.2.1 管理活动 132
6.2.2 管理过程 137
6.2.3 管理角色与职责 138
6.3 IT应急处置资源运维管理 139
6.3.1 管理活动 139
6.3.2 管理过程 142
6.3.3 管理角色与职责 143
6.4 IT应急处置资源风险管理 143
6.4.1 管理活动 143
6.4.2 管理过程 150
6.4.3 管理角色与职责 152
6.5 IT应急处置机制就绪管理 152
6.5.1 管理活动 153
6.5.2 管理过程 156
6.5.3 管理角色与职责 158
6.6 IT应急处置机制持续更新管理 159
6.6.1 管理活动 159
6.6.2 管理过程 161
6.6.3 管理角色与职责 162
6.7 IT服务连续性绩效管理 162
6.7.1 管理活动 163
6.7.2 管理过程 170
6.7.3 管理角色与职责 171
6.8 IT服务连续性内部控制 172
6.8.1 管理活动 172
6.8.2 管理过程 175
6.8.3 管理角色与职责 177
第7章 IT服务连续性管理体系 178
7.1 IT服务连续性管理体系框架 178
7.2 IT服务连续性管理体系的边界环境 179
7.2.1 企业业务连续性管理体系 180
7.2.2 IT服务连续性内部审计机制 183
7.2.3 IT服务连续性法规 184
7.2.4 IT服务连续性SLA 185
7.2.5 IT服务连续性管理规范 185
7.3 IT服务连续性管理体系成熟度模型 186
第8章 IT服务连续性内审的关键审核事项 189
8.1 IT应急处置机制开发审计 189
8.1.1 IT应急响应机制开发审计 189
8.1.2 高可用恢复机制开发审计 191
8.1.3 灾难恢复机制开发审计 192
8.2 IT应急处置机制开发项目项目管理审计 198
8.3 IT应急处置资源运维管理审计 200
8.4 IT应急处置资源风险管理审计 201
8.5 IT应急处置机制就绪管理审计 202
8.6 IT应急响应与恢复行动审计 203
8.7 IT应急处置机制持续更新管理审计 203
8.8 IT服务连续性绩效管理审计 204
8.9 IT服务连续性内控审计 205
附录A 高可用风险检查列表库 207