编辑推荐

1.《应急管理在银行业数据中心的策略与实践》理论与实践相结合,能更好地运用到工作实践中。
2.《应急管理在银行业数据中心的策略与实践》是一本实用的应急管理策略与实践方面“教科书”式的实践经验介绍书籍。
3.《应急管理在银行业数据中心的策略与实践》为读者提供了很多具有借鉴意义的应急预案和主动预防示例。

内容简介

应急管理在银行业数据中心的策略与实践》从应急管理的基本概念出发,结合大型商业银行数据中心的业务连续性要求特性,通过应急管理的对象、组织架构、管理制度、主动运维与场景应用等方面的论述,系统地介绍了应急管理体系的基本理论与方法。《应急管理在银行业数据中心的策略与实践》共11章,包括应急管理基础,银行业数据中心应急管理概述,应急管理组织架构,应急管理策略、范围、对象及目标,应急管理场所,应急管理制度,主动性维护,应急场景及预案,应急处置及启动,应急管理工具建设,应急案例介绍等。《应急管理在银行业数据中心的策略与实践》理论与实践相结合,为读者提供了很多具有借鉴意义的应急预案和主动预防示例,能更好地运用到工作实践中。

作者简介

杨志国作为金融业资深从业者,在大型商业银行从业近30年,现任数据中心副总经理,主要负责数据中心的安全管理、生产调度、总控中心。具有非常丰富的数据中心机房等基础设施建设、设备管理、技术架构、机房搬迁经验,同时精通业界管理体系标准及*佳实践,包括ISO20000标准、ISO27001标准和ITIL等,在IT规划,IT运营管理,信息安全管理等方面亦具有丰富的经验。

目录

目录
第1章应急管理基础1
1.1 基础知识2
1.1.1 工作原则2
1.1.2 灾难3
1.1.3 灾难恢复4
1.1.4 灾难备份4
1.1.5 灾难备份中心4
1.1.6 关键业务功能5
1.1.7 业务影响分析5
1.1.8 恢复时间目标5
1.1.9 恢复点目标6
1.1.10 风险评估6
1.1.11 应急预案7
1.1.12 演练7
1.1.13 桌面演练7
1.1.14 模拟切换演练8
1.1.15 真实切换演练8
1.1.16 其他术语9
1.2 应急管理与业务连续性管理9
1.2.1 业务连续性管理的定义9
1.2.2 应急管理与业务连续性管理的关系10
1.3 应急管理与风险管理11
1.3.1 风险的定义11
1.3.2 信息安全风险的定义13
1.3.3 风险管理的定义15
1.3.4 应急管理与风险管理的关系16
1.4 应急管理和灾难备份与恢复管理16
1.4.1 灾难恢复的定义16
1.4.2 灾难恢复7要素17
1.4.3 应急管理和灾难备份与恢复管理的关系17
1.5 银行业数据中心应急管理要求18
1.5.1 国家相关法律法规要求18
1.5.2 相关政府机构的要求25

第2章银行业数据中心应急管理概述29
2.1 数据中心的定义及分级30
2.1.1 数据中心的定义30
2.1.2 数据中心的分级31
2.2 云计算数据中心功能的演进32
2.3 银行业数据中心典型组织架构34
2.3.1 如何建立数据中心的组织架构34
2.3.2 典型的银行业数据中心组织架构36
2.4 银行业数据中心的应急管理38

第3章银行业数据中心应急管理组织架构41
3.1 银行业数据中心应急管理组织成立目的42
3.2 银行业数据中心应急管理组织架构42
3.2.1 应急领导小组43
3.2.2 应急执行小组44
3.2.3 应急保障小组45
3.2.4 外部支持小组45

第4章银行业数据中心应急管理策略、范围、对象及目标47
4.1 应急管理策略48
4.1.1 事前预防策略48
4.1.2 事中响应与处置策略48
4.1.3 事后改进策略49
4.1.4 资源与文化保障策略50
4.2 应急管理范围50
4.3 应急管理对象50
4.3.1 软件51
4.3.2 硬件51
4.3.3 服务51
4.3.4 数据52
4.3.5 人员52
4.4 应急管理目标52

第5章银行业数据中心应急管理场所55
5.1 应急管理场所56
5.1.1 生产监控场所56
5.1.2 应急指挥场所57
5.1.3 应急处置场所58
5.1.4 服务受理场所59
5.1.5 技术分析场所59
5.1.6 测试演练场所60
5.2 应急场所的建设方法61
5.2.1 大屏幕显示系统61
5.2.2 全球IP电话系统66
5.2.3 虚拟终端及云桌面69

第6章银行业数据中心应急管理制度71
6.1 应急管理的规范与流程72
6.1.1 基本原则72
6.1.2 角色与职责分工72
6.1.3 7×24小时应急运维机制72
6.1.4 应急场景(包括但不限于)74
6.1.5 应急预案75
6.2 事件管理的规范与流程77
6.2.1 基本原则77
6.2.2 角色与职责分工77
6.2.3 事件分类78
6.2.4 事件分级79
6.2.5 事件业务影响的认定81
6.2.6 事件活动的要求82
6.2.7 质量控制83

第7章银行业数据中心主动性维护85
7.1 主动性维护基本原则86
7.1.1 RCM理论86
7.1.2 预防性维护和预测性维护89
7.1.3 主动性维护90
7.1.4 主动性维护与传统维护观念的差异91
7.1.5 主动性维护在银行业数据中心运营中的价值92
7.1.6 主动性维护是降低数据中心TCO的新途径92
7.2 硬件设备及机房环境设施技术实施方案93
7.2.1 运维内容93
7.2.2 硬件设备及机房环境设施的主动性维护理念93
7.2.3 案例94
7.3 网络系统技术实施方案99
7.3.1 运维内容99
7.3.2 网络系统的主动性维护理念99
7.3.3 案例100
7.4 主机、开放、windows、X86技术平台实施方案105
7.4.1 运维内容105
7.4.2 主动性维护理念105
7.4.3 案例106
7.5 应用系统技术实施方案120
7.5.1 运维内容120
7.5.2 应用系统的主动性维护理念120
7.5.3 案例121
7.6 漏洞扫描与渗透测试127
7.6.1 运维内容127
7.6.2 主动性维护理念128
7.6.3 案例128

第8章银行业数据中心应急场景及预案131
8.1 硬件与环境应急场景和预案133
8.1.1 应急场景清单133
8.1.2 场景一:ORACLEVSM虚拟带库应急135
8.1.3 场景二:SL8500物理带库应急方案138
8.1.4 场景三:Z13主机硬件故障140
8.1.5 场景四:IBMP系列小型机异常宕机144
8.1.6 场景五:HDS存储设备应急方案149
8.1.7 场景六:NetApp存储设备应急方案151
8.1.8 场景七:EMC存储设备应急方案154
8.1.9 场景八:UPS系统应急方案158
8.1.10 场景九:PDU设备应急方案160
8.2 网络应急场景和预案162
8.2.1 应急场景清单162
8.2.2 场景一:网络设备某一板卡发生故障,该板卡所连接具有
冗余链路166
8.2.3 场景二:网络交换机双引擎中主引擎发生故障,备引擎正
常,主备引擎切换失败168
8.2.4 场景三:外部因素导致生产中心互联网应用系统不可用,
需要将流量切换到异地灾备中心169
8.2.5 场景四:骨干线路丢包171
8.2.6 场景五:异常流量导致主备防火墙的通信异常174
8.2.7 场景六:VPN设备通道连接异常176
8.2.8 场景七:DNS设备的解析服务异常导致DNS服务异常178
8.3 数据恢复应急场景及预案180
8.3.1 应急场景清单181
8.3.2 场景一:数据库热备份恢复切换184
8.3.3 场景二:数据库冷备份恢复切换184
8.3.4 场景三:物理磁盘数据应急恢复187
8.3.5 场景四:物理磁盘外部专业数据恢复应急处理191
8.4 主机应急场景和预案192
8.4.1 应急场景清单192
8.4.2 场景一:主机CICS联机系统交易处理缓慢194
8.4.3 场景二:主机CICS联机与外围系统通信异常200
8.4.4 场景三:DB2没有可以使用的ACTIVELOG,DB2LOG
不能工作204
8.4.5 场景四:一个BSDS文件无法访问,无法对其进行读/
写操作206
8.4.6 场景五:DB2数据空间将耗尽208
8.4.7 场景六:磁盘故障触发非计划性Hyperswap210
8.4.8 场景七:系统DATASET的利用率超过阈值215
8.5 小型机应急场景和预案216
8.5.1 应急场景清单216
8.5.2 场景一:系统重要资源不足219
8.5.3 场景二:CICS交易繁忙以致出现交易排队现象226
8.5.4 场景三:MQ通道状态异常229
8.5.5 场景四:数据库出现大量行锁231
8.5.6 场景五:SQL(联机或批量)执行时间变长236
8.5.7 场景六:单台应用服务器出现故障239
8.5.8 场景七:加速器逻辑通道夯244
8.5.9 场景八:签名验签业务持续性缓慢248
8.5.10 场景九:ORACLEASM磁盘被赋PVID导致磁盘组损坏253
8.5.11 场景十:ORACLE数据库SQL语句执行计划突变259
8.6 X86平台应急场景和预案263
8.6.1 应急场景清单263
8.6.2 场景一:云平台计算节点资源不足265
8.6.3 场景二:ORACLE数据库数据损坏269
8.6.4 场景三:MySQLCluster数据库SQL节点hang死271
8.6.5 场景四:存储故障272
8.6.6 场景五:单台负载均衡器故障275
8.6.7 场景六:WAS组件异常276
8.7 应用与运行应急场景和预案278
8.7.1 应急场景清单278
8.7.2 场景一:应用系统按需执行重启280
8.7.3 场景二:某应用系统的对端系统未正常收到返回报文282
8.7.4 场景三:因业务量高峰、系统处理能力不足引起的联机交易
缓慢284
8.7.5 场景四:批量执行中断286
8.7.6 场景五:数据修改异常引发交易异常288
8.7.7 场景六:应用产品主备机切换应急预案290
8.7.8 场景七:应用系统MQ队列堆积292
8.7.9 场景八:应用系统间密钥恢复应急场景294
8.7.10 场景九:应用产品版本回退应急预案296
8.8 互联网信息安全事件应急场景及预案297
8.8.1 应急场景清单297
8.8.2 场景一:互联网应用系统网络入侵299
8.8.3场景二:互联网出口拒绝服务攻击300

第9章银行业数据中心应急处置及启动303
9.1 应急处置策略与原则304
9.1.1 首查监控305
9.1.2 关联变更305
9.1.3 回顾历史306
9.1.4 以我为因306
9.1.5 联动后线307
9.1.6 并行排查307
9.1.7 信息共享308
9.1.8 恢复优先308
9.2 应急处置实施方法论309
9.2.1 应急发现阶段311
9.2.2 应急响应阶段312
9.2.3 应急恢复阶段312
9.2.4 应急验证阶段314
9.3 应急管理后评价314

第10章银行业数据中心应急管理工具建设319
10.1 应急预案管理平台320
10.1.1 主要用途320
10.1.2 实现功能320
10.1.3 建设方法323
10.2 应急协作管理平台324
10.2.1 主要用途324
10.2.2 实现功能325
10.2.3 建设方法328
10.3 运维流程管理平台331
10.3.1 主要用途332
10.3.2 实现功能333
10.3.3 建设方法342
10.4 集中监控管理平台346
10.4.1 主要用途346
10.4.2 实现功能347
10.4.3 建设方法349

第11章应急案例介绍353
11.1 在线客服人工服务异常案例354
11.1.1 系统简介354
11.1.2 案例简述354
11.1.3 处置详情355
11.1.4 处置要素355
11.1.5 后续改进356
11.2 信用卡快捷支付退货交易缓慢案例356
11.2.1 系统简介356
11.2.2 案例简述357
11.2.3 处置详情357
11.2.4 处置要素357
11.2.5 后续改进358
11.3 个人理财产品销售异常案例358
11.3.1 系统简介358
11.3.2 案例简述359
11.3.3 处置详情359
11.3.4 处置要素359
11.3.5 后续改进360
11.4 部分借记卡行内转账失败案例360
11.4.1 系统简介360
11.4.2 案例简述361
11.4.3 处置详情361
11.4.4 处置要素361
11.4.5 后续改进362
11.5 小型机内存故障案例362
11.5.1 系统简介362
11.5.2 案例简述363
11.5.3 处置详情363
11.5.4 处置要素363
11.5.5 后续改进364
11.6 存储链路抖动案例364
11.6.1 系统简介364
11.6.2 案例简述365
11.6.3 处置详情365
11.6.4处置要素365
11.6.5 后续改进366
11.7 某互联网应用系统漏洞被利用进行网络入侵攻击366
11.7.1 系统简介366
11.7.2 案例简述367
11.7.3 处置详情367
11.7.4 处置要素367
11.7.5 后续改进368
11.8 某地互联网出口Web服务器遭受DDoS攻击案例368
11.8.1 系统简介368
11.8.2 案例简述369
11.8.3 处置详情369
11.8.4 处置要素370
11.8.5 后续改进370
11.9 某系统交易缓慢案例370
11.9.1 系统简介370
11.9.2 案例简述371
11.9.3 分析过程详述371
11.9.4 处置详情373
11.9.5 处置要素374
11.9.6 后续改进374
11.10 某系统投产新版本后批量执行缓慢案例375
11.10.1 系统简介375
11.10.2 案例简述375
11.10.3 分析过程详述376
11.10.4 处置详情377
11.10.5 处置要素377
11.10.6 后续改进378

参考资料379

其他推荐