OSG10 · Chapter 18 · Disaster Recovery Planning · 全文覆盖 + 小白精读 + 画报

第 18 章:灾难恢复规划

这不是提炼版。本页按 PDF 第 1217-1279 页连续覆盖第 18 章内容,每个学习单元都包含教材原文段落、PDF 中文直译/整理、小白解释、考点提醒和对应画报。

63个连续学习单元
4格原文 / 直译 / 解释 / 考点
63页覆盖第18章正文与章末练习
小白先讲人话,再做题
学习单元 01 / PDF P1217

本章考试范围总览

先知道本章会覆盖哪些考试目标,后面每个概念才知道放在哪个知识域。

教材原文段落

THE CISSP TOPICS COVERED IN THIS CHAPTER INCLUDE: Domain 6.0: Security Assessment and Testing 6.3 Collect security process data (e.g., technical and administrative) 6.3.5 Training and awareness 6.3.6 Disaster recovery (DR) and Business Continuity (BC) Domain 7.0: Security Operations 7.10 Implement recovery strategies 7.10.1 Backup storage strategies (e.g., cloud storage, onsite, offsite) 7.10.2 Recovery site strategies (e.g., cold versus hot, resource capacity agreements) 7.10.3 Multiple processing sites 7.10.4 System resilience, high availability (HA), Quality of Service (QoS), and fault tolerance 7.11 Implement disaster recovery (DR) processes 7.11.1 Response 7.11.2 Personnel 7.11.3 Communications (i.e., methods) 7.11.4 Assessment 7.11.5 Restoration 7.11.6 Training and awareness 7.11.7 Lessons learned 7.12 Test disaster recovery plan (DRP) 7.12.1 Read-through/tabletop 7.12.2 Walkthrough 7.12.3 Simulation 7.12.4 Parallel

中文直译 / 整理

本章涵盖的CISSP主题包括: 领域6.0:安全评估与测试 6.3 收集安全流程数据(例如技术性和管理性) 6.3.5 培训与意识 6.3.6 灾难恢复(DR)和业务连续性(BC) 领域7.0:安全运营 7.10 实施恢复策略 7.10.1 备份存储策略(例如:云存储、本地、异地) 7.10.2 恢复站点策略(例如:冷备与热备、资源容量协议) 7.10.3 多个处理站点 7.10.4 系统弹性、高可用性(HA)、服务质量(QoS)和容错性 7.11 实施灾难恢复(DR)流程 7.11.1 响应 7.11.2 人员 7.11.3 通信(即方法) 7.11.4 评估 7.11.5 恢复 7.11.6 培训和意识 7.11.7 经验教训 7.12 测试灾难恢复计划(DRP) 7.12.1 阅读/桌面演练 7.12.2 演练 7.12.3 模拟 7.12.4 并行

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:先知道本章会覆盖哪些考试目标,后面每个概念才知道放在哪个知识域。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

可用性:可用性保证授权用户需要时能及时使用系统和数据。

NIST:NIST 提供美国常用安全标准、框架和指南。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“本章考试范围总览”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

冗余、备份、BCP/DRP、抗 DoS、容量规划都对应可用性。

看到 SP 800 系列、CSF、RMF 常联想到 NIST。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
可用性 可用性保证授权用户需要时能及时使用系统和数据。
NIST NIST 提供美国常用安全标准、框架和指南。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 02 / PDF P1218

第 1218 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

7.12.5 Full interruption 7.12.6 Communications (e.g., stakeholders, test status, regulators) In Chapter 3, “Business Continuity Planning,” you learned the essential elements of business continuity planning (BCP)—the art of helping your organization assess priorities and design resilient processes that will allow continued operations in the event of a disaster. Disaster recovery planning (DRP) is the technical complement to the business-focused BCP exercise. It includes the technical controls that prevent disruptions and facilitate the restoration of service as quickly as possible after a disruption occurs.

Together, the disaster recovery and business continuity plans kick in and guide the actions of emergency-response personnel until the end goal is reached—which is to see the business restored to full operating capacity in its primary operations facilities. While reading this chapter, you may notice many areas of overlap between the BCP and DRP processes. Our discussion of specific disasters provides information on how to handle them from both BCP and DRP points of view. Although the ISC2 CISSP objectives draw a distinction between these two areas, most organizations simply have a single team to address both business continuity and disaster recovery concerns.

In many organizations, the discipline known as business continuity management (BCM) encompasses BCP, DRP, and crisis management under a single umbrella. The Nature of Disaster Disaster recovery planning brings order to the chaos that surrounds the interruption of an organization's normal activities. By its very nature, a disaster recovery plan is designed to cover situations where tensions are already high and cooler heads may not naturally prevail.

Picture the circumstances in which you might find it necessary to implement DRP measures—a hurricane destroys your main operations facility; a fire devastates your main processing center; terrorist activity closes off access to a major metropolitan area. Any event that stops, prevents, or interrupts an organization's ability to perform its work tasks (or threatens to do so) is considered a disaster. The moment that IT becomes unable to support 7.12.5

中文直译 / 整理

完全中断 7.12.6 沟通(例如,利益相关方、测试状态, 监管机构) 在 第 3 章,“业务连续性规划”中,您了解了业务连续性规划(BCP)的 基本要素——帮助您的组织评估优先级并设计弹性流程,以便在灾难发生时 维持运营。 灾难恢复规划(DRP)是业务导向的 BCP 活动的技术补充。 它包括防止中断的 技术控制措施,并在中断发生后尽快恢复服务。 灾难恢复计划和业务连续性计划共同发挥作用,指导应急响应人员的行动,直 至实现最终目标——即恢复业务在主要运营设施中的全面运行能力。 在阅读本章时,您可能会注意到BCP和DRP流程之间存在许多重叠区域。 我们 对具体灾难的讨论提供了从BCP和DRP两个角度应对这些灾难的信息。 尽管 ISC2 CISSP目标对这两个领域进行了区分,但大多数组织通常仅有一个团队来 处理业务连续性和灾难恢复相关问题。 在许多组织中,被称为业务连续性管理 (BCM)的学科将BCP、DRP和危机管理统一在一个框架之下。 灾难的性质 灾难恢复规划为围绕组织正常活动中断的混乱局面带来了秩序。 从其本质来看, 灾难恢复计划旨在应对紧张局势已经高涨、冷静头脑未必自然占上风的情况。

想象一下,你可能不得不实施灾难恢复计划措施的情境——飓风摧毁了你的主 要运营设施; 火灾摧毁了你的主要处理中心; 恐怖活动导致通往主要大都市区 的通道被封锁。 任何停止、阻止或中断组织执行工作任务能力的事件(或威胁 要如此)都被视为灾难。 当IT无法支持

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

业务连续性计划 BCP:BCP 关注业务在灾难或中断中如何继续运行。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1218 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

BCP 保护业务流程,DRP 保护 IT 恢复。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
业务连续性计划 BCP BCP 关注业务在灾难或中断中如何继续运行。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 03 / PDF P1219

政策、标准、程序、指南

高层原则、最低要求、操作步骤、建议做法要分清。

教材原文段落

mission-critical processes is the moment DRP kicks in to manage the restoration and recovery procedures. A disaster recovery plan should be set up so that it can almost run on autopilot. The DRP should also be designed to reduce decision-making activities during a disaster as much as possible. Essential personnel should be well trained in their duties and responsibilities in the wake of a disaster and also know the steps they need to take to get the organization up and running as soon as possible. We'll begin by analyzing some of the possible disasters that might strike your organization and the particular threats that they pose.

Many of these were mentioned in Chapter 3, but we'll now explore them in further detail. To plan for natural and unnatural disasters in the workplace, you must first understand their various forms, as explained in the following sections. Natural Disasters Natural disasters reflect the occasional fury of our habitat—violent occurrences that result from changes in the earth's surface or atmosphere that are beyond human control. In some cases, such as hurricanes, scientists have developed sophisticated predictive models that provide ample warning before a disaster strikes. Others, such as earthquakes, can cause devastation at a moment's notice.

A disaster recovery plan should provide mechanisms for responding to both types of disasters, either with a gradual buildup of response forces or as an immediate reaction to a rapidly emerging crisis. Earthquakes Earthquakes are caused by the shifting of seismic plates and can occur almost anywhere in the world without warning. However, they are far more likely to occur along known fault lines that exist in many areas of the world. A wellknown example is the San Andreas Fault, which poses a significant risk to portions of the western United States.

If you live in a region along a fault line where earthquakes are likely, your DRP should address the procedures your business will implement should a seismic event interrupt your normal activities. You might be surprised by some of the regions of the world where earthquakes are considered possible. The U.S. Geological Survey considers the following states to have the highest earthquake hazard risk, with Alaska, California, and Hawaii having a higher hazard risk:

中文直译 / 整理

关键业务流程时,灾难恢复计划便启动,以管理恢复和恢复程序。 应制定灾难恢复计划,使其几乎可以自动运行。 灾难恢复计划还应设计为在灾 难发生时尽可能减少决策活动。 关键人员应接受充分培训,明确其在灾难发生 后的职责与任务,并知晓为尽快恢复组织运营所需采取的步骤。 我们首先将分 析可能影响贵组织的一些潜在灾难及其特有的威胁。 其中许多在第3章中已有提 及,但我们现在将更深入地探讨它们。 为应对工作场所的自然和非自然灾难,您必须首先了解其各种形式,如下文各节 所述。 自然灾害 自然灾害反映了我们生存环境偶尔的暴怒——由地球表面或大气变化引发的、 超出人类控制的剧烈事件。 在某些情况下,如飓风,科学家已开发出复杂的预 测模型,能在灾难发生前提供充分预警。 而在其他情况下,如地震,则可能在 瞬间造成毁灭性破坏。 灾难恢复计划应提供应对这两种类型灾难的机制,或通 过逐步调动应急力量,或对迅速出现的危机作出即时反应。 地震 地震是由地壳板块移动引起的,可能在世界任何地方毫无预警地发生。 然而, 它们更有可能发生在世界上许多地区已知的断层线上。 一个著名的例子是圣安 德烈亚斯断层,它对美国西部部分地区构成重大风险。

如果您生活在断层线附 近、可能发生地震的地区,您的灾难恢复计划应明确您的企业应在地震事件中 断正常活动时采取的程序。 您可能会对一些被认为是可能发生地震的世界地区感到惊讶。 美国地质调查局 认为以下州具有最高的地震危险风险,其中阿拉斯加、加利福尼亚和夏威夷的 危险风险更高:

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:高层原则、最低要求、操作步骤、建议做法要分清。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

程序:程序是一步一步怎么做。

日志:日志记录系统和用户活动,用于监控、审计和调查。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“政策、标准、程序、指南”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Step-by-step、SOP 常对应 procedure。

日志要保护完整性、时间同步和访问控制。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
程序 程序是一步一步怎么做。
日志 日志记录系统和用户活动,用于监控、审计和调查。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 04 / PDF P1220

第 1220 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Alaska Arkansas California Hawaii Idaho Illinois Kentucky Missouri Montana Nevada Oregon South Carolina Tennessee Utah Washington Wyoming However, it is extremely important to recognize that seismic risk is not uniform across a state. Figure 18.1 provides a more granular seismic risk map. If you examine this map, you'll discover that some areas in these high-risk states actually have very low localized risk, whereas there are areas in almost every state where earthquake risk is significant.

中文直译 / 整理

阿拉斯加 阿肯色 加利福尼亚 夏威夷 爱达荷 伊利诺伊 肯塔基 密苏里 蒙大拿 内华达 俄勒冈 南卡罗来纳 田纳西州 Utah 华盛顿 怀俄明 然而,至关重要的是要认识到,地震风险在各州内并非均匀分布。 图18.1提供 了一个更细致的地震风险地图。 如果您查看这张地图,就会发现,这些高风险 州的一些地区实际上具有非常低的局部风险,而几乎每个州都存在地震风险显 著的区域。

小白解释

场景先行:你是公司的安全负责人,正在读第 1220 页这一组概念。老板不会问你背定义,而是问:这件事会不会影响业务、谁负责、要不要花钱、出了事能不能解释清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:概念没放进业务场景,容易只背词,做题时不知道该选管理动作还是技术动作。

你作为负责人可以这样想:先确认业务目标和风险,再选控制措施,最后留下政策、审批、日志或证据。

如果这一页没有明显术语,就按“谁在做事、保护什么、怕什么、用什么控制、留下什么证据”来拆。

常见误区:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

读完后用一句话复述:如果我是安全负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1220 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是安全负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

排除法提醒:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

本页术语拆解

本页没有识别到重点术语,按原文顺序理解即可。

学习单元 05 / PDF P1221

第 1221 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

FIGURE 18.1 Seismic hazard map Source: U.S. Geological Survey / Public Domain. Floods Flooding can occur almost anywhere in the world at any time of the year. Some flooding results from the gradual accumulation of rainwater in rivers, lakes, and other bodies of water that then overflow their banks and flood the community. Other floods, known as flash floods, strike when a sudden severe storm dumps more rainwater on an area than the ground can absorb in a short period of time. Floods can also occur when dams are breached. Large waves caused by seismic activity, or tsunamis, combine the awesome power and weight of water with flooding, as we saw during the 2011 tsunami in Japan.

This tsunami amply demonstrated the enormous destructive capabilities of water and the havoc it can wreak on various businesses and

中文直译 / 整理

图 18.1 地震危险性地图 来源:美国地质调查局 / 公有领域。 洪水 洪水几乎可以在世界任何地方、一年中的任何时间发生。 有些洪水是由于雨水 在河流、湖泊和其他水体中逐渐积聚,导致水体溢出河岸而淹没社区。 其他洪 水被称为山洪,当一场突如其来的强风暴在短时间内降下远超地面吸收能力的 降雨时,就会引发此类洪水。 当水坝溃决时,也会发生洪水。 由地震活动引发 的巨大波浪,即海啸,将水的惊人力量与重量与洪水结合在一起,正如我们在 2011年日本海啸中所见。 这场海啸充分展示了水的巨大破坏力及其对各种企业 造成的破坏,

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

日志:日志记录系统和用户活动,用于监控、审计和调查。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1221 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

日志要保护完整性、时间同步和访问控制。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 06 / PDF P1222

第 1222 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

economies when it triggered an unprecedented nuclear disaster at Fukushima. According to government statistics, flooding is responsible for approximately $8 billion (that's billion with a B) in damage to businesses and homes each year in the United States. It's important that your DRP make appropriate response plans for the eventuality that a flood may strike your facilities. When you evaluate a firm's risk of damage from flooding to develop business continuity and disaster recovery plans, it's also a good idea to check with responsible individuals and ensure that your organization has sufficient insurance in place to protect it from the financial impact of a flood.

In the United States, most general business policies do not cover flood damage, and you should investigate obtaining specialized government-backed flood insurance under the Federal Emergency Management Agency's (FEMA) National Flood Insurance Program. Outside the U.S., commercial insurance providers may offer these policies. Although flooding is theoretically possible in almost any region of the world, it is much more likely to occur in certain areas. FEMA's National Flood Insurance Program is responsible for completing a flood risk assessment for the entire United States and providing this data to citizens in graphical form. You can view flood maps at http://msc.fema.gov/portal.

This site also provides valuable information on recorded earthquakes, hurricanes, windstorms, hailstorms, and other natural disasters to help you prepare your organization's risk assessment. Figure 18.2 shows a flood map for a portion of the downtown region of Miami, Florida. When viewing flood maps like the example shown in Figure 18.2, you'll find that they often combine several different types of confusing terminology. First, the shading indicates the likelihood of a flood occurring in an area. Areas shaded with the darkest color are described as falling within the 100-year floodplain.

This means that the government estimates the chance of flooding in that area are 1 in 100, or 1.0 percent. Those unshaded lie within the 500-year floodplain, meaning that there is a 1 in 500, or 0.2 percent annual risk of flood. And those shaded more lightly lie between the 100-year floodplain and the 500-year floodplain.

中文直译 / 整理

当它引发福岛前所未有的核灾难时,经济遭受重创。 根据政府统计数据,每年在美国,洪水对企业和家庭造成的损失约为80亿美元 (这是带有一个B的十亿)。 确保您的灾难恢复计划为洪水可能袭击您的设施 这一情况制定适当的应对方案至关重要。 在评估企业因洪水受损的风险以制定业务连续性和灾难恢复计划时, 最好也与相关负责人核实,确保您的组织已购买足够的保险,以防范洪水 带来的财务影响。 在美国,大多数通用商业保险政策不涵盖洪水损失,您 应考虑通过联邦紧急事务管理局(FEMA)的国家洪水保险计划获取专门 的政府支持型洪水保险。 在美国以外地区,商业保险公司可能提供此类保 险。 尽管洪水理论上可能发生在世界上的几乎任何地区,但在某些区域发生的可能 性要大得多。 FEMA的国家洪水保险计划负责对整个美国进行洪水风险评估, 并以图形形式向公众提供这些数据。 您可以在http://msc.fema.gov/portal查 看洪水地图。 该网站还提供有关记录在案的地震、飓风、风暴、冰雹以及其他自然灾害的 宝贵信息,以帮助您为组织的风险评估做好准备。 图 18.2展示了佛罗里达州迈阿密市中心部分区域的洪水地图。

当查看类似示例 的洪水地图时,您会发现它们通常结合了多种令人困惑的术语。 首先,着色表 示某区域发生洪水的可能性。 着色最深的区域被描述为位于百年一遇洪水区。 这意味着政府估计该区域发生洪水的概率为百分之一,即 1.0%。 未着色的区域 位于五百年一遇洪水区,意味着每年发生洪水的风险为五百分之一,即 0.2%。 而着色较浅的区域则介于百年一遇洪水区与五百年一遇洪水区之间。

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

风险评估:风险评估是先找资产、威胁、漏洞和影响,再决定控制措施。

政策:政策是高层原则,说明必须遵守什么。

日志:日志记录系统和用户活动,用于监控、审计和调查。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1222 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

风险评估不是漏洞扫描;它更高层,服务于决策和资源分配。

Policy 高层、强制、稳定;Procedure 具体步骤。

日志要保护完整性、时间同步和访问控制。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
风险评估 风险评估是先找资产、威胁、漏洞和影响,再决定控制措施。
政策 政策是高层原则,说明必须遵守什么。
日志 日志记录系统和用户活动,用于监控、审计和调查。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 07 / PDF P1223

DAD、过度保护、真实性、不可否认性与 AAA

CIA 是目标,DAD 是失败表现,AAA 是访问控制和问责链。

教材原文段落

These maps also contain information about the impact of a flood, measured in terms of the depth of flooding expected during a flooding event. Those are described as zones having many different letter codes, which you will not need to memorize for the CISSP exam. FIGURE 18.2 Flood hazard map for Miami–Dade County, Florida For a more detailed tutorial on reading flood maps and current map information, visit www.fema.gov/sites/default/files/documents/how-toread-flood-insurance-rate-map-tutorial.pdf. Storms

中文直译 / 整理

这些地图还包含有关洪水影响的信息,以洪水事件期间预期的水深来衡量。 这 些区域被标记为多种字母代码的区域,您无需为 CISSP 考试记忆这些代码。 图 18.2 佛罗里达州迈阿密‑戴德县的洪水危险图 如需了解有关阅读洪水地图和当前地图信息的更详细教程,请访问 www.fema.gov/sites/default/files/documents/how‑to‑ 阅读洪水保险费率地图教程.pdf。 风暴

小白解释

场景先行:你是公司的安全负责人,正在读第 1223 页这一组概念。老板不会问你背定义,而是问:这件事会不会影响业务、谁负责、要不要花钱、出了事能不能解释清楚。

这一页真正想让你理解的是:CIA 是目标,DAD 是失败表现,AAA 是访问控制和问责链。

把它放进公司里看,关键不是背定义,而是判断:概念没放进业务场景,容易只背词,做题时不知道该选管理动作还是技术动作。

你作为负责人可以这样想:先确认业务目标和风险,再选控制措施,最后留下政策、审批、日志或证据。

如果这一页没有明显术语,就按“谁在做事、保护什么、怕什么、用什么控制、留下什么证据”来拆。

常见误区:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

读完后用一句话复述:如果我是安全负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“DAD、过度保护、真实性、不可否认性与 AAA”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是安全负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

排除法提醒:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

本页术语拆解

本页没有识别到重点术语,按原文顺序理解即可。

学习单元 08 / PDF P1224

完整性:数据要正确、可信、未被乱改

完整性不只是防黑客篡改,也包括防授权用户误操作。

教材原文段落

Storms come in many forms and pose diverse risks to a business. Prolonged periods of intense rainfall bring the risk of flash flooding, as described in the previous section. Hurricanes and tornadoes come with the threat of high wind speeds that undermine the structural integrity of buildings and turn everyday objects such as trees, lawn furniture, and even vehicles into deadly missiles. Hailstorms bring a rapid onslaught of destructive ice chunks falling from the sky. Many storms also bring the risk of lightning, which can cause severe damage to sensitive electronic components.

For this reason, your business continuity plan should detail appropriate mechanisms to protect against lightning-induced damage, and your disaster recovery plan should include adequate provisions for power outages and equipment damage that might result from a lightning strike. Never underestimate the damage that a single storm can do. In 2017, the Category 4 Atlantic hurricane Harvey marked one of the costliest, deadliest, and strongest hurricanes ever to make landfall in the continental United States. It bore a path of destruction through Texas, destroying both natural and human-made features.

The total economic impact stemming from the damage Harvey caused is estimated at more than $125 billion, and it directly resulted in 68 deaths. Storm damage continues to result in devastating costs, partially driven by inflation in building costs and partially driven by climate change. In 2022, climate and weather disasters amounted to $165 billion. If you live in an area susceptible to a certain type of severe storm, it's important to regularly monitor weather forecasts from responsible government agencies.

For example, disaster recovery specialists in hurricane-prone areas should periodically check the website of the National Weather Service's National Hurricane Center (www.nhc.noaa.gov) during hurricane season. This website allows you to monitor Atlantic and Pacific storms that may pose a risk to your region before word about them hits the local news. This knowledge lets you begin a gradual and proactive response to the storm before time runs out. Fires Fires can start for a variety of reasons, both natural and human-made, but both forms can be equally devastating. During the BCP/DRP process, you

中文直译 / 整理

风暴有多种形式,对业务构成多种风险。 长时间的强降雨会带来突发性洪水的 风险,如前一节所述。 飓风和龙卷风伴随着强风的威胁,这些强风会破坏建筑 物的结构完整性,并将树木、庭院家具甚至车辆等日常物品变成致命的导弹。 冰雹风暴则带来从天而降的破坏性冰块的迅速袭击。 许多风暴还伴随着雷电的 风险,雷电可能对敏感的电子元件造成严重损害。 因此,您的业务连续性计划 应详细说明保护免受雷电损害的适当机制,您的灾难恢复计划也应包含应对雷 击可能导致的断电和设备损坏的充分措施。 绝不要低估一场风暴可能造成的破 坏。 2017年,四级大西洋飓风哈维成为有记录以来登陆美国大陆造成的损失最惨重、 死亡人数最多、强度最强的飓风之一。 它横扫德克萨斯州,摧毁了自然与人工 设施。 哈维造成的破坏带来的总经济损失估计超过1250亿美元,并直接导致 68人死亡。 风暴造成的损失持续带来毁灭性成本,部分由建筑成本通胀驱动, 部分由气候变化驱动。 2022年,气候和天气灾害造成的损失达1650亿美元。 如果您居住在易受某种强风暴影响的地区,定期关注负责任的政府机 构发布的天气预报至关重要。

例如,飓风多发地区的灾害恢复专家应在飓 风季节定期访问美国国家气象局国家飓风中心的网站(www.nhc.noaa.gov)。 该网站允许您在本地新闻报道之前,监测可能对您的地区构成威胁的大西 洋和太平洋风暴。 这种知识使您能在时间耗尽之前,逐步采取主动应对措 施。 火灾 火灾可能由各种自然或人为原因引发,但这两种形式都可能同样具有破坏性。 在BCP/DRP过程中,您

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:完整性不只是防黑客篡改,也包括防授权用户误操作。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

完整性:完整性保证数据没有被未授权修改,并且仍然正确可信。

业务连续性计划 BCP:BCP 关注业务在灾难或中断中如何继续运行。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“完整性:数据要正确、可信、未被乱改”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

哈希、数字签名、变更控制、输入校验常对应完整性。

BCP 保护业务流程,DRP 保护 IT 恢复。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
完整性 完整性保证数据没有被未授权修改,并且仍然正确可信。
业务连续性计划 BCP BCP 关注业务在灾难或中断中如何继续运行。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 09 / PDF P1225

第 1225 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

should evaluate the risk of fire and implement at least basic measures to mitigate that risk and prepare the business for recovery from a catastrophic fire in a critical facility. Some regions of the world are susceptible to wildfires during the warm season. These fires, once started, spread in somewhat predictable patterns, and fire experts working with meteorologists can produce relatively accurate forecasts of a wildfire's potential path. It is important, of course, to remember that wildfires can behave unpredictably and require constant vigilance. In 2018, the Camp Fire in California destroyed the town of Paradise within 4 hours of ignition.

The damage caused by forest fires continues to increase, driven by climate change. In 2020, the state of California experienced over 9,600 fires burning over 4.3 million acres of the state. To put that in context, 4 percent of the land area of the state of California burned in a single year. In 2023, a significant wildfire affected Maui, causing widespread damage and over a hundred deaths. This terrible event underscores the escalating threat of wildfires. It is a reminder of the necessity for robust fire risk assessment and preparedness as part of any comprehensive business continuity and disaster recovery planning effort.

As with many other types of large-scale natural disasters, you can obtain valuable information about impending threats on the web. In the United States, the National Interagency Fire Center posts daily fire updates and forecasts on its website: www.nifc.gov/fireInfo/nfn.htm. Other countries have similar warning systems in place. Pandemics Pandemics pose a significant health and safety risk to society and have the potential to disrupt business operations in a manner unlike many other disasters. Rather than causing physical damage, pandemics threaten the safety of individuals and prevent them from gathering in large numbers, shutting down offices and other facilities.

The COVID-19 coronavirus pandemic was the most severe example to occur in the past century, but numerous other smaller outbreaks have occurred, including the SARS outbreak, avian flu, and swine flu. Major outbreaks like

中文直译 / 整理

应评估火灾风险,并实施至少基本的措施以减轻该风险,并为关键设施发生 灾难性火灾后的业务恢复做好准备。 世界上某些地区在温暖季节容易发生野火。 这些火灾一旦发生,会以相对可预 测的模式蔓延,消防专家与气象学家合作可以对野火的潜在路径做出相对准确 的预报。 当然,必须记住,野火的行为可能不可预测,需要持续保持警惕。 2018年,加利福尼亚州的营火在点火后4小时内摧毁了天堂镇。 森林火灾造成的破坏持续增加,这由气候变化所驱动。 2020年,加利福尼亚州 经历了超过9600场火灾,烧毁了该州超过430万英亩的土地。 作为参考,该州 4%的土地面积在一年内被烧毁。 2023年,一场重大野火影响了茂宜岛,造成广 泛破坏和超过百人死亡。 这一惨痛事件突显了野火威胁的日益加剧。 它提醒我 们,将强有力的火灾风险评估和防范措施纳入任何全面的业务连续性和灾难恢 复计划中是必要的。 与许多其他类型的大型自然灾害一样,您可以在网上获取有关潜在威 胁的宝贵信息。 在美国,国家跨机构消防中心在其网站上发布每日火灾更 新和预报:www.nifc.gov/fireInfo/nfn.htm。 其他国家也有类似的预警系 统。

大流行病 大流行病对社会构成重大的健康和安全风险,并可能以不同于其他许多灾难 的方式扰乱业务运营。 它们并非造成物理破坏,而是威胁个人安全,阻止人 们大规模聚集,导致办公室和其他设施关闭。 COVID‑19冠状病毒大流行是过去一个世纪中最严重的例子,但还发生过许多 其他较小的疫情,包括SARS疫情、禽流感和猪流感。 重大疫情如

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

风险评估:风险评估是先找资产、威胁、漏洞和影响,再决定控制措施。

日志:日志记录系统和用户活动,用于监控、审计和调查。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1225 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

风险评估不是漏洞扫描;它更高层,服务于决策和资源分配。

日志要保护完整性、时间同步和访问控制。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
风险评估 风险评估是先找资产、威胁、漏洞和影响,再决定控制措施。
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 10 / PDF P1226

政策、标准、程序、指南

高层原则、最低要求、操作步骤、建议做法要分清。

教材原文段落

COVID-19 may be infrequent, but the severity of this risk requires careful planning, including building contingency plans for how businesses will operate in a pandemic response mode and what types of insurance may or may not provide coverage in response to a pandemic. Other Natural Events Some regions of the world are prone to localized types of natural disasters. During the BCP/DRP process, your assessment team should analyze all of your organization's operating locations and gauge the impact that such events might have on your business. For example, many parts of the world are subject to volcanic eruptions.

If you conduct operations in an area in close proximity to an active or dormant volcano, your DRP should probably address this eventuality. Other localized natural occurrences include monsoons in Asia, tsunamis in the South Pacific, avalanches in mountainous regions, and mudslides in the western United States. If your business is geographically diverse, it is prudent to include local emergency response experts on your planning team. At the very least, make use of local resources such as government emergency preparedness teams, civil defense organizations, and insurance claim offices to help guide your efforts.

These organizations possess a wealth of knowledge and are usually more than happy to help you prepare your organization for the unexpected— after all, every organization that successfully weathers a natural disaster is one less organization that requires a portion of their valuable recovery resources after disaster strikes. Human-Made Disasters Our advanced civilization has become increasingly dependent on complex interactions between technological, logistical, and natural systems. The same complex interactions that make our sophisticated society possible also present a number of potential vulnerabilities from both intentional and unintentional human-made disasters.

In the following sections, we'll examine a few of the more common disasters to help you analyze your organization's vulnerabilities when preparing a business continuity plan and disaster recovery plan. Fires Earlier in the chapter, we explained how some regions of the world are susceptible to wildfires during the warm season, and these types of fires can COVID‑19

中文直译 / 整理

可能并不频繁,但这种风险的严重性要求进行周密规划,包括制 定业务在大流行应对模式下如何运营的应急计划,以及何种类型的保险可能 或不可能在大流行期间提供保障。 其他自然事件 世界上某些地区容易发生局部类型的自然灾害。 在BCP/DRP过程中,您的评估 团队应分析贵组织所有运营地点,并评估此类事件可能对业务造成的影响。 例 如,世界上许多地区都面临火山喷发的风险。 如果您在靠近活跃或休眠火山的 区域开展业务,您的DRP应可能涵盖这一可能性。 其他局部自然灾害包括亚洲 的季风、南太平洋的海啸、山区的雪崩,以及美国西部的泥石流。 如果您的业务具有地理多样性,那么在规划团队中纳入当地应急响应专家是明 智之举。 至少,应利用当地资源,如政府应急准备团队、民防组织和保险理赔 办公室,以帮助指导您的工作。 这些组织拥有丰富的知识,通常非常乐意协助 您为突发事件做好准备——毕竟,每一个成功应对自然灾害的组织,都意味着 灾难发生后少一个需要消耗其宝贵恢复资源的组织。 人为灾难 我们的先进文明越来越依赖于技术、物流和自然系统之间的复杂互动。 这些使 我们复杂社会成为可能的同样复杂互动,也带来了来自故意和非故意的人为灾 难的多种潜在脆弱性。

在以下章节中,我们将探讨一些更常见的灾难,以帮助 您在制定业务连续性计划和灾难恢复计划时分析贵组织的脆弱性。 火灾 在本章前面的部分,我们解释了世界某些地区在温暖季节容易发生野火,这类火 灾可以

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:高层原则、最低要求、操作步骤、建议做法要分清。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

日志:日志记录系统和用户活动,用于监控、审计和调查。

业务连续性计划 BCP:BCP 关注业务在灾难或中断中如何继续运行。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“政策、标准、程序、指南”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

日志要保护完整性、时间同步和访问控制。

BCP 保护业务流程,DRP 保护 IT 恢复。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
日志 日志记录系统和用户活动,用于监控、审计和调查。
业务连续性计划 BCP BCP 关注业务在灾难或中断中如何继续运行。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 11 / PDF P1227

第 1227 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

be described as natural disasters. Many smaller-scale fires result from human action—be it carelessness, faulty electrical wiring, improper fire protection practices, arson, or other reasons. Studies from the Insurance Information Institute indicate that there are at least 1,000 building fires in the United States every day. If such a fire strikes your organization, do you have the proper preventive measures in place to quickly contain it? If the fire destroys your facilities, how quickly does your disaster recovery plan allow you to resume operations elsewhere?

Acts of Terrorism Since the terrorist attacks on September 11, 2001, businesses are increasingly concerned about risks posed by terrorist threats. These attacks caused many small businesses to fail because they did not have business continuity/disaster recovery plans in place that were adequate to ensure their continued viability. Many larger businesses experienced significant losses that caused severe long-term damage. The Insurance Information Institute issued a study one year after the attacks that estimated the total damage from the attacks in New York City at $40 billion (yes, that's with a B again).

General business insurance may not properly cover an organization against acts of terrorism. In years past, most policies either covered acts of terrorism or didn't mention them explicitly. After suffering catastrophic terrorism-related losses, many insurance companies responded by amending policies to exclude losses from terrorist activity. Policy riders and endorsements are sometimes available, but often at extremely high cost. If your business continuity or disaster recovery plan includes insurance as a means of financial recovery (as it probably should!), you'd be well advised to check your policies and contact your insurance professionals to ensure that you're still covered.

Terrorist acts pose a unique challenge to DRP teams because of their unpredictable nature. Prior to the September 11, 2001, terrorist attacks, few DRP teams considered the threat of an airplane crashing into their corporate headquarters significant enough to merit mitigation. Many companies are asking themselves a number of “what if” questions regarding terrorist activity. In general, these questions are healthy because they promote dialogue between business elements regarding potential threats. On the other

中文直译 / 整理

被描述为自然灾害。 许多小规模火灾源于人为因素——无论是疏忽、电气线路 故障、不当的防火措施、纵火还是其他原因。 保险信息研究所的研究表明,美 国每天至少发生1,000起建筑火灾every day。 如果此类火灾波及您的组织,您 是否已采取适当的预防措施以迅速控制火势? 如果火灾摧毁了您的设施,您的 灾难恢复计划能否让您迅速在其他地方恢复运营? 恐怖主义行为 自2001年9月11日恐怖袭击以来,企业越来越关注恐怖威胁带来的风险。 这些袭 击导致许多中小企业倒闭,原因是它们没有制定足够完善的业务连续性/灾难恢 复计划以确保持续运营。 许多大型企业遭受了重大损失,造成了严重的长期损 害。 保险信息研究所在袭击发生一年后发布了一项研究,估算纽约市的袭击总 损失达400亿美元(是的,那个<B>B</B>没错)。 一般商业保险可能无法充分保障组织免受恐怖主义行为的影响。 过去, 大多数保单要么明确涵盖恐怖主义行为,要么未明确提及。 在遭受灾难性的 恐怖主义相关损失后,许多保险公司通过修改保单排除恐怖活动造成的损失 来应对。 有时可提供附加条款或特别约定,但通常费用极高。

如果您的业务 连续性或灾难恢复计划包含保险作为财务恢复手段(这很可能应该是! ), 则建议您仔细检查保单并联系您的保险专业人士,以确保您仍处于保障范围 内。 恐怖袭击行为因其不可预测性,对灾难恢复计划(DRP)团队构成了独特挑战。 在2001年9月11日恐怖袭击事件发生之前,很少有DRP团队认为飞机撞入公司 总部的威胁足够严重,值得采取缓解措施。 许多公司正在就恐怖活动提出一系 列“如果发生⋯⋯怎么办”的问题。 一般来说,这些问题是有益的,因为它们 促进了业务部门之间关于潜在威胁的对话。 在

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

政策:政策是高层原则,说明必须遵守什么。

日志:日志记录系统和用户活动,用于监控、审计和调查。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1227 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Policy 高层、强制、稳定;Procedure 具体步骤。

日志要保护完整性、时间同步和访问控制。

RTO 是多久恢复,RPO 是能丢多少数据。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
政策 政策是高层原则,说明必须遵守什么。
日志 日志记录系统和用户活动,用于监控、审计和调查。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 12 / PDF P1228

第 1228 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

hand, disaster recovery planners must emphasize solid risk-management principles and ensure that resources aren't overallocated to terrorist threats to the detriment of other DRP/BCP activities that protect against more likely threats. Bombings/Explosions Explosions can result from a variety of human-made occurrences. Explosive gases from leaks might fill a room/building and later ignite and cause a damaging blast. In many areas, bombings are also cause for concern. From a disaster planning perspective, the effects of bombings and explosions are like those caused by a large-scale fire.

However, planning to avoid the impact of a bombing is much more difficult and relies on the physical security measures we covered in Chapter 10, “Physical Security Requirements.” Power Outages Even the most basic disaster recovery plan contains provisions to deal with the threat of a short power outage. Critical business systems are often protected by uninterruptible power supply (UPS) devices to keep them running at least long enough to shut down or long enough to get emergency generators up and working. Even so, could your organization keep operating during a sustained power outage? After Hurricane Harvey made landfall in 2017, millions of people in Texas lost power.

Similar power outages occurred in 2020 in response to the California wildfires. Does your business continuity plan include provisions to keep your business viable during a prolonged period without power? If so, what is your planning horizon? Do you need enough fuel and other supplies to last for 48 hours? Seven days? Does your disaster recovery plan make ample preparations for the timely restoration of power even if the commercial power grid remains unavailable? All of these decisions should be made based on the requirements in your business continuity and disaster recovery plans.

中文直译 / 整理

另一方面,灾难恢复规划者必须强调坚实的风险管理原则,确保资源不会过度 分配给恐怖威胁,而忽视了其他更能防范更可能发生威胁的DRP/BCP活动。 爆炸/爆炸事件 爆炸可能由多种人为事件引发。 泄漏的易燃气体可能充满房间或建筑物,随后 点燃并造成破坏性爆炸。 在许多地区,爆炸袭击也令人担忧。 从灾难规划的角 度来看,爆炸和爆炸事件的影响类似于大规模火灾造成的后果。 然而,预防爆 炸袭击的影响要困难得多,依赖于我们在第10章中介绍的物理安全措施。 停电 即使是最基本的灾难恢复计划,也包含应对短期停电威胁的措施。 关键业务 系统通常由不间断电源(UPS)设备保护,以确保其至少能运行足够长的时 间来安全关闭,或直到应急发电机启动并运行。 即便如此,您的组织在持续 停电期间能否继续运营? 2017年飓风哈维登陆后,德克萨斯州数百万人断电。 2020年加利福尼亚野火期 间也发生了类似的停电事件。 您的业务连续性计划是否包含在长时间断电期间 维持业务运营的措施? 如果是,您的规划周期是多长? 您是否需要足够的燃料 和其他物资来维持48小时? 七天? 您的灾难恢复计划是否为在商业电网仍不可 用的情况下及时恢复电力做了充分准备?

所有这些决策都应基于您的业务连续 性和灾难恢复计划中的要求。

小白解释

场景先行:员工在家访问公司系统,流量要穿过家庭网络、互联网、防火墙、VPN、服务器。网络安全题就是让你判断问题发生在哪一层、用哪个控制放在什么位置。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:不分层就会乱选设备:该加密的地方装防火墙,该监测的地方却只做访问控制。

你作为负责人可以这样想:先定位网络层次,再决定是分段、过滤、加密、检测还是阻断。

本页术语用人话说:

OSI 模型:OSI 用七层结构理解网络通信,从物理层到应用层。

业务连续性计划 BCP:BCP 关注业务在灾难或中断中如何继续运行。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

读完后用一句话复述:如果我是网络安全工程师,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1228 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是网络安全工程师在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

网络题先定位层次,再判断协议、设备或攻击位置。

BCP 保护业务流程,DRP 保护 IT 恢复。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

本页术语拆解
OSI 模型 OSI 用七层结构理解网络通信,从物理层到应用层。
业务连续性计划 BCP BCP 关注业务在灾难或中断中如何继续运行。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 13 / PDF P1229

第 1229 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Check your UPSs regularly. These critical devices are often overlooked until they become necessary. Many UPSs contain self-testing mechanisms that report problems automatically, but it's still a good idea to subject them to regular testing. Also, be sure to audit the number and type of devices plugged into each UPS. It's amazing how many people think it's okay to add “just one more system” to a UPS, and you don't want to be surprised when the device can't handle the load during a real power outage!

Today's technology-driven organizations depend increasingly on electric power, so your BCP/DRP team should consider provisioning alternative power sources that can run business systems for an extended period of time. An adequate backup generator could make a huge difference when the survival of your business is at stake. Network, Utility, and Infrastructure Failures When planners consider the impact that utility outages may have on their organizations, they naturally think first about the impact of a power outage. However, keep other utilities in mind, too. Do any of your critical business systems rely on water, sewers, natural gas, or other utilities?

Also consider regional infrastructure such as highways, airports, and railroads. Any of these systems can suffer failures that might not be related to weather or other conditions described in this chapter. Many businesses depend on one or more of these infrastructure elements to move people or materials. Their failure can paralyze your business's ability to continue functioning. You must also think about your internet connectivity as a utility service. Do you have sufficient redundancy in your connectivity options to survive or recover quickly from a disaster? If you have redundant providers, do they have any single points of failure?

For example, do they both enter your building in a single fiber conduit that could be severed? If there are no alternative fiber ingress points, can you supplement a fiber connection with wireless connectivity? Do your alternate processing sites have sufficient network capacity to carry the full burden of operations in the event of a disaster?

中文直译 / 整理

定期检查您的UPS设备。 这些关键设备常常被忽视,直到需要时才被想 起。 许多UPS内置自检机制,可自动报告问题,但定期进行测试仍然是个好 主意。 同时,请务必审计每个UPS上连接的设备数量和类型。 令人惊讶的是, 仍有大量人认为在UPS上再增加“一个系统”是可以接受的,而您不希望在 真实断电时发现设备无法承受负载! 当今以技术为导向的组织越来越依赖电力,因此您的业务连续性计划/灾难恢 复计划团队应考虑配备能够长时间运行业务系统的备用电源。 在企业生存面临 威胁时,一台充足的备用发电机可能起到巨大作用。 网络、公用事业和基础设施故障 当规划者考虑公用事业中断对组织的影响时,他们自然首先想到停电的影响。 然而,也要考虑其他公用事业。 您的关键业务系统是否依赖于水、污水、天然 气或其他公用事业? 还要考虑区域基础设施,如高速公路、机场和铁路。 这些 系统中的任何一个都可能发生故障,而这些故障可能与本章所述的天气或其他 条件无关。 许多企业依赖一个或多个这些基础设施元素来运输人员或物资。 它 们的故障会使您的业务无法继续运作。 您还必须将您的互联网连接视为一种公共服务。

您的连接选项是否具有足够 的冗余,以在灾难发生时维持运营或快速恢复? 如果您拥有冗余的提供商, 它们是否存在单点故障? 例如,它们是否都通过同一根光纤管道进入您的大 楼,而该管道可能被切断? 如果没有其他光纤接入点,您能否用无线连接来 补充光纤连接? 您的备用处理站点是否具有足够的网络容量,以在灾难发生 时承担全部运营负荷?

小白解释

场景先行:新员工入职后要登录系统。第一步是声明身份,第二步证明身份,第三步决定能访问哪些数据,最后系统要记录他做了什么。IAM 题就是围绕这条链条出题。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:认证成功不代表什么都能做;离职、调岗、权限漂移都会造成越权。

你作为负责人可以这样想:把识别、认证、授权、审计分开看,再用最小权限和定期复核收口。

本页术语用人话说:

审计:审计记录主体行为,用于追责、复盘和取证。

审计:审计检查控制是否存在、是否有效、是否符合要求。

日志:日志记录系统和用户活动,用于监控、审计和调查。

业务连续性计划 BCP:BCP 关注业务在灾难或中断中如何继续运行。

常见误区:不要把 authentication 和 authorization 混成一件事:前者证明你是谁,后者决定你能干什么。

读完后用一句话复述:如果我是IAM 管理员,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1229 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是IAM 管理员在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

没有日志和身份绑定,就很难问责。

审计题关注独立性、证据、范围和报告。

日志要保护完整性、时间同步和访问控制。

BCP 保护业务流程,DRP 保护 IT 恢复。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要把 authentication 和 authorization 混成一件事:前者证明你是谁,后者决定你能干什么。

本页术语拆解
审计 审计记录主体行为,用于追责、复盘和取证。
审计 审计检查控制是否存在、是否有效、是否符合要求。
日志 日志记录系统和用户活动,用于监控、审计和调查。
业务连续性计划 BCP BCP 关注业务在灾难或中断中如何继续运行。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 14 / PDF P1230

第 1230 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

If you quickly answered “no” to the question whether you have critical business systems that rely on water, sewers, natural gas, or other utilities, think again. Do you consider people a critical business system? If a major storm knocks out the water supply to your facilities and you need to keep those facilities up and running, can you supply your employees with enough drinking water to meet their needs? What about your fire protection systems? If any of them are water-based, is there a holding tank system in place that contains ample water to extinguish a serious building fire if the public water system is unavailable?

Fires often cause serious damage in areas ravaged by storms, earthquakes, and other disasters that might also interrupt the delivery of water. Hardware/Software Failures Like it or not, computer systems fail. Hardware components simply wear out and refuse to continue performing, or they suffer physical damage. Software systems contain bugs or fall prey to improper or unexpected inputs. For this reason, BCP/DRP teams must provide adequate redundancy in their systems.

If zero downtime is a mandatory requirement, one solution is to use fully redundant failover servers in separate locations attached to separate communications links and infrastructures (also designed to operate in a failover mode). If one server is damaged or destroyed, the other will instantly take over the processing load. For more information on this concept, see the section “Remote Mirroring,” later in this chapter. Because of financial constraints, it isn't always feasible to maintain fully redundant systems. In those circumstances, the BCP/DRP team should address how replacement parts can be quickly obtained and installed.

As many parts as possible should be kept in a local parts inventory for quick replacement; this is especially true for hard-to-find parts that must otherwise be shipped in. After all, how many organizations could do without telephones for three days while a critical private branch exchange (PBX) component is en route from an overseas location to be installed on-site?

中文直译 / 整理

如果您对“您的关键业务系统是否依赖于水、污水、天然气或其他公用 设施”这一问题迅速回答了“否”,请重新思考。 您是否将人员视为关键业 务系统? 如果一场重大风暴导致您的设施供水中断,而您需要保持这些设施 正常运行,您能否为员工提供足够的饮用水以满足其需求? 您的消防系统如何? 如果其中任何系统是水基的,是否配备了储水系统, 能够在公共供水系统中断时提供充足水量以扑灭严重的建筑火灾? 火灾常 常在遭受风暴、地震及其他灾难破坏的地区造成严重损失,而这些灾难也 可能导致供水中断。 硬件/软件故障 无论是否愿意,计算机系统都会发生故障。 硬件组件会因磨损而停止工作,或 遭受物理损坏。 软件系统则可能包含漏洞,或因不当或意外输入而失效。 因此, 业务连续性计划/灾难恢复计划团队必须在其系统中提供足够的冗余。 如果零停 机是强制性要求,一种解决方案是使用位于不同位置、连接独立通信链路和基 础设施(同样设计为故障切换模式)的完全冗余故障切换服务器。 当一台服务 器受损或被毁时,另一台会立即接管处理负载。 有关此概念的更多信息,请参 见本章后续的“远程镜像”部分。 由于财务限制,维持完全冗余的系统并不总是可行的。

在这种情况下, BCP/DRP团队应解决如何快速获取和安装替换部件的问题。 尽可能多的部件应 存放在本地备件库存中,以便快速更换; 对于难以找到的部件,这一点尤其重 要,因为这些部件 otherwise 必须从外地运输。 毕竟,有多少组织能在关键的 专用交换机(PBX)组件从海外运抵现场安装的三天内,没有电话可用呢?

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

业务连续性计划 BCP:BCP 关注业务在灾难或中断中如何继续运行。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1230 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

BCP 保护业务流程,DRP 保护 IT 恢复。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
业务连续性计划 BCP BCP 关注业务在灾难或中断中如何继续运行。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 15 / PDF P1231

第 1231 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

NYC Blackout On August 14, 2003, the lights went out in New York City and in large areas of the northeastern and midwestern United States when a series of cascading failures caused the collapse of a major power grid. Fortunately, security professionals in the New York area were ready. Many businesses had already updated their disaster recovery plans and took steps to ensure their continued operations in the wake of a disaster. This blackout served to test those plans, and many organizations were able to continue operating on alternate power sources or to transfer control seamlessly to off-site data-processing centers.

Although this blackout occurred at the turn of the century, the lessons learned still offer insight for BCP/DRP teams around the world today. The lessons we continue to take away today include the following: Ensure that alternate processing sites are far enough away from your main site that they are unlikely to be affected by the same disaster. Remember that threats to your organization are both internal and external. Your next disaster may come from a terrorist attack, a building fire, or malicious code running loose on your network. Take steps to ensure that your alternate sites are segregated from the main facility to protect against all of these threats.

Disasters don't usually come with advance warning. If real-time operations are critical to your organization, be sure that your backup sites are ready to assume primary status at a moment's notice. Strikes/Picketing When designing your business continuity and disaster recovery plans, don't forget about the importance of the human factor in emergency planning. One form of human-made disaster that is often overlooked is the possibility of a strike or other labor crisis. If a large number of your employees walk out at the same time, what impact would that have on your business? How long

中文直译 / 整理

纽约大停电 2003年8月14日,由于一系列连锁故障导致主要电网崩溃,纽约市以及美 国东北部和中西部广大地区的灯光熄灭。 幸运的是,纽约地区的安全专业人员已做好准备。 许多企业已经更新了灾 难恢复计划,并采取措施确保在灾难发生后能够持续运营。 此次停电检验 了这些计划,许多组织能够依靠备用电源继续运营,或无缝将控制权转移 至异地数据处理中心。 尽管此次停电发生在世纪之交,但从中汲取的教训至今仍为全球的 BCP/DRP团队提供宝贵启示。 我们今天仍需铭记的教训包括以下几点: 确保备用 processin g sites are far enou gh awa y from your 主站点,它们不太可能受到同一灾难的影响。 请记住,对您组织的威胁既来自内部,也 来自外部。 您的下一次灾难可能来自恐怖袭击、 建筑物火灾,或在网络中肆虐的恶意代码。 采取措施确保您的备用站点 与主设施隔离,以防范所有这些威胁。 灾难通常不会提前预警。 如果实时 o p操作对 y我们的或g组织 , 确保 y我们的备份 站点随时准备接管主要角色。 罢工/示威 在制定业务连续性和灾难恢复计划时,不要忽视人为因素在应急规划中的重要 性。

一种常被忽视的人为灾难是罢工或其他劳工危机的可能性。 如果大量员工 同时离职,这对您的业务会产生什么影响? 多久

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

业务连续性计划 BCP:BCP 关注业务在灾难或中断中如何继续运行。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

恶意代码:恶意代码包括病毒、蠕虫、木马、勒索软件等。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1231 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

BCP 保护业务流程,DRP 保护 IT 恢复。

RTO 是多久恢复,RPO 是能丢多少数据。

防恶意代码要结合补丁、最小权限、检测、备份和用户培训。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
业务连续性计划 BCP BCP 关注业务在灾难或中断中如何继续运行。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
恶意代码 恶意代码包括病毒、蠕虫、木马、勒索软件等。
学习单元 16 / PDF P1232

第 1232 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

would you be able to sustain operations without the regular full-time employees that staff a certain area? Your BCP and DRP teams should address these concerns and provide alternative plans should a labor crisis occur. Labor issues normally fall outside the purview of cybersecurity teams, offering a great example of an issue that should be included in a disaster recovery plan but requires input and leadership from other business functions, such as human resources and operations. Theft/Vandalism Earlier, we talked about the threat that terrorist activities pose to an organization. Theft and vandalism represent the same kind of threat on a much smaller scale.

In most cases, however, there's a far greater chance that your organization will be affected by theft or vandalism than by a terrorist attack. The theft or destruction of a critical infrastructure component, such as scrappers stealing copper wires or vandals destroying sensors, can negatively impact critical business functions. Insurance provides some financial protection against these events (subject to deductibles and limitations of coverage), but acts of this kind can cause serious damage to your business, on both a short-term and a long-term basis.

Your business continuity and disaster recovery plans should include adequate preventive measures to control the frequency of these occurrences as well as contingency plans to mitigate the effects theft and vandalism have on ongoing operations. Theft of infrastructure is becoming increasingly common as scrappers target copper in air-conditioning systems, plumbing, and power subsystems. It's a common mistake to assume that fixed infrastructure is unlikely to be a theft target.

中文直译 / 整理

您能在没有常规全职员工支持特定区域的情况下维持运营? 您的BCP和DRP团 队应解决这些问题,并在发生劳工危机时提供替代方案。 劳工问题通常不属于 网络安全团队的职责范围,这很好地说明了应当纳入灾难恢复计划但需要人力 资源和运营等其他业务部门提供意见和领导的问题。 盗窃/破坏 之前,我们讨论了恐怖活动对组织构成的威胁。 盗窃和破坏则是以小得多的规 模带来类似的威胁。 然而,在大多数情况下,您的组织遭受盗窃或破坏的可能 性远大于遭受恐怖袭击的可能性。 关键基础设施组件的被盗或破坏,例如废品 回收者偷窃铜线或破坏者摧毁传感器,可能会对关键业务功能造成负面影响。 保险可在一定程度上为这些事件提供财务保障(需扣除免赔额并受保障范围限 制),但此类行为可能对您的业务造成短期和长期的严重损害。 您的业务连续 性和灾难恢复计划应包含充分的预防措施,以控制此类事件的发生频率,并制 定应急计划,以减轻盗窃和破坏对日常运营的影响。 随着废品回收者瞄准空调系统、管道和电力子系统中的铜材,基础设 施盗窃正变得越来越普遍。 错误地认为固定基础设施不太可能成为盗窃目 标是一种常见误区。

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

业务连续性计划 BCP:BCP 关注业务在灾难或中断中如何继续运行。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1232 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

BCP 保护业务流程,DRP 保护 IT 恢复。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
业务连续性计划 BCP BCP 关注业务在灾难或中断中如何继续运行。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 17 / PDF P1233

第 1233 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Off-site Challenges to Security The constant threat of theft and vandalism is the bane of information security professionals worldwide. Personally identifiable information, proprietary or trade secrets, and other forms of confidential data are just as interesting to those who create and possess them as they are to direct competitors and other unauthorized parties. Here's an example. Aaron knows the threats to confidential data firsthand, working as a security officer for a prominent and highly visible computing enterprise. His chief responsibility is to keep sensitive information from exposure to various elements and entities.

Bethany is one of his more troublesome employees because she's constantly taking her notebook computer offsite without properly securing its contents. Even a casual smash-and-grab theft attempt could put thousands of client contacts and their confidential business dealings at risk of being leaked and possibly sold to malicious parties. Aaron knows the potential dangers, but Bethany just doesn't seem to care. This poses the question: How might you better inform, train, or advise Bethany so that Aaron does not have to relieve her of her position should her notebook be stolen? Bethany must come to understand and appreciate the importance of keeping sensitive information secure.

It may be necessary to emphasize the potential loss and exposure that comes with losing such data to wrongdoers, competitors, or other unauthorized third parties. It may suffice to point out to Bethany that the employee handbook clearly states that employees whose behavior leads to the unauthorized disclosure or loss of information assets are subject to loss of pay or termination. If such behavior recurs after a warning, Bethany should be rebuked and reassigned to a position where she can't expose sensitive or proprietary information—that is, if she's not fired on the spot.

中文直译 / 整理

远程安全挑战 盗窃和破坏的持续威胁是全球信息安全专业人员的噩梦。 个人身份信息、 专有信息或商业秘密以及其他形式的机密数据,对创建和拥有它们的人来 说,与对直接竞争对手和其他未经授权的第三方一样重要。 以下是一个示 例。 亚伦作为一名知名且高度可见的计算企业的安全官员,亲身经历了机密数 据面临的威胁。 他的主要职责是防止敏感信息暴露于各种因素和实体。 贝 瑟尼是他最麻烦的员工之一,因为她总是未经妥善保护内容就将笔记本电 脑带离现场。 即使是一次随意的砸窗盗窃行为,也可能导致成千上万的客户联系信息及其 机密商业往来面临泄露甚至被出售给恶意方的风险。 亚伦深知潜在的危险, 但贝瑟尼似乎根本不关心。 这提出了一个问题:如何更好地向贝瑟尼提供信息、培训或建议,以便在她 的笔记本电脑被盗时,亚伦无需解除她的职务? 贝瑟尼必须理解并认识到保 护敏感信息的重要性。 可能有必要强调,此类数据一旦落入不法分子、竞争 对手或其他未经授权的第三方手中,可能带来的损失和暴露风险。 或许只需 向贝瑟尼指出,员工手册中明确说明,因行为导致信息资产被未经授权披露 或丢失的员工,将面临扣薪或解雇的后果。

如果在警告后此类行为再次发生, 贝瑟尼应受到训斥并调至无法接触敏感或专有信息的岗位——当然,如果情 节严重,也可立即解雇。

小白解释

场景先行:新员工入职后要登录系统。第一步是声明身份,第二步证明身份,第三步决定能访问哪些数据,最后系统要记录他做了什么。IAM 题就是围绕这条链条出题。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:认证成功不代表什么都能做;离职、调岗、权限漂移都会造成越权。

你作为负责人可以这样想:把识别、认证、授权、审计分开看,再用最小权限和定期复核收口。

本页术语用人话说:

授权:授权是认证之后决定你能访问什么、能做什么。

资产:资产是组织认为有价值、需要保护的东西,可以是数据、系统、人员、设施或声誉。

OSI 模型:OSI 用七层结构理解网络通信,从物理层到应用层。

身份:身份是主体在系统中的标识。

常见误区:不要把 authentication 和 authorization 混成一件事:前者证明你是谁,后者决定你能干什么。

读完后用一句话复述:如果我是IAM 管理员,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1233 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是IAM 管理员在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

认证成功不等于什么都能做;权限仍要单独授权。

资产安全题先问资产是谁拥有、如何分类、谁负责保护。

网络题先定位层次,再判断协议、设备或攻击位置。

身份管理题要区分识别、认证、授权、审计。

排除法提醒:不要把 authentication 和 authorization 混成一件事:前者证明你是谁,后者决定你能干什么。

本页术语拆解
授权 授权是认证之后决定你能访问什么、能做什么。
资产 资产是组织认为有价值、需要保护的东西,可以是数据、系统、人员、设施或声誉。
OSI 模型 OSI 用七层结构理解网络通信,从物理层到应用层。
身份 身份是主体在系统中的标识。
学习单元 18 / PDF P1234

五大支柱与 CIA 三元组

先把安全目标分成机密性、完整性、可用性,再理解真实性和不可否认性。

教材原文段落

Keep in mind the impact that theft may have on your operations when planning your parts inventory. It's a good idea to keep extra inventory of items with a high pilferage rate, such as RAM chips and mobile devices. It's also a good idea to keep such materials in secure storage and to require employees to sign such items out whenever they are used. Understand System Resilience, High Availability, and Fault Tolerance Technical controls that add to system resilience and fault tolerance directly affect availability, one of the core goals of the CIA Triad (confidentiality, integrity, and availability).

A primary goal of system resilience and fault tolerance is to eliminate single points of failure in critical business systems. A single point of failure (SPOF) is any component that can cause an entire system to fail. If a computer has data on a single disk, failure of the disk can cause the computer to fail, so the disk is a single point of failure. If a database-dependent website includes multiple web servers all served by a single database server, the database server is a single point of failure. System resilience refers to the ability of a system to maintain an acceptable level of service during an adverse event.

This could be a hardware fault managed by fault-tolerant components, or it could be an attack managed by other controls such as effective intrusion prevention systems. In some contexts, it refers to the ability of a system to return to a previous state after an adverse event. For example, if a primary server in a failover cluster fails, fault tolerance ensures that the system fails over to another server. System resilience implies that the cluster can fail back to the original server after the original server is repaired. Fault tolerance is the ability of a system to suffer a fault but continue to operate.

Fault tolerance is achieved by adding redundant components, such as additional disks within a properly configured RAID array or additional servers within a failover clustered configuration. High availability is the use of redundant technology components to allow a system to quickly recover from a failure after experiencing a brief disruption.

中文直译 / 整理

在规划零部件库存时,请务必考虑盗窃对运营可能造成的影响。 对于盗 窃率较高的物品,如内存芯片和移动设备,保留额外库存是个好主意。 同时, 也建议将此类物资存放在安全地点,并要求员工在使用时签字领取。 理解系统弹性、高可用性和容错性 增强系统弹性和容错性的技术控制措施直接影响可用性,而可用性是CIA三 元组(机密性、完整性和可用性)的核心目标之一。 系统弹性和容错性的主 要目标是消除关键业务系统中的单点故障。 单点故障(SPOF)是指任何可能导致整个系统失效的组件。 如果一台计算机的数 据仅存储在单个磁盘上,那么该磁盘的故障将导致计算机失效,因此该磁盘就是 一个单点故障。 如果一个依赖数据库的网站由多个Web服务器提供服务,但这些 服务器都由单一的数据库服务器支持,那么该数据库服务器就是一个单点故障。 系统弹性是指系统在遭遇不利事件时仍能维持可接受服务水平的能力。 这可能 是由容错组件管理的硬件故障,也可能是由其他控制措施(如有效的入侵防御 系统)管理的攻击。 在某些语境中,它指系统在遭遇不利事件后恢复到先前状 态的能力。 例如,如果故障转移集群中的主服务器发生故障,容错机制将确保 系统切换到另一台服务器。

系统弹性意味着在原始服务器修复后,集群能够切 换回原始服务器。 容错是指系统在发生故障时仍能继续运行的能力。 通过添加冗余组件(例如在 正确配置的RAID阵列中增加磁盘,或在故障转移集群配置中增加服务器)来实 现容错。 高可用性是通过使用冗余技术组件,使系统在经历短暂中断后能够快速从故障中恢 复。

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:先把安全目标分成机密性、完整性、可用性,再理解真实性和不可否认性。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

CIA 三元组:机密性、完整性、可用性是安全目标的三根主梁。

机密性:机密性让该看的人能看,不该看的人看不到。

完整性:完整性保证数据没有被未授权修改,并且仍然正确可信。

可用性:可用性保证授权用户需要时能及时使用系统和数据。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“五大支柱与 CIA 三元组”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

泄露看机密性,篡改看完整性,中断/不可访问看可用性。

加密、访问控制、分类、培训都常用于保护机密性。

哈希、数字签名、变更控制、输入校验常对应完整性。

冗余、备份、BCP/DRP、抗 DoS、容量规划都对应可用性。

IPS 放在线路中,误报可能影响可用性。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
CIA 三元组 机密性、完整性、可用性是安全目标的三根主梁。
机密性 机密性让该看的人能看,不该看的人看不到。
完整性 完整性保证数据没有被未授权修改,并且仍然正确可信。
可用性 可用性保证授权用户需要时能及时使用系统和数据。
入侵防御系统 IPS IPS 可检测并主动阻断恶意流量。
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 19 / PDF P1235

可用性:需要时能用,且性能可接受

可用性关注中断、故障、DoS、备份和冗余。

教材原文段落

High availability is often achieved through the use of load balancing and failover servers. Technology professionals measure the objective and effectiveness of these controls by the percentage of the time that a system is available. For example, a fairly low availability threshold would be to specify that a system must be available 99.9 percent of the time (or “three nines” of availability). This means that the system may only experience 0.1 percent of downtime during whatever period is measured. If you apply this metric to a 30-day month of system operation, 99.9 percent availability would require less than 44 minutes of downtime.

If you move to a 99.999 percent (or “five nines”) requirement, the system would only be permitted 26 seconds of downtime per month. Of course, the stronger your availability requirement, the more difficult it will be to meet. Achieving higher availability targets on a consistent basis requires the use of high availability, fault tolerance, and system resilience controls. Protecting Hard Drives A common way that fault tolerance and system resilience is added for computers is with a RAID array. A RAID array includes two or more disks, and most RAID configurations will continue to operate even after one of the disks fails.

Some of the common RAID configurations are as follows: RAID-0 This is also called striping. It uses two or more disks and improves the disk subsystem performance, but it does not provide fault tolerance. RAID-1 This is also called mirroring. It uses two disks, which both hold the same data. If one disk fails, the other disk includes the data so that a system can continue to operate after a single disk fails. Depending on the hardware used and which drive fails, the system may be able to continue to operate without intervention, or the system may need to be manually configured to use the drive that didn't fail. RAID-5 This is also called striping with parity.

It uses three or more disks with the equivalent of one disk holding parity information. This parity information is distributed and allows the reconstruction of data through mathematical calculations if a single disk is lost. If any single disk fails, the RAID array will continue to operate, though it will be slower. RAID-6 This offers an alternative approach to disk striping with parity. It functions in the same manner as RAID-5 but with dual distributed parity

中文直译 / 整理

高可用性通常通过使用负载均衡和故障转移服务器来实现。 技术专业人员通过系统可用时间的百分比来衡量这些控制措施的客观性和有效 性。 例如,一个相对较低的可用性阈值是规定系统必须99.9%的时间保持可用 (即“三个九”可用性)。 这意味着在所测量的任何时间段内,系统停机时间 不得超过0.1%。 如果将此指标应用于30天的系统运行周期,99.9%的可用性要 求停机时间少于44分钟。 如果提升至99.999%(即“五个九”)的要求,系统 每月允许的停机时间仅为26秒。 当然,可用性要求越高,实现起来就越困难。 要持续达到更高的可用性目标, 必须采用高可用性、容错和系统弹性控制措施。 保护硬盘 为计算机增加容错和系统弹性的常见方法是使用RAID阵列。 RAID阵列包含 两个或更多磁盘,大多数RAID配置在其中一个磁盘发生故障时仍能继续运行。 一些常见的RAID配置如下: RAID-0 这也称为 条带化。 它使用两个或更多磁盘,并提升 磁盘子系统的性能,但不提供容错能力。 RAID-1 这也称为 镜像。 它使用两个磁盘,两者保存相同的数据。 如果一个 磁盘损坏,另一个磁盘包含数据,因此系统在单个磁盘故障后仍可继续运行。

根据所使用的硬件和哪个驱动器故障,系统可能能够在无需人工干预的情况 下继续运行,或者可能需要手动配置以使用未故障的驱动器。 RAID-5 这也称为 带奇偶校验的条带化。 它使用三个或更多磁盘,其中相当于 一个磁盘的空间用于存储奇偶校验信息。 这些奇偶校验信息被分布存储,当丢 失单个磁盘时,可通过数学计算重建数据。 如果任何单个磁盘故障,RAID 阵列 仍可继续运行,但速度会变慢。 RAID-6 这提供了一种不同于带奇偶校验的磁盘条带化的替代方法。 它的工作方式 与RAID‑5相同,但具有双分布式奇偶校验

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:可用性关注中断、故障、DoS、备份和冗余。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

可用性:可用性保证授权用户需要时能及时使用系统和数据。

日志:日志记录系统和用户活动,用于监控、审计和调查。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“可用性:需要时能用,且性能可接受”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

冗余、备份、BCP/DRP、抗 DoS、容量规划都对应可用性。

日志要保护完整性、时间同步和访问控制。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
可用性 可用性保证授权用户需要时能及时使用系统和数据。
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 20 / PDF P1236

可用性:需要时能用,且性能可接受

可用性关注中断、故障、DoS、备份和冗余。

教材原文段落

stored on the equivalent of two disks, protecting against the failure of two separate disks but requiring a minimum of four disks to implement. RAID-10 This is also known as RAID 1 + 0 or a stripe of mirrors, and it is configured as two or more mirrors (RAID-1), with each mirror configured in a striped (RAID-0) configuration. It uses at least four disks but can support more as long as an even number of disks are added. It will continue to operate even if multiple disks fail, as long as at least one drive in each mirror continues to function. For example, if it had three mirrored sets (called M1, M2, and M3 for this example) it would have a total of six disks.

If one drive in M1, one in M2, and one in M3 all failed, the array would continue to operate. However, if two drives in any of the mirrors failed, such as both drives in M1, the entire array would fail. Fault tolerance is not the same as a backup. Occasionally, management may balk at the cost of backup tapes and point to the RAID array, saying that the data is already backed up. However, if a catastrophic hardware failure destroys a RAID array, all the data is lost unless a backup exists. Similarly, if an accidental deletion or corruption destroys data, it cannot be restored if a backup doesn't exist. Both softwareand hardware-based RAID solutions are available.

Softwarebased systems require the operating system to manage the disks in the array and can reduce overall system performance. They are relatively inexpensive, since they don't require any additional hardware other than the additional disk(s). Hardware RAID systems are generally more efficient and reliable. Although a hardware RAID is more expensive, the benefits outweigh the costs when used to increase availability of a critical component. Hardware-based RAID arrays typically include spare drives that can be logically added to the array. For example, a hardware-based RAID-5 could include five disks, with three disks in a RAID-5 array and two spare disks.

If one disk fails, the hardware senses the failure and logically swaps out the faulty drive with a good spare. Additionally, most hardware-based arrays support hot swapping, allowing technicians to replace failed disks without powering down the system. A cold-swappable RAID requires the system to be powered down to replace a faulty drive.

中文直译 / 整理

存储在相当于两块磁盘的空间上,可防范两块独立磁盘的故障,但实现时至少 需要四块磁盘。 RAID-10 这也被称为 RAID 1 + 0 或 镜像条带,它被配置为两个或更多镜像( RAID‑1),每个镜像均采用条带化(RAID‑0)配置。 它至少需要四块磁盘,但 只要添加偶数块磁盘,就可以支持更多磁盘。 即使多个磁盘发生故障,只要每个 镜像中至少有一个驱动器正常工作,阵列仍能继续运行。 例如,如果它有三个镜 像集(本例中称为 M1、M2 和 M3),则总共会有六块磁盘。 如果 M1 中一块、 M2 中一块、M3 中一块磁盘全部损坏,阵列仍能继续运行。 然而,如果任何一 个镜像中的两块磁盘都损坏,例如 M1 中的两块磁盘都损坏,整个阵列就会失效。 容错并不等同于备份。 有时,管理层可能会对备份磁带的成本感到犹 豫,并指向 RAID 阵列,声称数据已经备份。 然而,如果灾难性硬件故障 导致 RAID 阵列损坏,除非存在备份,否则所有数据都将丢失。 同样,如 果意外删除或数据损坏导致数据丢失,而没有备份,则无法恢复。 可用基于软件和硬件的RAID解决方案。 基于软件的系统需要操作系统来管理阵 列中的磁盘,可能会降低整体系统性能。

由于不需要除额外磁盘以外的任何其 他硬件,因此相对便宜。 硬件RAID系统通常更高效、更可靠。 尽管硬件 RAID成本更高,但在用于提高关键组件的可用性时,其优势大于成本。 基于硬件的RAID阵列通常包含可以逻辑添加到阵列中的备用驱动器。 例如, 一个基于硬件的RAID‑5阵列可能包含五个磁盘,其中三个磁盘组成RAID‑5阵 列,另外两个为备用磁盘。 如果一个磁盘发生故障,硬件会检测到该故障,并 逻辑地将故障驱动器替换为一个正常的备用驱动器。 此外,大多数基于硬件的 阵列都支持热插拔,允许技术人员在不关闭系统的情况下更换故障磁盘。 冷插 拔RAID则要求在更换故障驱动器前必须关闭系统。

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:可用性关注中断、故障、DoS、备份和冗余。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

可用性:可用性保证授权用户需要时能及时使用系统和数据。

日志:日志记录系统和用户活动,用于监控、审计和调查。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“可用性:需要时能用,且性能可接受”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

冗余、备份、BCP/DRP、抗 DoS、容量规划都对应可用性。

日志要保护完整性、时间同步和访问控制。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
可用性 可用性保证授权用户需要时能及时使用系统和数据。
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 21 / PDF P1237

第 1237 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Protecting Servers Fault tolerance can be added for critical servers with failover clusters. A failover cluster includes two or more servers, and if one of the servers fails, another server in the cluster can take over its load in an automatic process called failover. Failover clusters can include multiple servers (not just two), and they can also provide fault tolerance for multiple services or applications. As an example of a failover cluster, consider Figure 18.3. It shows multiple components put together to provide reliable web access for a heavily accessed website that uses a database. DB1 and DB2 are two database servers configured in a failover cluster.

At any given time, only one server will function as the active database server, and the second server will be inactive. For example, if DB1 is the active server it will perform all the database services for the website. DB2 monitors DB1 to ensure it is operational, and if DB2 senses a failure in DB1, it will cause the cluster to automatically fail over to DB2. In Figure 18.3, you can see that both DB1 and DB2 have access to the data in the database. This data is stored on a RAID array, providing fault tolerance for the disks. Additionally, the three web servers are configured in a network loadbalancing cluster.

The load balancer can be hardwareor software-based, and it balances the client load across the three servers. It makes it easy to add additional web servers to handle increased load while also balancing the load among all the servers. If any of the servers fail, the load balancer can sense the failure and stop sending traffic to that server. Although network load balancing is primarily used to increase the scalability of a system so that it can handle more traffic, it also provides a measure of fault tolerance.

中文直译 / 整理

保护服务器 对于关键服务器,可以通过故障转移集群添加容错功能。 故障转移集群包含两 台或更多服务器,当其中一台服务器发生故障时,集群中的另一台服务器可以 通过一种称为故障转移的自动过程接管其负载。 故障转移集群可以包含多台服 务器(不止两台),并且还可以为多个服务或应用程序提供容错功能。 作为故障转移集群的一个示例,请参见图 18.3。 该图展示了多个组件如何组合 在一起,为使用数据库的高访问量网站提供可靠的网页访问服务。 DB1 和 DB2 是两个配置为故障转移集群的数据库服务器。 在任何给定时间,只有一个 服务器将作为活动数据库服务器运行,而第二个服务器则处于非活动状态。 例 如,如果 DB1 是活动服务器,它将为网站执行所有数据库服务。 DB2 会监控 DB1 以确保其正常运行,如果 DB2 检测到 DB1 故障,它将触发集群自动故障 切换至 DB2。 在图 18.3中,您可以了解到 DB1 和 DB2 都能访问数据库中的数据。 这些数据 存储在 RAID 阵列上,为磁盘提供了容错能力。 此外,这三台Web服务器配置在一个网络负载均衡集群中。 负载均衡器可以是 硬件或软件形式,它将客户端负载均衡分配到这三台服务器上。

这使得在需要 处理更大负载时,可以轻松添加额外的Web服务器,同时在所有服务器之间均 衡负载。 如果任何一台服务器发生故障,负载均衡器能够检测到故障并停止向 该服务器发送流量。 尽管网络负载均衡主要用于提高系统的可扩展性,以处理 更多流量,但它也提供了某种程度的容错能力。

小白解释

场景先行:你是公司的安全负责人,正在读第 1237 页这一组概念。老板不会问你背定义,而是问:这件事会不会影响业务、谁负责、要不要花钱、出了事能不能解释清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:概念没放进业务场景,容易只背词,做题时不知道该选管理动作还是技术动作。

你作为负责人可以这样想:先确认业务目标和风险,再选控制措施,最后留下政策、审批、日志或证据。

本页术语用人话说:

程序:程序是一步一步怎么做。

常见误区:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

读完后用一句话复述:如果我是安全负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1237 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是安全负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Step-by-step、SOP 常对应 procedure。

排除法提醒:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

本页术语拆解
程序 程序是一步一步怎么做。
学习单元 22 / PDF P1238

可用性:需要时能用,且性能可接受

可用性关注中断、故障、DoS、备份和冗余。

教材原文段落

FIGURE 18.3 Failover cluster with network load balancing If you're running your servers in the cloud, you may be able to take advantage of fault tolerance services offered by your cloud provider. For example, many IaaS providers offer load-balancing services that automatically scale resources on an as-needed basis. These services also incorporate health checking that can automatically restart servers that are not functioning properly. Similarly, when designing cloud environments, be sure to consider the availability of data centers in different regions of the world.

If you are already load-balancing multiple servers, you may be able to place those servers in different geographic regions and availability zones within those regions to add resiliency in addition to scalability.

中文直译 / 整理

图 18.3带网络负载均衡的故障转移集群 如果您的服务器运行在云中,您可能能够利用云服务提供商提供的容错服务。 例如,许多IaaS提供商提供负载均衡服务,可根据需要自动扩展资源。 这些服 务还集成了健康检查功能,能够自动重启运行异常的服务器。 同样,在设计云环境时,请务必考虑全球不同地区数据中心的可用性。 如果您 已经对多台服务器进行负载均衡,可以将这些服务器部署在不同的地理区域及 其内的可用区中,以在可扩展性之外增加弹性。

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:可用性关注中断、故障、DoS、备份和冗余。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

可用性:可用性保证授权用户需要时能及时使用系统和数据。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“可用性:需要时能用,且性能可接受”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

冗余、备份、BCP/DRP、抗 DoS、容量规划都对应可用性。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
可用性 可用性保证授权用户需要时能及时使用系统和数据。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 23 / PDF P1239

第 1239 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Failover clusters are not the only method of fault tolerance for servers. Some systems provide automatic fault tolerance for servers, allowing a server to fail without losing access to the provided service. For example, in a Microsoft domain with two or more domain controllers, each domain controller will regularly replicate Active Directory data with the others so that all the domain controllers have the same data. If one fails, computers within the domain can still find the other domain controller(s) and the network can continue to operate. Similarly, many database server products include methods to replicate database content with other servers so that all servers have the same content.

Three of these methods—electronic vaulting, remote journaling, and remote mirroring—are discussed later in this chapter. Protecting Power Sources Fault tolerance can be added for power sources with a UPS, a generator, or both. In general, a UPS provides battery-supplied power for a short period of time, between 5 and 30 minutes, and a generator provides long-term power. The goal of a UPS is to provide power long enough to complete a logical shutdown of a system, or until a generator is powered on and providing stable power. Generators provide power to systems during long-term power outages.

The length of time that a generator will provide power is dependent on the fuel, and it's possible for a site to stay on generator power as long as it has fuel and the generator remains functional. Generators also require a steady fuel supply—they commonly use diesel fuel, natural gas, or propane. In addition to making sure that you have sufficient fuel on hand, you should take steps to ensure that you can be delivered fuel on a regular basis in the event of an extended emergency. Remember, if the disaster is widespread, there will be significant demand for a limited fuel supply. If you have contracts in place with suppliers, you're much more likely to receive fuel in a timely manner.

A more detailed discussion of power issues appeared in Chapter 10. Trusted Recovery

中文直译 / 整理

故障转移集群并非服务器容错的唯一方法。 一些系统为服务器提供了自 动容错功能,允许服务器发生故障时仍能访问所提供的服务。 例如,在包含 两个或更多域控制器的 Microsoft 域中,每个域控制器都会定期与其他域控 制器复制 Active Directory 数据,以确保所有域控制器拥有相同的数据。 如果其中一个发生故障,域内的计算机仍可找到其他域控制器,网络可以继 续运行。 类似地,许多数据库服务器产品都包含将数据库内容复制到其他服 务器的方法,以确保所有服务器拥有相同的内容。 本章后续将讨论其中三种 方法:电子归档、远程日志记录和远程镜像。 保护电源 可以通过使用UPS、发电机或两者兼用来为电源增加容错能力。 通常,UPS在 短时间内提供电池供电,时间为5至30分钟,而发电机则提供长期供电。 UPS 的目标是提供足够长的电力,以完成系统的逻辑关机,或直至发电机启动并提 供稳定电力。 发电机在长时间停电期间为系统供电。 发电机供电的时间长度取决于燃料,只 要站点拥有燃料且发电机保持正常运行,就可以持续使用发电机供电。 发电机 还需要稳定的燃料供应——通常使用柴油、天然气或丙烷。

除了确保有足够的 燃料储备外,您还应采取措施,确保在发生长期紧急情况时能够定期获得燃料 供应。 请记住,如果灾害影响范围广泛,对有限燃料供应的需求将大幅增加。 如果您已与供应商签订合同,您将更有可能及时获得燃料。 有关电源问题的更详细讨论见第10章。 可信恢复

小白解释

场景先行:员工在家访问公司系统,流量要穿过家庭网络、互联网、防火墙、VPN、服务器。网络安全题就是让你判断问题发生在哪一层、用哪个控制放在什么位置。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:不分层就会乱选设备:该加密的地方装防火墙,该监测的地方却只做访问控制。

你作为负责人可以这样想:先定位网络层次,再决定是分段、过滤、加密、检测还是阻断。

本页术语用人话说:

OSI 模型:OSI 用七层结构理解网络通信,从物理层到应用层。

日志:日志记录系统和用户活动,用于监控、审计和调查。

常见误区:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

读完后用一句话复述:如果我是网络安全工程师,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1239 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是网络安全工程师在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

网络题先定位层次,再判断协议、设备或攻击位置。

日志要保护完整性、时间同步和访问控制。

排除法提醒:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

本页术语拆解
OSI 模型 OSI 用七层结构理解网络通信,从物理层到应用层。
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 24 / PDF P1240

可用性:需要时能用,且性能可接受

可用性关注中断、故障、DoS、备份和冗余。

教材原文段落

Trusted recovery provides assurances that after a failure or crash, the system is just as secure as it was before the failure or crash occurred. Depending on the failure, the recovery may be automated or require manual intervention by an administrator. However, in either case systems can be designed to ensure that they support trusted recovery. Systems can be designed so that they fail in a fail-secure state or a fail-open state. A fail-secure system will default to a secure state in the event of a failure, blocking all access, and therefore, allowing the system to fail securely. A fail-open system will fail in an open state, granting all access.

The choice is dependent on whether security or availability is more important after a failure. A complete discussion of these topics appeared in Chapter 8, “Principles of Security Models, Design, and Capabilities.” Two elements of the recovery process are addressed to implement a trusted solution. The first element is failure preparation. This includes system resilience and fault-tolerant methods in addition to a reliable backup solution. The second element is the process of system recovery. The system should be forced to reboot into a single-user, nonprivileged state.

This means that the system should reboot so that a normal user account can be used to log in and so that the system does not grant unauthorized access to users. System recovery also includes the restoration of all affected files and services actively in use on the system at the time of the failure or crash. Any missing or damaged files are restored, any changes to classification labels are corrected, and settings on all security critical files are then verified. The Common Criteria include a section on trusted recovery that is relevant to system resilience and fault tolerance.

Specifically, it defines four types of trusted recovery: Manual Recovery If a system fails, it does not fail in a secure state. Instead, an administrator is required to manually perform the actions necessary to implement a secured or trusted recovery after a failure or system crash. Automated Recovery The system is able to perform trusted recovery activities to restore itself against at least one type of failure. For example, a hardware RAID provides automated recovery against the failure of a hard drive but not against the failure of the entire server. Some types of failures will require manual recovery.

Automated Recovery without Undue Loss This is similar to automated recovery in that a system can restore itself against at least one

中文直译 / 整理

可信恢复确保在发生故障或崩溃后,系统安全性与故障或崩溃发生前一样。 根 据故障类型,恢复过程可能是自动的,也可能需要管理员手动干预。 然而,在 任何情况下,系统都可以设计为支持可信恢复。 系统可以被设计为在故障时进入故障安全状态或故障开放状态。 一个故障安全 系统在发生故障时会默认进入安全状态,阻止所有访问,从而确保系统安全失 效。 一个故障开放系统在故障时会进入开放状态,授予所有访问权限。 选择哪 种方式取决于故障后安全性和可用性哪个更为重要。 有关这些主题的完整讨论 见第8章,“安全模型、设计与能力的原则”。 为实现可信解决方案,恢复过程涉及两个要素。 第一个要素是故障准备,包括 系统弹性与容错方法,以及可靠的备份解决方案。 第二个要素是系统恢复过程。 系统应被强制重启为单用户、非特权状态。 这意味着系统重启后,应允许使用 普通用户账户登录,且不会向用户授予未经授权的访问权限。 系统恢复还包括 恢复故障或崩溃时系统上所有受影响的文件和正在积极使用的服务。 所有缺失 或损坏的文件将被恢复,任何分类标签的更改将被修正,并对所有安全关键文 件的设置进行验证。 通用准则包含一个关于可信恢复的章节,该章节与系统的弹性和容错性相关。

具体而言,它定义了四种类型的可信恢复: 手动恢复 如果系统发生故障,它不会以安全状态失败。 相反,需要管理员手动 执行必要的操作,以在故障或系统崩溃后实现安全或可信恢复。 自动恢复 系统能够执行可信恢复操作,以应对至少一种类型的故障。 例如, 硬件RAID可以针对硬盘故障提供自动恢复,但无法应对整个服务器的故障。 某些类型的故障仍需要手动恢复。 无重大损失的自动恢复 这与自动恢复类似,系统能够针对至少一种

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:可用性关注中断、故障、DoS、备份和冗余。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

可用性:可用性保证授权用户需要时能及时使用系统和数据。

授权:授权是认证之后决定你能访问什么、能做什么。

NIST:NIST 提供美国常用安全标准、框架和指南。

日志:日志记录系统和用户活动,用于监控、审计和调查。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“可用性:需要时能用,且性能可接受”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

冗余、备份、BCP/DRP、抗 DoS、容量规划都对应可用性。

认证成功不等于什么都能做;权限仍要单独授权。

看到 SP 800 系列、CSF、RMF 常联想到 NIST。

日志要保护完整性、时间同步和访问控制。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
可用性 可用性保证授权用户需要时能及时使用系统和数据。
授权 授权是认证之后决定你能访问什么、能做什么。
NIST NIST 提供美国常用安全标准、框架和指南。
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 25 / PDF P1241

完整性:数据要正确、可信、未被乱改

完整性不只是防黑客篡改,也包括防授权用户误操作。

教材原文段落

type of failure. However, it includes mechanisms to ensure that specific objects are protected to prevent their loss. A method of automated recovery that protects against undue loss would include steps to restore data or other objects. It may include additional protection mechanisms to restore corrupted files, rebuild data from transaction logs, and verify the integrity of key system and security components. Function Recovery Systems that support function recovery are able to automatically recover specific functions.

This state ensures that the system is able to successfully complete the recovery for the functions, or that the system will be able to roll back the changes to return to a secure state. Quality of Service Quality of service (QoS) controls protect the availability of data networks under load. Many different factors contribute to the quality of the end-user experience, and QoS attempts to manage all of those factors to create an experience that meets business requirements. Some of the factors contributing to QoS are as follows: Bandwidth The network capacity available to carry communications. Latency The time it takes a packet to travel from source to destination.

Jitter The variation in latency between different packets. Packet Loss Some packets may be lost between source and destination, requiring retransmission. Interference Electrical noise, faulty equipment, and other factors may corrupt the contents of packets. In addition to controlling these factors, QoS systems often prioritize certain traffic types that have low tolerance for interference and/or have high business requirements. For example, a QoS device might be programmed to prioritize videoconference traffic from the executive conference room over video streaming from an intern's computer.

QoS may also include specific security requirements, such as requiring encryption for certain types of traffic. Recovery Strategy

中文直译 / 整理

类型的故障进行自我恢复。 然而,它包含确保特定对象受到保护以防止其丢失 的机制。 一种防止重大损失的自动恢复方法将包括恢复数据或其他对象的步骤。 它可能还包括额外的保护机制,以恢复损坏的文件、从事务日志中重建数据, 并验证关键系统和安全组件的完整性。 功能恢复 支持功能恢复的系统能够自动恢复特定功能。 此状态确保系统能够成 功完成功能的恢复,或能够回滚更改以返回到安全状态。 服务质量 服务质量(QoS) 控制在负载情况下保护数据网络的可用性。 许多不同因素 会影响最终用户的体验质量,QoS 旨在管理所有这些因素,以创造符合业务 需求的体验。 影响 QoS 的一些因素如下: 带宽 用于传输通信的网络容量。 延迟 数据包从源到目的地所需的时间。 抖动 不同数据包之间延迟的变化。 丢包 部分数据包可能在源和目的之间丢失,需要重传。 干扰 电气噪声、设备故障和其他因素可能会损坏数据包的内容。 除了控制这些因素外,QoS 系统通常会优先处理对干扰容忍度低和/或业务要 求高的特定流量类型。 例如,QoS 设备可能被配置为优先处理来自高管会议 室的视频会议流量,而非实习生计算机上的视频流。

QoS 还可能包含特定的 安全要求,例如要求对某些类型的流量进行加密。 恢复策略

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:完整性不只是防黑客篡改,也包括防授权用户误操作。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

完整性:完整性保证数据没有被未授权修改,并且仍然正确可信。

可用性:可用性保证授权用户需要时能及时使用系统和数据。

加密:加密把内容变成未授权者看不懂的形式。

日志:日志记录系统和用户活动,用于监控、审计和调查。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“完整性:数据要正确、可信、未被乱改”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

哈希、数字签名、变更控制、输入校验常对应完整性。

冗余、备份、BCP/DRP、抗 DoS、容量规划都对应可用性。

加密主要保护机密性,也可配合签名、哈希支持完整性和真实性。

日志要保护完整性、时间同步和访问控制。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
完整性 完整性保证数据没有被未授权修改,并且仍然正确可信。
可用性 可用性保证授权用户需要时能及时使用系统和数据。
加密 加密把内容变成未授权者看不懂的形式。
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 26 / PDF P1242

机密性:让该看的人看,不该看的人看不到

机密性重点是防泄露,同时不能妨碍授权访问。

教材原文段落

When a disaster interrupts your business, your disaster recovery plan should kick in nearly automatically and begin providing support for recovery operations. The disaster recovery plan should be designed so that the first employees on the scene can immediately begin the recovery effort in an organized fashion, even if members of the official DRP team have not yet arrived on-site. In the following sections, we'll cover critical subtasks involved in crafting an effective disaster recovery plan that can guide rapid restoration of regular business processes and resumption of activity at the primary business location.

In addition to improving your response capabilities, purchasing insurance can reduce the impact of financial losses. When selecting insurance, be sure to purchase sufficient coverage to enable you to recover from a disaster. Simple value coverage may be insufficient to encompass actual replacement costs. If your property insurance includes an actual cash value (ACV) clause, then your damaged property will be compensated based on the fair market value of the items on the date of loss, less all accumulated depreciation since the time of their purchase.

The important point here is that unless you have a replacement cost clause in your insurance coverage, your organization is likely to have to pay out of pocket as a result of any losses it might sustain. Many insurance providers offer cybersecurity liability policies that specifically cover breaches of confidentiality, integrity, and availability. Valuable paper insurance coverage provides protection for inscribed, printed, and written documents and manuscripts and other printed business records. However, it does not cover damage to paper money and printed security certificates.

Business Unit and Functional Priorities To recover your business operations with the greatest possible efficiency, you must engineer your disaster recovery plan so that those business units with the highest priority are recovered first. You must identify and prioritize critical business functions as well so that you can define which functions you want to restore after a disaster or failure and in what order. The business impact analysis (BIA) you developed during your business continuity work is an excellent resource when performing this task.

To achieve this goal, the DRP team must first identify the critical business units that are vital to achieving your organization's mission and agree on an order of prioritization, and they must do likewise with business functions.

中文直译 / 整理

当灾难干扰您的业务时,您的灾难恢复计划应几乎自动启动,并开始提供恢复 操作支持。 灾难恢复计划应设计为,即使官方 DRP 团队成员尚未到达现场,现 场的第一批员工也能立即有条不紊地开始恢复工作。 在以下章节中,我们将介 绍制定有效灾难恢复计划所需的关键子任务,该计划可指导快速恢复常规业务 流程,并在主要业务地点重新开展活动。 除了提升您的响应能力外,购买保险可以减少财务损失的影响。 在选择保险时, 请务必购买足够的保障,以便在灾难发生后能够恢复。 简单的价值保障可能不 足以涵盖实际的替换成本。 如果您的财产保险包含实际现金价值(ACV)条款, 则您的受损财产将根据损失当日物品的公允市场价值,并扣除自购买以来累积 的所有折旧进行赔偿。 这里的关键是,除非您的保险保障中包含重置成本条款, 否则您的组织在遭受任何损失时都可能需要自掏腰包。 许多保险公司提供专门 覆盖机密性、完整性和可用性泄露的网络安全责任保险。 重要文件保险提供对铭刻、印刷和手写文件、手稿及其他印刷商业记录的保护。 然而,它不涵盖纸币和印刷证券的损坏。 业务单元与功能优先级 为了以最大的效率恢复您的业务运营,您必须设计灾难恢复计划,优先恢复最 高优先级的业务单元。

您还必须识别并确定关键业务功能的优先级,以便明确 在灾难或故障发生后希望恢复哪些功能以及恢复顺序。 在业务连续性工作中您 所开发的业务影响分析(BIA)是执行此任务的绝佳资源。 为实现这一目标,DRP团队必须首先确定对实现贵组织使命至关重要的关键业务 单元,并就优先级顺序达成一致; 同时,他们也必须对业务职能做同样的处理。

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:机密性重点是防泄露,同时不能妨碍授权访问。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

机密性:机密性让该看的人能看,不该看的人看不到。

完整性:完整性保证数据没有被未授权修改,并且仍然正确可信。

可用性:可用性保证授权用户需要时能及时使用系统和数据。

数字证书:数字证书把身份和公钥绑定起来,由可信 CA 签发。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“机密性:让该看的人看,不该看的人看不到”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

加密、访问控制、分类、培训都常用于保护机密性。

哈希、数字签名、变更控制、输入校验常对应完整性。

冗余、备份、BCP/DRP、抗 DoS、容量规划都对应可用性。

证书不是密钥本身,而是身份与公钥的可信绑定。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
机密性 机密性让该看的人能看,不该看的人看不到。
完整性 完整性保证数据没有被未授权修改,并且仍然正确可信。
可用性 可用性保证授权用户需要时能及时使用系统和数据。
数字证书 数字证书把身份和公钥绑定起来,由可信 CA 签发。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 27 / PDF P1243

第 1243 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

And take note: Not all critical business functions will necessarily be carried out in critical business units, so the final results of this analysis will very probably comprise a superset of critical business units plus other select units. If this process sounds familiar, it should! This is very much like the prioritization task the BCP team performs during the business impact assessment discussed in Chapter 3. In fact, most organizations will complete a BIA as part of their business continuity planning process.

This analysis identifies vulnerabilities, develops strategies to minimize risk, and ultimately produces a BIA report that describes the potential risks that an organization faces and identifies critical business units and functions. A BIA also identifies costs related to failures that include loss of cash flow, equipment replacement, salaries paid to clear work backlogs, profit losses, opportunity costs from the inability to attract new business, and so forth.

Such failures are assessed in terms of potential impacts on finances, personnel, safety, legal compliance, contract fulfillment, and quality assurance, preferably in monetary terms to make impacts comparable and to set budgetary expectations. With all this BIA information in hand, you should use the resulting documentation as the basis for this prioritization task. At a minimum, the output from this task should be a simple listing of business units in priority order. However, a more detailed list, broken down into specific business processes listed in order of priority, would be a much more useful deliverable.

This business process–oriented list is more reflective of real-world conditions, but it requires considerable additional effort. It will, however, greatly assist in the recovery effort—after all, not every task performed by the highest-priority business unit will be of the highest priority. You might find that it would be best to restore the highestpriority unit to 50 percent capacity and then move on to lower-priority units to achieve some minimum operating capacity across the organization before attempting a full recovery effort. By the same token, the same exercise must be completed for critical business processes and functions.

Not only can these things involve multiple business units and cross the lines between them, but they also define the operational elements that must be restored in the wake of a disaster or other business interruption. Here also, the final result should be a checklist of items in priority order, each with its own risk and cost assessment, and a corresponding set of recovery objectives and milestones. As discussed in Chapter 3, these include the mean time to repair (MTTR), maximum tolerable downtime (MTD), recovery time objective (RTO), and recovery

中文直译 / 整理

请注意:并非所有关键业务职能都必然在关键业务单元中执行,因此本分析的 最终结果很可能包括关键业务单元的超集,以及其他一些选定的单元。 如果此过程听起来很熟悉,那确实应该如此! 这与BCP团队在业务影响评估中 执行的优先级排序任务非常相似,该评估在第3章中进行了讨论。 事实上,大多 数组织都会在业务连续性规划过程中完成一份业务影响分析(BIA)。 此分析 识别脆弱性,制定降低风险的策略,并最终生成一份BIA报告,描述组织面临 的主要风险,并确定关键业务单元和职能。 BIA还识别与故障相关的成本,包 括现金流损失、设备更换、为清理积压工作而支付的工资、利润损失、因无法 吸引新业务而导致的机会成本等。 这些故障的影响通常从财务、人员、安全、 法律合规、合同履行和质量保证等方面进行评估,最好以货币形式衡量,以便 比较影响并设定预算预期。 掌握所有这些BIA信息后,您应将由此产生的文档 作为此优先级排序任务的基础。 最低要求是,此任务的输出应为按优先级排序的业务单元简单列表。 然而,一 份更详细的列表,按优先级顺序分解为具体业务流程,将更具实用价值。 这种 以业务流程为导向的列表更能反映现实情况,但需要投入大量额外工作。

然而, 它将极大助力恢复工作——毕竟,并非最高优先级业务单元执行的每一项任务 都具有最高优先级。 您可能会发现,最好先将最高优先级单元恢复至50%的 运行能力,然后转向较低优先级的单元,以在整个组织中实现最低运营能力, 再着手进行全面恢复。 同样地,必须对关键业务流程和功能完成相同的分析。 这些方面不仅可能涉及 多个业务部门并跨越其界限,还定义了在灾难或其他业务中断后必须恢复的操 作要素。 同样,最终结果应是一个按优先级排序的项目清单,每个项目都附有 其自身的风险和成本评估,以及相应的恢复目标和里程碑。 如第3章所述,这 些包括平均修复时间(MTTR)、最大可容忍停机时间(MTD)、恢复时间目 标(RTO)和恢复

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

日志:日志记录系统和用户活动,用于监控、审计和调查。

业务连续性计划 BCP:BCP 关注业务在灾难或中断中如何继续运行。

恢复时间目标 RTO:RTO 是业务或系统最多能中断多久。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1243 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

日志要保护完整性、时间同步和访问控制。

BCP 保护业务流程,DRP 保护 IT 恢复。

RTO 问时间:多久必须恢复。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
日志 日志记录系统和用户活动,用于监控、审计和调查。
业务连续性计划 BCP BCP 关注业务在灾难或中断中如何继续运行。
恢复时间目标 RTO RTO 是业务或系统最多能中断多久。
学习单元 28 / PDF P1244

政策、标准、程序、指南

高层原则、最低要求、操作步骤、建议做法要分清。

教材原文段落

point objective (RPO). Business continuity planners can analyze these metrics to identify situations that require intervention and additional controls. Crisis Management If a disaster strikes your organization, panic is likely to set in. The best way to combat this is with an organized disaster recovery plan. The individuals in your business who are most likely to first notice an emergency situation (such as security guards and technical personnel) should be fully trained in disaster recovery procedures and know the proper notification procedures and immediate response mechanisms.

Many things that normally seem like common sense (such as calling emergency services in the event of a fire) may slip the minds of panicked employees seeking to flee an emergency. The best way to combat this is with continuous training on disaster recovery responsibilities. Returning to the fire example, all employees should be trained to activate the fire alarm or contact emergency officials when they spot a fire (after, of course, taking appropriate measures to protect themselves). After all, it's better that the fire department receive 10 different phone calls reporting a fire at your organization than it is for everyone to assume that someone else already took care of it.

Crisis management steps in to cover crises of all forms. These may include more commonplace disasters, such as a facility fire, or more extraordinary events, such as a global pandemic. Organizations may also activate their crisis management programs for events with little impact on technology, such as a public relations disaster. Crisis management is a science and an art form. If your training budget permits, investing in crisis training for your key employees is a good idea. This ensures that at least some of your employees know how to handle emergency situations properly and can provide all-important “on-the-scene” leadership to panic-stricken coworkers.

Emergency Communications When a disaster strikes, it is important that the organization be able to communicate internally as well as with the outside world. A disaster of any significance is easily noticed, but if an organization is unable to keep the outside world informed of its recovery status, the public is apt to fear the

中文直译 / 整理

点目标(RPO)。 业务连续性规划者可以分析这些指标,以识别需要干 预和额外控制的情况。 危机管理 如果灾难袭击您的组织,恐慌很可能会发生。 应对这种情况的最佳方法是制定 有组织的灾难恢复计划。 您的企业中最有可能首先发现紧急情况的人员(如安 保人员和技术人员)应接受完整的灾难恢复程序培训,并了解正确的通知程序 和即时响应机制。 许多通常看似常识的事情(例如发生火灾时拨打紧急服务电话),在恐慌的员 工试图逃离紧急情况时可能会被遗忘。 应对这种情况的最佳方法是持续进行灾 难恢复职责培训。 以火灾为例,所有员工都应接受培训,在发现火灾时启动火 灾警报或联系紧急机构(当然,前提是先采取适当措施保护自身安全)。 毕竟, 让消防部门接到10通报告您组织发生火灾的电话,总比每个人都假设别人已经 处理好了要好。 危机管理涵盖各种形式的危机。 这些危机可能包括更常见的灾难,如设施火灾, 也可能包括更特殊的事件,如全球性流行病。 组织也可能在发生对技术影响较 小的事件时启动危机管理程序,例如公关危机。 危机管理是一门科学,也是一种艺术。 如果您的培训预算允许,为关键员工 提供危机培训是一个好主意。

这可以确保至少部分员工懂得如何妥善应对紧 急情况,并能在惊慌失措的同事面前提供至关重要的“现场”领导。 应急通信 当灾难发生时,组织能够与内部以及外部世界进行沟通至关重要。 任何重大 的灾难都容易被察觉,但如果组织无法向外界通报其恢复状况,公众很容易 产生恐慌,认为

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:高层原则、最低要求、操作步骤、建议做法要分清。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

程序:程序是一步一步怎么做。

日志:日志记录系统和用户活动,用于监控、审计和调查。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“政策、标准、程序、指南”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Step-by-step、SOP 常对应 procedure。

日志要保护完整性、时间同步和访问控制。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
程序 程序是一步一步怎么做。
日志 日志记录系统和用户活动,用于监控、审计和调查。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 29 / PDF P1245

第 1245 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

worst and assume that the organization is unable to recover. It is also essential that the organization be able to communicate internally during a disaster so that employees know what is expected of them—whether they are to return to work or report to another location, for instance. Employees participating in disaster recovery efforts should be instructed to refer media inquiries to the public relations team. You don't want employees naively providing unvarnished assessments of the situation based on partial information to the media and then having those assessments wind up in print.

In some cases, the circumstances that brought about the disaster to begin with may have also damaged some or all normal means of communications. A violent storm or an earthquake may have also knocked out telecommunications systems; at that point, it's too late to try to figure out other means of communicating both internally and externally. Workgroup Recovery When designing a disaster recovery plan, it's important to keep your goal in mind—the restoration of workgroups to the point that they can resume their activities in their usual work locations. It's easy to get sidetracked and think of disaster recovery as purely an IT effort focused on restoring systems and processes to working order.

To facilitate this effort, it's sometimes best to develop separate recovery facilities for different workgroups. For example, if you have several subsidiary organizations that are in different locations and that perform tasks similar to the tasks that workgroups at your office perform, you may want to consider temporarily relocating those workgroups to the other facility and having them communicate electronically and via telephone with other business units until they're ready to return to the main operations facility. Larger organizations may have difficulty finding recovery facilities capable of handling the entire business operation.

This is another example of a circumstance in which independent recovery of different workgroups is appropriate. Alternate Processing Sites One of the most important elements of the disaster recovery plan is the selection of alternate processing sites to be used when the primary sites are

中文直译 / 整理

组织无法恢复。 同时,在灾难期间,组织也必须能够进行内部沟通,以便员工 了解对他们有何要求——例如,他们是否需要返回工作岗位或前往其他地点报 到。 参与灾后恢复工作的员工应被指示将媒体询问转交公关团队。 你不希望员工基 于不完整的信息向媒体提供未经修饰的评估,而这些评估随后被刊登出来。 在某些情况下,导致灾难发生的原因本身也可能破坏了部分或全部正常的通信 手段。 一场猛烈的风暴或地震可能同时导致电信系统瘫痪; 此时再试图寻找其 他内外部沟通方式就为时已晚。 工作组恢复 在制定灾后恢复计划时,重要的是要牢记目标——将工作组恢复到能够在其常 规工作地点重新开展活动的状态。 很容易偏离主题,将灾后恢复仅仅视为以恢 复系统和流程运行为核心的IT工作。 为促进这一工作,有时最好为不同工作组建立独立的恢复设施。 例如,如果你 拥有位于不同地点的多个附属机构,且它们执行的任务与你办公室工作组的任 务相似,你可以考虑暂时将这些工作组 relocating 到其他设施,并通过电子方 式和电话与其他业务部门保持联系,直到他们准备好返回主运营设施。 较大的组织可能难以找到能够处理整个业务运营的恢复设施。

这是另一种情况 下,各个工作小组独立恢复是合适的。 备用处理站点 灾难恢复计划中最重要的要素之一是选择在主要站点无法使用时使用的备用处理 站点

小白解释

场景先行:你是公司的安全负责人,正在读第 1245 页这一组概念。老板不会问你背定义,而是问:这件事会不会影响业务、谁负责、要不要花钱、出了事能不能解释清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:概念没放进业务场景,容易只背词,做题时不知道该选管理动作还是技术动作。

你作为负责人可以这样想:先确认业务目标和风险,再选控制措施,最后留下政策、审批、日志或证据。

如果这一页没有明显术语,就按“谁在做事、保护什么、怕什么、用什么控制、留下什么证据”来拆。

常见误区:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

读完后用一句话复述:如果我是安全负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1245 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是安全负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

排除法提醒:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

本页术语拆解

本页没有识别到重点术语,按原文顺序理解即可。

学习单元 30 / PDF P1246

第 1246 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

unavailable. Many options are available when considering recovery facilities, limited only by the creative minds of disaster recovery planners and available resources. In the following sections, we cover several types of sites commonly used in disaster recovery planning: cold sites, warm sites, hot sites, mobile sites, and cloud computing. Organizations building fully resilient processes may use more than one alternate processing site in their disaster recovery plan. Using multiple processing sites increases geographic diversity and resilience.

Cold Sites Cold sites are standby facilities large enough to handle the processing load of an organization and equipped with appropriate functioning electrical and environmental support systems. They may be large warehouses, empty office buildings, or other similar structures. However, a cold site has no computing facilities (hardware or software) preinstalled and also has no active broadband communications links. Many cold sites do have at least a few copper telephone lines, and some sites may have standby links that can be activated with minimal notification.

中文直译 / 整理

不可用。 在考虑恢复设施时,可用的选项多种多样,仅受限于灾难恢复规划者 的创造力和可用资源。 在以下章节中,我们将介绍灾难恢复规划中常用的几种 站点类型:冷站点、温站点、热站点、移动站点和云计算。 构建完全弹性流程的组织可在其灾难恢复计划中使用多个备用处理 站点。 使用多个处理站点可提高地理多样性与弹性。 冷站点 冷站点是规模足以承担组织处理负载的备用设施,并配备了适当的供电和环境 支持系统。 它们可能是大型仓库、空置的办公楼或其他类似结构。 然而,冷站 点没有预先安装任何计算设施(硬件或软件),也没有活跃的宽带通信链路。 许多冷站点至少配备了几条铜质电话线,有些站点可能拥有可在极少通知下激 活的备用链路。

小白解释

场景先行:你是公司的安全负责人,正在读第 1246 页这一组概念。老板不会问你背定义,而是问:这件事会不会影响业务、谁负责、要不要花钱、出了事能不能解释清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:概念没放进业务场景,容易只背词,做题时不知道该选管理动作还是技术动作。

你作为负责人可以这样想:先确认业务目标和风险,再选控制措施,最后留下政策、审批、日志或证据。

如果这一页没有明显术语,就按“谁在做事、保护什么、怕什么、用什么控制、留下什么证据”来拆。

常见误区:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

读完后用一句话复述:如果我是安全负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1246 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是安全负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

排除法提醒:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

本页术语拆解

本页没有识别到重点术语,按原文顺序理解即可。

学习单元 31 / PDF P1247

第 1247 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Cold Site Setup A cold site setup is well depicted in the film Boiler Room, which involves a chop-shop investment firm telemarketing bogus pharmaceutical investment deals to prospective clients. In this fictional case, the “disaster” is human-made, but the concept is much the same, even if the timing is quite different. Under threat of exposure and a pending law enforcement raid, the firm establishes a nearby building that is empty, save for a few banks of phones on dusty concrete floors in a mock-up of a cold recovery site.

Granted, this work is both fictional and illegal, but it illustrates a very real and legitimate reason for maintaining a redundant failover recovery site for the purpose of business continuity. Research the various forms of recovery sites, and then consider which among them is best suited for your particular business needs and budget. A cold site is the least expensive option and perhaps the most practical. A warm site contains the data links and preconfigured equipment necessary to begin restoring operations but no usable data or information.

The most expensive option is a hot site, which fully replicates your existing business infrastructure and is ready to take over for the primary site on short notice. The major advantage of a cold site is its relatively low cost—there's no computing base to maintain and no monthly telecommunications bill when the site is idle. However, the drawbacks of such a site are obvious—there is a tremendous lag between the time the decision is made to activate the site and the time when that site is ready to support business operations. Servers and workstations must be brought in and configured. Data must be restored from backup tapes. Communications links must be activated or established.

The time to activate a cold site is often measured in weeks, making a quick recovery close to impossible and often yielding a false sense of security. It's also worth observing that the substantial time, effort, and expense required to activate and transfer operations to a cold site make this approach the most difficult to test.

中文直译 / 整理

冷站点设置 冷站点的设置在电影Boiler Room中有很好的体现,该片讲述了一家地下 投资公司通过电话营销向潜在客户兜售虚假的药品投资交易。 在这个虚构 案例中,"灾难"是人为造成的,但概念基本相同,尽管时机截然不同。 在面临曝光和执法突击检查的威胁下,该公司建立了一座附近的空置建筑, 里面仅有一排排电话摆在布满灰尘的混凝土地板上,模拟一个冷恢复站点。 诚然,这项工作既是虚构的,也是非法的,但它说明了为业务连续性而维 护冗余故障转移恢复站点的真实且合法的理由。 研究各种类型的恢复站点,然后考虑哪种最符合您的特定业务需求和 预算。 冷站点是最便宜的选项,或许也是最实用的。 温站点包含启动恢复 运营所需的数据链路和预配置设备,但没有可用的数据或信息。 最昂贵的 选项是热站点,它完全复制了您现有的业务基础设施,并可在短时间内接 管主站点。 冷站点的主要优势是成本相对较低——在站点闲置时,无需维护计算基础架构, 也无需支付每月的电信费用。 然而,这种站点的缺点显而易见——从决定启用站 点到站点准备好支持业务运营之间存在巨大的延迟。 必须引入并配置服务器和 工作站,必须从备份磁带中恢复数据,通信链路必须激活或建立。

冷站点的启 用时间通常以周计算,使得快速恢复几乎不可能,且常常造成虚假的安全感。 此外,值得注意的是,激活并将业务转移至冷站点所需的时间、精力和成本巨 大,使得这种方法最难进行测试。

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

强制访问控制 MAC:MAC 由系统根据标签和级别强制决定访问。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1247 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

政府/军方、机密级别、标签、不可由用户随意改通常是 MAC。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
强制访问控制 MAC MAC 由系统根据标签和级别强制决定访问。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 32 / PDF P1248

第 1248 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Hot Sites A hot site is the exact opposite of the cold site. In this configuration, a backup facility is maintained in constant working order, with a full complement of servers, workstations, and communications links ready to assume primary operations responsibilities. The servers and workstations are all preconfigured and loaded with appropriate operating system and application software. The data on the primary site servers is periodically or continuously replicated to corresponding servers at the hot site, ensuring that the hot site has up-todate data. Depending on the bandwidth available between the sites, hot site data may be replicated instantaneously.

If that is the case, operators could move operations to the hot site at a moment's notice. If it's not the case, disaster recovery managers have three options to activate the hot site: If there is sufficient time before the primary site must be shut down, they can force replication between the two sites right before the transition of operational control. If replication is impossible, managers may carry backup tapes of the transaction logs from the primary site to the hot site and manually reapply any transactions that took place since the last replication.

If there are no available backups and it isn't possible to force replication, the disaster recovery team may simply accept the loss of some portion of the data. This should only be done when the loss is within the organization's recovery point objective (RPO). The advantages of a hot site are obvious—the level of disaster recovery protection provided by this type of site is unsurpassed. However, the cost is extremely high. Maintaining a hot site essentially doubles an organization's budget for hardware, software, and services and requires the use of additional employees to maintain the site. If you use a hot site, never forget that it has copies of your production data.

Be sure to provide that site with the same level of technical and physical security controls you provide at your primary site.

中文直译 / 整理

热站点 热站点是冷站点的完全相反。 在这种配置中,备份设施始终保持正常运行状态, 配备完整的服务器、工作站和通信链路,随时准备接管主要运营职责。 服务器 和工作站均已预先配置,并加载了相应的操作系统和应用程序软件。 主站点服务器上的数据会定期或连续复制到热站点的对应服务器上,以确保热 站点拥有最新数据。 根据站点之间的可用带宽,热站点数据可能实现即时复制。 如果是这种情况,操作人员可在瞬间将业务切换至热站点。 如果不是这种情况, 灾难恢复管理人员有三种选项来激活热站点: 如果在关闭主站点之前有足够的时间,他们可以在转移操作控制权之 前强制在两个站点之间进行复制。 如果无法进行复制,管理人员可以将主站点的事务日志备份磁带运送 到热站点,并手动重新应用自上次复制以来发生的所有事务。 如果没有可用的备份,也无法强制复制,灾难恢复团队可能只能接受部分 数据的丢失。 这种情况仅应在丢失量在组织的恢复点目标(RPO)范围内 时才进行。 热站点的优势显而易见——这种类型的站点所提供的灾难恢复保护水平无与伦 比。 然而,其成本极其高昂。 维护热站点基本上会使组织在硬件、软件和服务 上的预算翻倍,并需要额外的员工来维护该站点。

如果您使用热站点,请永远不要忘记它包含您的生产数据副本。 请确 保为该站点提供与您的主站点相同级别的技术和物理安全控制。

小白解释

场景先行:员工在家访问公司系统,流量要穿过家庭网络、互联网、防火墙、VPN、服务器。网络安全题就是让你判断问题发生在哪一层、用哪个控制放在什么位置。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:不分层就会乱选设备:该加密的地方装防火墙,该监测的地方却只做访问控制。

你作为负责人可以这样想:先定位网络层次,再决定是分段、过滤、加密、检测还是阻断。

本页术语用人话说:

程序:程序是一步一步怎么做。

OSI 模型:OSI 用七层结构理解网络通信,从物理层到应用层。

日志:日志记录系统和用户活动,用于监控、审计和调查。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

读完后用一句话复述:如果我是网络安全工程师,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1248 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是网络安全工程师在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Step-by-step、SOP 常对应 procedure。

网络题先定位层次,再判断协议、设备或攻击位置。

日志要保护完整性、时间同步和访问控制。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

本页术语拆解
程序 程序是一步一步怎么做。
OSI 模型 OSI 用七层结构理解网络通信,从物理层到应用层。
日志 日志记录系统和用户活动,用于监控、审计和调查。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 33 / PDF P1249

第 1249 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

If an organization wants to maintain a hot site but wants to reduce the expense of equipment and maintenance, it might opt to use a shared hot site facility managed by an outside contractor. However, the inherent danger in these facilities is that they may be overtaxed in the event of a widespread disaster and be unable to service all clients simultaneously. If your organization considers such an arrangement, be sure to investigate these issues thoroughly, both before signing the contract and periodically during the contract term. Another method of reducing the expense of a hot site is to use the hot site as a development or test environment.

Developers can replicate data to the hot site in real time both for test purposes and to provide a live replica of the production environment. This reduces costs by having the hot site provide a useful service to the organization even when it is not actively being used for disaster operations. Warm Sites Warm sites occupy the middle ground between hot and cold sites for disaster recovery specialists. They always contain the equipment and data circuits necessary to rapidly establish operations. As with hot sites, this equipment is usually preconfigured and ready to run appropriate applications to support an organization's operations.

Unlike hot sites, however, warm sites do not typically contain copies of the client's data. The main requirement in bringing a warm site to full operational status is the transportation of appropriate backup media to the site and restoration of critical data on the standby servers. Activation of a warm site typically takes at least 12 hours from the time a disaster is declared. This does not mean that any site that can be activated in less than 12 hours qualifies as a hot site, however; switchover times for most hot sites are often measured in seconds or minutes, and complete cutovers seldom take more than an hour or two.

Warm sites avoid significant telecommunications and personnel costs inherent in maintaining a near-real-time copy of the operational data environment. Like hot sites and cold sites, warm sites may also be obtained on a shared facility basis. If you choose this option, be sure that you have a “no lockout” policy written into your contract guaranteeing you the use of an appropriate facility even during a period of high demand. It's a good idea to take this concept one step further and physically inspect the facilities and the

中文直译 / 整理

如果一个组织希望维护热站点但想降低设备和维护成本,它可能会选择使用由 外部承包商管理的共享热站点设施。 然而,这些设施的固有风险是,在发生大 规模灾难时,它们可能超负荷运行,无法同时为所有客户提服务。 如果您的组 织考虑这种安排,请务必在签订合同前以及合同期间定期彻底调查这些问题。 减少热站点成本的另一种方法是将其用作开发或测试环境。 开发人员可以实时 将数据复制到热站点,既用于测试目的,也用于提供生产环境的实时副本。 这 样,即使热站点未被主动用于灾难操作,它也能为组织提供有用的服务,从而 降低成本。 温站点 温站点在灾难恢复专家眼中处于热站点与冷站点之间的中间位置。 它们始 终包含快速建立运营所需的设备和数据电路。 与热站点一样,这些设备通常已 预先配置好,可立即运行适当的应用程序以支持组织的运营。 然而,与热站点 不同的是,温站点通常不包含客户的数据副本。 要将温站点完全激活至运行状 态,主要要求是将适当的备份介质运输到该站点,并在备用服务器上恢复关键 数据。 温站点的激活通常在灾难宣布后至少需要12小时。 但这并不意味着任何能在 12小时内激活的站点都可视为热站点;

大多数热站点的切换时间通常以秒或分 钟计算,完整的切换很少超过一到两个小时。 温站点避免了维护操作数据环境近实时副本所固有的重大电信和人员成本。 与 热站点和冷站点类似,温站点也可以通过共享设施的方式获得。 如果您选择此 选项,请确保在合同中写入“不被排除”政策,以保证即使在需求高峰期也能 使用合适的设施。 最好进一步落实这一概念,亲自检查设施和

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

政策:政策是高层原则,说明必须遵守什么。

程序:程序是一步一步怎么做。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1249 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Policy 高层、强制、稳定;Procedure 具体步骤。

Step-by-step、SOP 常对应 procedure。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
政策 政策是高层原则,说明必须遵守什么。
程序 程序是一步一步怎么做。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 34 / PDF P1250

三类安全计划:战略、战术、运营

长期方向、中期落地、短期日常要分清。

教材原文段落

contractor's operational plan to reassure yourself that the facility will indeed be able to back up the “no lockout” guarantee should push ever come to shove. Mobile Sites Mobile sites are nonmainstream alternatives to traditional recovery sites. They typically consist of self-contained trailers or other easily relocated units. These sites include all the environmental control systems necessary to maintain a safe computing environment. Larger corporations sometimes maintain these sites on a “fly-away” basis, ready to deploy them to any operating location around the world via air, rail, sea, or surface transportation.

Smaller firms might contract with a mobile site vendor in their local area to provide these services on an as-needed basis. If your disaster recovery plan depends on a workgroup recovery strategy, mobile sites are an excellent way to implement that approach. They are often large enough to accommodate entire (small!) workgroups. Mobile sites are usually configured as cold sites or warm sites, depending on the disaster recovery plan they are designed to support. It is also possible to configure a mobile site as a hot site, but this is unusual because you seldom know in advance where a mobile site will need to be deployed.

中文直译 / 整理

承包商的运营计划,以确认一旦真的需要,该设施确实能够兑现“不被排除” 的保证。 移动站点 移动站点是传统恢复站点的非主流替代方案。 它们通常由独立的拖车或其他易 于搬迁的单元组成。 这些站点包含维持安全计算环境所需的所有环境控制系统。 大型企业有时会以“可快速部署”方式维护这些站点,以便通过航空、铁路、 海运或陆路运输将其部署到全球任何运营地点。 小型企业则可能与本地的移动 站点供应商签订合同,按需获取这些服务。 如果您的灾难恢复计划依赖于工作组恢复策略,那么移动站点是实现 该方法的绝佳方式。 它们通常足够大,可以容纳整个(小型! )工作组。 移动站点通常根据其设计支持的灾难恢复计划配置为冷站点或温站点。 也可以 将移动站点配置为热站点,但这并不常见,因为通常无法提前预知移动站点需 要部署在何处。

小白解释

场景先行:公司准备上线一个新业务系统,技术团队说可以买设备,法务说要合规,业务说不能影响上线。安全治理就是让高层定方向:安全要服务业务目标,风险由谁接受,预算花在哪里。

这一页真正想让你理解的是:长期方向、中期落地、短期日常要分清。

把它放进公司里看,关键不是背定义,而是判断:如果没有治理,安全会变成各部门各做各的:有人只想省钱,有人只想堆工具,最后责任不清。

你作为负责人可以这样想:先定策略和责任,再把战略拆成战术计划和日常运营计划。

本页术语用人话说:

运营计划:运营计划是每天、每周、每月执行的具体活动。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:不要把治理理解成配置设备;治理是方向、责任和监督。

读完后用一句话复述:如果我是高层管理者 / CISO,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“三类安全计划:战略、战术、运营”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是高层管理者 / CISO在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

日常操作、流程、任务安排常归 operational。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:不要把治理理解成配置设备;治理是方向、责任和监督。

本页术语拆解
运营计划 运营计划是每天、每周、每月执行的具体活动。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 35 / PDF P1251

第 1251 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Hardware Replacement Options One thing to consider when determining mobile sites and recovery sites in general is hardware replacement supplies. There are basically two options for hardware replacement supplies. One option is to employ “inhouse” replacement, whereby you store extra and duplicate equipment at a different but nearby location (that is, a warehouse on the other side of town). (In-house here means you own it already, not that it is necessarily housed under the same roof as your production environment.) If you have a hardware failure or a disaster, you can immediately pull the appropriate equipment from your stash.

The other option is an SLA-type agreement with a vendor to provide quick response and delivery time in the event of a disaster. However, even a 4-, 12-, 24-, or 48-hour replacement hardware contract from a vendor does not provide a reliable guarantee that delivery will actually occur. There are too many uncontrollable variables to rely on this second option as your sole means of recovery. Cloud Computing Many organizations now turn to cloud computing as their preferred disaster recovery option. Infrastructure-as-a-service (IaaS) providers, such as Amazon Web Services (AWS), Microsoft Azure, and Google Cloud, offer on-demand service at low cost.

Companies wishing to maintain their own data centers may choose to use these IaaS cloud providers as backup service providers. Storing ready-to-run images with cloud providers is often quite cost effective and allows the organization to avoid incurring most of the operating cost until the cloud site activates in a disaster. Organizations that already operate their technology resources in the cloud don't get a free pass on disaster recovery. They must also think about how they will handle issues that arise within their cloud environment. They should then design and configure their use of cloud services to take advantage of redundancy options, geographic dispersion, and similar considerations.

Organizations relying on cloud computing for their disaster recovery plan should consider entering into a resource capacity agreement with their cloud

中文直译 / 整理

硬件替换选项 在确定移动站点和一般恢复站点时,需要考虑的一个因素是硬件替换备件。 硬件替换备件基本上有两种选择。 一种选择是采用“内部”替换方式,即 在另一个但邻近的位置(例如,城镇另一侧的仓库)存储额外的重复设备。 (内部在这里意味着您已拥有这些设备,而非一定与生产环境位于同一屋 檐下。 )如果发生硬件故障或灾难,您可以立即从库存中取出合适的设备。 另一种选择是与供应商签订SLA类型的协议,以便在灾难发生时提供快速 响应和交付服务。 然而,即使与供应商签订了4小时、12小时、24小时或 48小时的硬件替换合同,也无法可靠保证交付一定会按时完成。 由于存在 太多不可控因素,不宜将此第二种选项作为唯一的恢复手段。 云计算 许多组织现在将云计算作为首选的灾难恢复方案。 基础设施即服务(IaaS)提 供商,如亚马逊网络服务(AWS)、微软Azure和谷歌云,以低成本提供按需 服务。 希望保留自有数据中心的公司可以选择这些IaaS云提供商作为备份服务 提供商。 将可立即运行的镜像存储在云提供商处通常成本效益很高,并且可以 让组织在灾难发生、云站点激活之前避免承担大部分运营成本。

已经在云中运营其技术资源的组织并不能免除灾难恢复的责任。 他们还必须 考虑如何处理云环境中出现的问题,并应设计和配置其云服务的使用方式, 以利用冗余选项、地理分散性以及其他类似考量。 依赖云计算进行灾难恢复计划的组织应考虑与云服务提供商签订资源容量协议

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

成本效益:安全控制不能无限堆钱,要用合理成本降低最重要的风险。

日志:日志记录系统和用户活动,用于监控、审计和调查。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1251 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

CISSP 喜欢考成本收益:控制成本不应明显超过被降低的风险价值。

日志要保护完整性、时间同步和访问控制。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
成本效益 安全控制不能无限堆钱,要用合理成本降低最重要的风险。
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 36 / PDF P1252

机密性:让该看的人看,不该看的人看不到

机密性重点是防泄露,同时不能妨碍授权访问。

教材原文段落

providers. This agreement ensures that the cloud provider will provide the resources needed to support disaster recovery operations. Mutual Assistance Agreements Mutual assistance agreements (MAAs) are also called reciprocal agreements. They provide an alternate processing option that doesn't require significant capital investment. Under an MAA, two organizations pledge to assist each other in the event of a disaster by sharing computing facilities or other technological resources.

They appear to be extremely cost effective at first glance—it's not necessary for either organization to maintain expensive alternate processing sites (such as the hot sites, warm sites, cold sites, and mobile processing sites described in the previous sections). Indeed, many MAAs are structured to provide one of the levels of service described. In the case of a cold site, each organization may simply maintain some open space in their processing facilities for the other organization to use in the event of a disaster. In the case of a hot site, the organizations may host fully redundant servers for each other.

However, many drawbacks inherent to MAAs prevent their widespread use: MAAs are difficult to enforce. The parties might trust each other to provide support in the event of a disaster. However, when push comes to shove, the nonvictim might renege on the agreement. A victim may have legal remedies available, but this doesn't help the immediate disaster recovery effort. Cooperating organizations should be located in relatively close proximity to each other to facilitate transportation of employees between sites. However, proximity means that both organizations may be vulnerable to the same threats.

An MAA won't do you any good if an earthquake levels your city and destroys processing sites for both participating organizations. Confidentiality concerns often prevent businesses from placing their data in the hands of others. These may be legal concerns (such as in the handling of healthcare or financial data) or business concerns (such as trade secrets or other intellectual property issues). Despite these concerns, an MAA may be a good disaster recovery solution for an organization, especially in cases where the agreement is between two

中文直译 / 整理

提供商。 该协议确保云服务提供商将提供支持灾难恢复操作所需的资源。 互助协议 互助协议(MAAs)也称为互惠协议。 它们提供了一种无需重大资本投资的替 代处理方案。 在MAA下,两个组织承诺在发生灾难时通过共享计算设施或其他 技术资源相互协助。 乍一看,它们似乎极具成本效益——任何一方都不必维持 昂贵的备用处理站点(如前几节所述的热站点、温站点、冷站点和移动处理站 点)。 事实上,许多MAA的结构旨在提供上述某一服务水平。 在冷站点的情况 下,每个组织可能只需在其处理设施中保留一些空闲空间,供另一组织在灾难 发生时使用。 在热站点的情况下,组织可能为彼此托管完全冗余的服务器。 然而,MAA固有的许多缺点阻碍了其广泛应用: MAA难以执行。 各方可能信任对方在灾难发生时提供支持。 然而,当情况 紧急时,非受灾方可能会违背协议。 受灾方可能有法律救济途径,但这无 助于立即的灾难恢复工作。 合作组织应彼此位于相对接近的位置,以便于员工在各站点之间通勤。 然 而, proximity 意味着两个组织可能面临相同的威胁。 如果一场地震摧毁 了你的城市,并毁掉了both参与组织的处理站点,那么 MAA 对你没有任 何帮助。

机密性顾虑常常使企业不愿将数据交由他人保管。 这些顾虑可能是法律方 面的(例如医疗或财务数据的处理),也可能是业务方面的(例如商业秘 密或其他知识产权问题)。 尽管存在这些担忧,对于一个组织而言,MAA 可能是一种良好的灾难恢复解决方 案,尤其是在协议涉及同一组织的两个

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:机密性重点是防泄露,同时不能妨碍授权访问。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

成本效益:安全控制不能无限堆钱,要用合理成本降低最重要的风险。

机密性:机密性让该看的人能看,不该看的人看不到。

日志:日志记录系统和用户活动,用于监控、审计和调查。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“机密性:让该看的人看,不该看的人看不到”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

CISSP 喜欢考成本收益:控制成本不应明显超过被降低的风险价值。

加密、访问控制、分类、培训都常用于保护机密性。

日志要保护完整性、时间同步和访问控制。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
成本效益 安全控制不能无限堆钱,要用合理成本降低最重要的风险。
机密性 机密性让该看的人能看,不该看的人看不到。
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 37 / PDF P1253

第 1253 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

internal units or subsidiaries of the same organization who have an incentive to cooperate. Database Recovery Many organizations rely on databases to process and track operations, sales, logistics, and other activities vital to their continued viability. For this reason, it's essential that you include database recovery techniques in your disaster recovery plans. It's a wise idea to have a database specialist on the DRP team who can provide input as to the technical feasibility of various ideas. After all, you shouldn't allocate several hours to restore a database backup when it's impossible to complete a restoration in less than half a day.

In the following sections, we'll cover the three main techniques used to create off-site copies of database content: electronic vaulting, remote journaling, and remote mirroring. Each one has specific benefits and drawbacks, so you'll need to analyze your organization's computing requirements and available resources to select the option best suited to your firm and within the boundaries of your RPO. Selecting solutions that lose data beyond your RPO pose unwarranted risk, whereas selecting those that are more aggressive than your RPO may incur unnecessary costs. Electronic Vaulting In an electronic vaulting scenario, database backups are moved to a remote site using bulk transfers.

The remote location may be a dedicated alternative recovery site (such as a hot site) or simply an off-site location managed within the company or by a contractor for the purpose of maintaining backup data. If you use electronic vaulting, remember that there may be a significant delay between the time you declare a disaster and the time your database is ready for operation with current data. If you decide to activate a recovery site, technicians will need to retrieve the appropriate backups from the electronic vault and apply them to the soon-to-be production servers at the recovery site.

中文直译 / 整理

内部单位或子公司,且它们有合作动力的情况下。 数据库恢复 许多组织依赖数据库来处理和跟踪运营、销售、物流以及其他对其持续生存至 关重要的活动。 因此,将数据库恢复技术纳入您的灾难恢复计划至关重要。 建 议在DRP团队中配备一位数据库专家,以便对各种方案的技术可行性提供意见。 毕竟,如果在半天内无法完成数据库恢复,就不应分配数小时用于恢复数据库 备份。 在以下章节中,我们将介绍三种用于创建数据库内容异地副本的主要技术:电 子归档、远程日志记录和远程镜像。 每种技术都有其特定的优势和缺点,因此 您需要分析组织的计算需求和可用资源,以选择最适合贵公司且符合您RPO边 界的选择。 选择导致数据丢失超过RPO的方案会带来不必要的风险,而选择比 RPO更激进的方案则可能产生不必要的成本。 电子 vaulting 在 电子vaulting 场景中,数据库备份通过批量传输被移至远程站点。 远程位 置可以是专用的备用恢复站点(例如热站点),也可以是公司内部或由承包商 管理的、用于维护备份数据的异地位置。 如果您使用电子保险库,请记住,在您宣布灾难发生与数据库准备好使用最新 数据运行之间,可能存在显著延迟。

如果您决定激活恢复站点,技术人员需要 从电子保险库中检索适当的备份,并将其应用到恢复站点即将投入生产的服务 器上。

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

日志:日志记录系统和用户活动,用于监控、审计和调查。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1253 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

日志要保护完整性、时间同步和访问控制。

RTO 是多久恢复,RPO 是能丢多少数据。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
日志 日志记录系统和用户活动,用于监控、审计和调查。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 38 / PDF P1254

第 1254 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Be careful when considering vendors for an electronic vaulting contract. Definitions of electronic vaulting vary widely within the industry. Don't settle for a vague promise of “electronic vaulting capability.” Insist on a written definition of the service that will be provided, including the storage capacity, bandwidth of the communications link to the electronic vault, and the time necessary to retrieve vaulted data in the event of a disaster. As with any type of backup scenario, be certain to periodically test your electronic vaulting setup. A great method for testing backup solutions is to give disaster recovery personnel a “surprise test,” asking them to restore data from a certain day.

It's important to know that electronic vaulting introduces the potential for significant data loss. In the event of a disaster, you will only be able to recover information as of the time of the last vaulting operation. Remote Journaling With remote journaling, data transfers are performed in a more expeditious manner. Data transfers still occur in a bulk transfer mode, but they occur on a more frequent basis, usually once every hour and sometimes more frequently.

Unlike electronic vaulting scenarios, where entire database backup files are transferred, remote journaling setups transfer copies of the database transaction logs containing the transactions that occurred since the previous bulk transfer. Remote journaling is similar to electronic vaulting in that transaction logs transferred to the remote site are not applied to a live database server but are maintained in a backup device. When a disaster is declared, technicians retrieve the appropriate transaction logs and apply them to the production database, bringing the database up to the current production state. Remote Mirroring

中文直译 / 整理

在考虑电子保险库合同时,请谨慎选择供应商。 行业内对电子保险库的 定义差异很大。 不要满足于模糊的“具备电子保险库功能”的承诺。 坚持要 求提供书面的服务定义,包括存储容量、与电子保险库通信链路的带宽,以 及在灾难发生时检索保险库数据所需的时间。 与任何类型的备份场景一样,请务必定期测试您的电子归档设置。 测试备份解 决方案的一个绝佳方法是给灾难恢复人员一个“突击测试”,要求他们从某一 天恢复数据。 重要的是要了解,电子归档可能会导致大量数据丢失。 在发生灾难 时,您只能恢复到上一次归档操作时的数据。 远程日志记录 通过远程日志记录,数据传输以更迅速的方式进行。 数据传输仍然以批量传输 模式进行,但频率更高,通常每小时一次,有时更频繁。 与电子归档场景不同, 电子归档会传输整个数据库备份文件,而远程日志记录设置则传输自上一次批 量传输以来发生的事务的日志副本。 远程日志记录与电子归档类似,因为传输到远程站点的事务日志不会应用于活 动数据库服务器,而是保存在备份设备中。 当发生灾难时,技术人员会检索相 应的事务日志并将其应用于生产数据库,使数据库恢复到当前生产状态。 远程镜像

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

日志:日志记录系统和用户活动,用于监控、审计和调查。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1254 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

日志要保护完整性、时间同步和访问控制。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 39 / PDF P1255

第 1255 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Remote mirroring is the most advanced database backup solution. Not surprisingly, it's also the most expensive! Remote mirroring goes beyond the technology used by remote journaling and electronic vaulting; with remote mirroring, a live database server is maintained at the backup site. The remote server receives copies of the database modifications at the same time they are applied to the production server at the primary site. Therefore, the mirrored server is ready to take over an operational role at a moment's notice. Remote mirroring is a popular database backup strategy for organizations seeking to implement a hot site.

However, when weighing the feasibility of a remote mirroring solution, be sure to take into account the infrastructure and personnel costs required to support the mirrored server, as well as the processing overhead that will be added to each database transaction on the mirrored server. Cloud-based database platforms may include redundancy capabilities as a built-in feature. If you operate databases in the cloud, consider investigating these options to simplify your disaster recovery planning efforts, but be sure to understand the limitations of the specific service you consider!

Recovery Plan Development Once you've established your business unit priorities and have a good idea of the appropriate alternative recovery sites for your organization, it's time to put pen to paper and begin drafting a true disaster recovery plan. Don't expect to sit down and write the full plan in one sitting. It's likely that the DRP team will go through many draft documents before reaching a final written document that satisfies the operational needs of critical business units and falls within the resource, time, and expense constraints of the disaster recovery budget and available personnel.

In the following sections, we explore some important items to include in your disaster recovery plan. Depending on the size of your organization and the number of people involved in the DRP effort, it may be a good idea to maintain multiple types of plan documents, intended for different audiences. The following list includes various types of documents worth considering:

中文直译 / 整理

远程镜像是最先进的数据库备份解决方案。 不出所料,它也是最昂贵的! 远程 镜像超越了远程日志记录和电子归档所使用的技术; 在远程镜像中,备份站点 会维护一个活动数据库服务器。 远程服务器在主站点的生产服务器应用数据库 修改的同时接收这些修改的副本。 因此,镜像服务器可以随时接管运行角色。 远程镜像是组织实施热站点时常用的一种数据库备份策略。 然而,在评估远程 镜像解决方案的可行性时,请务必考虑支持镜像服务器所需的基础设施和人员 成本,以及为镜像服务器上的每个数据库事务增加的处理开销。 基于云的数据库平台可能将冗余功能作为内置特性。 如果您在云中运 行数据库,请考虑调查这些选项以简化灾难恢复规划工作,但务必了解您 所考虑的特定服务的局限性! 恢复计划制定 一旦您确定了业务单元的优先级,并对组织的合适备用恢复站点有了清晰的认 识,就该动笔起草一份真正的灾难恢复计划了。 不要期望一次性坐下来就完成 整个计划的撰写。 DRP团队很可能需要经过多次草案修改,才能最终形成一份 满足关键业务单元运营需求、并符合灾难恢复预算和可用人员资源与时间限制 的正式文档。 在以下章节中,我们将探讨在您的灾难恢复计划中应包含的一些重要事项。

根 据您组织的规模以及参与灾难恢复计划工作的人员数量,维护多种面向不同受 众的计划文档可能是一个不错的选择。 以下列表包含了值得考虑的各种文档类 型:

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

日志:日志记录系统和用户活动,用于监控、审计和调查。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1255 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

日志要保护完整性、时间同步和访问控制。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
日志 日志记录系统和用户活动,用于监控、审计和调查。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 40 / PDF P1256

安全控制框架:用成熟框架组织安全

框架帮助组织系统化管理控制,而不是想到哪做到哪。

教材原文段落

Executive summary providing a high-level overview of the plan Department-specific plans Technical guides for IT personnel responsible for implementing and maintaining critical backup systems Checklists for individuals on the disaster recovery team Full copies of the plan for critical disaster recovery team members Using custom-tailored documents becomes especially important when a disaster occurs or is imminent. Personnel who need to refresh themselves on the disaster recovery procedures that affect various parts of the organization will be able to refer to their department-specific plans.

Critical disaster recovery team members will have checklists to help guide their actions amid the chaotic atmosphere of a disaster. IT personnel will have technical guides helping them get the alternate sites up and running. Finally, managers and public relations personnel will have a simple document that walks them through a high-level view of the coordinated symphony that is an active disaster recovery effort without requiring interpretation from team members busy with tasks directly related to that effort.

Visit the Professional Practices library at http://drii.org/resources/professionalpractices/EN to examine a collection of documents that explain how to work through and document your planning processes for BCP and disaster recovery. Other good standard documents in this area include the BCI Good Practice Guidelines (GPG) (www.thebci.org/resource/good-practiceguidelines--gpg--edition-7-0.html), ISO 27001:2022 (www.iso.org/standard/27001), and NIST SP 800-34—Contingency Planning Guide for Federal Information Systems (www.nist.gov/privacy-framework/nist-sp-800-34).

Emergency Response A disaster recovery plan should contain simple yet comprehensive instructions for essential personnel to follow immediately upon recognizing that a disaster is in progress or is imminent. These instructions will vary

中文直译 / 整理

提供计划高层概述的执行摘要 部门特定计划 面向负责实施和维护关键备份系统的IT人员的技术指南 灾难恢复团队成员的检查清单 提供给关键灾难恢复团队成员的完整计划副本 当灾难发生或即将发生时,使用定制文档变得尤为重要。 需要了解影响组织各 个部分的灾难恢复程序的人员可以参考其部门特定计划。 关键灾难恢复团队成 员将拥有检查清单,以帮助他们在灾难的混乱环境中指导行动。 IT人员将拥有 技术指南,帮助他们快速启动备用站点。 最后,管理人员和公共关系人员将拥 有一份简洁文档,引导他们了解灾难恢复工作的整体协调流程,而无需依赖正 在处理直接相关任务的团队成员进行解释。 访问专业实践库: http://drii.org/resources/professionalpractices/EN 以查阅一组文件,这些文 件说明了如何进行并记录您的业务连续性计划(BCP)和灾难恢复的规划过程。

本 领域其他优秀的标准文件包括BCI良好实践指南(GPG) (www.thebci.org/resource/good-practice-guidelines--gpg--edition-7-0.html)、 ISO 27001:2022 (www.iso.org/standard/27001) 和 NIST SP 800-34— Contingency 联邦信息系统规划指南(www.nist.gov/privacy-framework/nist-sp-800-34) 应急响应 灾难恢复计划应包含简洁而全面的说明,供关键人员在意识到灾难正在进行 或即将发生时立即遵循。 这些说明将因

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:框架帮助组织系统化管理控制,而不是想到哪做到哪。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

ISO:ISO 是国际标准化组织,常见安全管理体系如 ISO 27001/27002。

NIST:NIST 提供美国常用安全标准、框架和指南。

标准:标准给出必须满足的最低要求。

指南:指南是建议做法,不一定强制。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“安全控制框架:用成熟框架组织安全”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

ISO 偏标准和管理体系。

看到 SP 800 系列、CSF、RMF 常联想到 NIST。

Minimum level、mandatory requirement 常对应 standard。

Recommended、not compulsory 常对应 guideline。

Step-by-step、SOP 常对应 procedure。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
ISO ISO 是国际标准化组织,常见安全管理体系如 ISO 27001/27002。
NIST NIST 提供美国常用安全标准、框架和指南。
标准 标准给出必须满足的最低要求。
指南 指南是建议做法,不一定强制。
程序 程序是一步一步怎么做。
业务连续性计划 BCP BCP 关注业务在灾难或中断中如何继续运行。
学习单元 41 / PDF P1257

政策、标准、程序、指南

高层原则、最低要求、操作步骤、建议做法要分清。

教材原文段落

widely depending on the nature of the disaster, the type of personnel responding to the incident, and the time available before facilities need to be evacuated and/or equipment shut down. For example, instructions for a large-scale fire will be much more concise than the instructions for how to prepare for a hurricane that is still 48 hours away from a predicted landfall near an operational site. Emergency-response plans are often put together in the form of checklists provided to responders. When designing such checklists, keep one essential design principle in mind: arrange the checklist tasks in order of priority, with the most important task first.

It's essential to remember that these checklists will be executed in the midst of a crisis. It is extremely likely that responders will not be able to complete the entire checklist, especially in the event of a short-notice disaster. For this reason, you should put the most essential tasks first on the checklist. The lower an item on the list, the lower the likelihood that it will be completed before an evacuation/shutdown takes place. Among these essential tasks is the formal declaration of a disaster.

The response plan should include clear criteria for activation of the disaster recovery plan, define who has the authority to declare a disaster, and then discuss notification procedures, as discussed in the next section. Personnel and Communications A disaster recovery plan should also contain a list of personnel to contact in the event of a disaster. Usually, this includes key members of the DRP team as well as personnel who execute critical disaster recovery tasks throughout the organization.

This response checklist should include alternate means of contact (e.g., pager numbers, mobile numbers) as well as backup contacts for each role should the primary contact be incommunicado or unable to reach the recovery site for one reason or another.

中文直译 / 整理

灾难的性质、响应人员的类型以及在设施需要疏散和/或设备关闭前可用的时 间而有很大差异。 例如,针对大规模火灾的说明将比针对距离预测登陆点仅剩 48小时的飓风的准备说明简洁得多。 应急响应计划通常以提供给响应人员的清 单形式制定。 在设计此类清单时,请牢记一个基本设计原则:按优先级顺序排 列清单任务,将最重要的任务放在首位。 必须记住,这些检查清单将在危机期间执行。 responders 极有可能无法完成 整个检查清单,尤其是在突发灾难的情况下。 因此,您应将最重要的任务优先 列在检查清单的前面。 清单中越靠下的项目,被在疏散/关闭前完成的可能性就 越低。 这些重要任务中包括正式宣布灾难。 响应计划应包含明确的灾难恢复计划 启动标准,定义谁有权限宣布灾难,然后讨论通知程序,如下一节所述。 人员与通信 灾难恢复计划还应包含一份灾难发生时需要联系的人员名单。 通常,这包括 DRP团队的关键成员以及组织内执行关键灾难恢复任务的人员。 此响应清单应 包含替代联系方式(例如寻呼机号码、手机号码),以及每个角色的备用联系 人,以防主要联系人无法联络或因任何原因无法到达恢复现场。

小白解释

场景先行:员工在家访问公司系统,流量要穿过家庭网络、互联网、防火墙、VPN、服务器。网络安全题就是让你判断问题发生在哪一层、用哪个控制放在什么位置。

这一页真正想让你理解的是:高层原则、最低要求、操作步骤、建议做法要分清。

把它放进公司里看,关键不是背定义,而是判断:不分层就会乱选设备:该加密的地方装防火墙,该监测的地方却只做访问控制。

你作为负责人可以这样想:先定位网络层次,再决定是分段、过滤、加密、检测还是阻断。

本页术语用人话说:

标准:标准给出必须满足的最低要求。

程序:程序是一步一步怎么做。

入侵检测系统 IDS:IDS 负责发现可疑行为并告警,一般不直接阻断。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

读完后用一句话复述:如果我是网络安全工程师,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“政策、标准、程序、指南”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是网络安全工程师在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Minimum level、mandatory requirement 常对应 standard。

Step-by-step、SOP 常对应 procedure。

检测是 IDS,主动阻断更像 IPS。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

本页术语拆解
标准 标准给出必须满足的最低要求。
程序 程序是一步一步怎么做。
入侵检测系统 IDS IDS 负责发现可疑行为并告警,一般不直接阻断。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 42 / PDF P1258

第 1258 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

The Power of Checklists Checklists are invaluable tools in the face of disaster. They provide a sense of order amid the chaotic events surrounding a disaster. Do what you must to ensure that response checklists provide first responders with a clear plan to protect life and property and ensure the continuity of operations. A checklist for response to a building fire might include the following steps: 1. Activate the building alarm system. 2. Ensure that an orderly evacuation is in progress. 3. If reasonable to do so, consider fighting the fire with available fire extinguishers or other fire suppression equipment. 4.

After leaving the building, use a mobile telephone to call emergency services (911 in the United States) to ensure that emergency authorities received the alarm notification. Provide additional information on any required emergency response. 5. Ensure that any injured personnel receive appropriate medical treatment. 6. Activate the organization's disaster recovery plan to ensure continuity of operations. Assessment When the disaster recovery team arrives on-site, one of their first tasks is to assess the situation. This normally occurs in a rolling fashion, with the first responders performing a simple assessment to triage activity and get the disaster response under way.

As the incident progresses, more detailed assessments will take place to gauge the effectiveness of disaster recovery efforts and prioritize the assignment of resources. Backups and Storage Strategies Backups play an important role in the disaster recovery plan. They are copies of data stored on tape, disk, the cloud, or other media as a last-ditch recovery

中文直译 / 整理

清单的力量 在灾难面前,清单是无价的工具。 它们能在灾难周围的混乱事件中提供秩 序感。 务必采取一切必要措施,确保响应清单为应急人员提供明确的计划, 以保护生命和财产,并确保业务连续性。 建筑物火灾应对清单可能包括以下步骤: 1. 启动建筑物警报系统。 2. 确保有序疏散正在进行。 3. 如果合理可行,考虑使用可用的灭火器或其他灭火设备扑灭火灾。 4. 离开建筑物后,使用移动电话拨打紧急服务电话(美国为911),以 确保紧急管理部门已收到警报通知,并提供任何所需的紧急响应的额外 信息。 5. 确保所有受伤人员获得适当的医疗救治。 6. 启动组织的灾难恢复计划,以确保业务连续性。 评估 当灾难恢复团队抵达现场时,他们的首要任务之一是评估情况。 这通常以滚 动方式进行,首批响应人员会进行初步评估,以分类活动并启动灾难应对工 作。 随着事件的发展,将进行更详细的评估,以衡量灾难恢复工作的有效性, 并优先分配资源。 备份与存储策略 备份在灾难恢复计划中起着重要作用。 它们是存储在磁带、磁盘、云或其他介质上 的数据副本,作为最后的恢复手段

小白解释

场景先行:你是公司的安全负责人,正在读第 1258 页这一组概念。老板不会问你背定义,而是问:这件事会不会影响业务、谁负责、要不要花钱、出了事能不能解释清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:概念没放进业务场景,容易只背词,做题时不知道该选管理动作还是技术动作。

你作为负责人可以这样想:先确认业务目标和风险,再选控制措施,最后留下政策、审批、日志或证据。

如果这一页没有明显术语,就按“谁在做事、保护什么、怕什么、用什么控制、留下什么证据”来拆。

常见误区:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

读完后用一句话复述:如果我是安全负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1258 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是安全负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

排除法提醒:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

本页术语拆解

本页没有识别到重点术语,按原文顺序理解即可。

学习单元 43 / PDF P1259

安全控制框架:用成熟框架组织安全

框架帮助组织系统化管理控制,而不是想到哪做到哪。

教材原文段落

option. If a natural or human-made disaster causes data loss, administrators may turn to backups to recover lost data. Your disaster recovery plan (especially the technical guide) should fully address the backup strategy pursued by your organization. Indeed, this is one of the most important elements of any business continuity plan and disaster recovery plan. Many system administrators are already familiar with various types of backups, so you'll benefit by bringing one or more individuals with specific technical expertise in this area onto the BCP/DRP team to provide expert guidance.

There are three main types of backups: Full Backups As the name implies, full backups store a complete copy of the data contained on the protected device. Full backups duplicate every file on the system regardless of the setting of the archive bit. Once a full backup is complete, the archive bit on every file is reset, turned off, or set to 0. Incremental Backups Incremental backups store only those files that have been modified since the time of the most recent full or incremental backup. Only files that have the archive bit turned on, enabled, or set to 1 are duplicated. Once an incremental backup is complete, the archive bit on all duplicated files is reset, turned off, or set to 0.

Differential Backups Differential backups store all files that have been modified since the time of the most recent full backup. Only files that have the archive bit turned on, enabled, or set to 1 are duplicated. However, unlike full and incremental backups, the differential backup process does not change the archive bit. Some operating systems do not actually use an archive bit to achieve this goal and instead analyze file system timestamps. This difference in implementation doesn't affect the types of data stored by each backup type. The most important difference between incremental and differential backups is the time needed to restore data in the event of an emergency.

If you use a combination of full and differential backups, you will need to restore only two backups—the most recent full backup and the most recent differential backup. On the other hand, if your strategy combines full backups with

中文直译 / 整理

选项。 如果自然灾害或人为灾难导致数据丢失,管理员可以依靠备份来恢复丢失 的数据。 您的灾难恢复计划(特别是技术指南)应全面涵盖贵组织所采用的备份策略。 事实上,这是任何业务连续性计划和灾难恢复计划中最重要的要素之一。 许多系统管理员已经熟悉各种类型的备份,因此您可以通过让一名或多名在 该领域具有特定技术专长的人员加入BCP/DRP团队,以获得专业指导。 备 份主要有三种类型: 完整备份 如其名称所示,完整备份 会存储受保护设备上包含的所有数据的完整 副本。 完整备份会复制系统上的每个文件,无论存档位的设置如何。 一旦完整 备份完成,每个文件的存档位都会被重置、关闭或设置为0。 增量备份 增量备份 仅存储自上次完整备份或增量备份以来已修改的文件。 只 有存档位被开启、启用或设置为1的文件才会被复制。 一旦增量备份完成,所 有被复制文件的存档位都会被重置、关闭或设置为0。 差异备份 差异备份 存储自最近一次完整备份以来所有已修改的文件。 仅复制归 档位被启用、开启或设置为 1 的文件。 然而,与完整备份和增量备份不同,差异 备份过程不会更改归档位。 某些操作系统实际上并未使用归档位来实现此目标,而是分析文件系 统的时间戳。

这种实现上的差异不会影响每种备份类型所存储的数据类型。 增量备份和差异备份之间最重要的区别在于发生紧急情况时恢复数据所需的时 间。 如果您使用完整备份和差异备份的组合,您只需恢复两个备份——最新的完 整备份和最新的差异备份。 另一方面,如果您的策略结合了完整备份和

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:框架帮助组织系统化管理控制,而不是想到哪做到哪。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

NIST:NIST 提供美国常用安全标准、框架和指南。

指南:指南是建议做法,不一定强制。

业务连续性计划 BCP:BCP 关注业务在灾难或中断中如何继续运行。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“安全控制框架:用成熟框架组织安全”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

看到 SP 800 系列、CSF、RMF 常联想到 NIST。

Recommended、not compulsory 常对应 guideline。

BCP 保护业务流程,DRP 保护 IT 恢复。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
NIST NIST 提供美国常用安全标准、框架和指南。
指南 指南是建议做法,不一定强制。
业务连续性计划 BCP BCP 关注业务在灾难或中断中如何继续运行。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 44 / PDF P1260

安全控制框架:用成熟框架组织安全

框架帮助组织系统化管理控制,而不是想到哪做到哪。

教材原文段落

incremental backups, you will need to restore the most recent full backup as well as all incremental backups performed since that full backup. The tradeoff is the time required to create the backups—differential backups don't take as long to restore, but they take longer to create than incremental ones. The storage of the backup media is equally critical. It may be convenient to store backup media in or near the primary operations center to easily fulfill user requests for backup data, but you'll definitely need to keep copies of the media in at least one off-site location to provide redundancy should your primary operating location be suddenly destroyed.

One common strategy used by many organizations is to store backups in a cloud service that is itself geographically redundant. This allows the organization to retrieve the backups from any location after a disaster. Note that using geographically diverse sites may introduce new regulatory requirements when the information resides in different jurisdictions. Using Backups In case of system failure, many companies use one of two common methods to restore data from backups. In the first situation, they run a full backup on Monday night and then run differential backups every other night of the week.

If a failure occurs Saturday morning, they restore Monday's full backup and then restore only Friday's differential backup. In the second situation, they run a full backup on Monday night and run incremental backups every other night of the week. If a failure occurs Saturday morning, they restore Monday's full backup and then restore each incremental backup in original chronological order. Most organizations adopt a backup strategy that utilizes more than one of the three backup types along with a media rotation scheme.

Both allow backup administrators access to a sufficiently large range of backups to complete user requests and provide fault tolerance while minimizing the amount of money that must be spent on backup media. A common strategy is to perform full backups over the weekend and incremental or differential backups on a nightly basis. The specific method of backup and all of the particulars of the backup procedure are dependent on your organization's fault-tolerance requirements, as defined by your RPO values. If you are unable to survive minor amounts of data loss, your ability to tolerate faults is low. However, if

中文直译 / 整理

增量备份,您需要恢复最新的完整备份以及自该完整备份以来执行的所有增量 备份。 权衡之处在于创建备份所需的时间——差异备份恢复起来更快,但创建 时间比增量备份更长。 备份介质的存储同样至关重要。 将备份介质存放在主运营中心内部或附近,可 以方便地满足用户对备份数据的请求,但您必须至少在一处异地位置保留介质 副本,以便在主运营地点突然被毁时提供冗余。 许多组织常用的一种策略是将 备份存储在本身具有地理冗余的云服务中。 这使得组织在灾难发生后,能够从 任何地点检索备份。 请注意,使用地理位置分散的站点可能会引入新的监管要 求,因为信息存储在不同司法管辖区时会涉及合规问题。 使用备份 在系统故障的情况下,许多公司通常采用两种方法之一从备份中恢复数据。 第一种情况是:周一夜间执行完整备份,然后在每周其他夜晚执行差异备 份。 如果周六早上发生故障,则恢复周一的完整备份,再仅恢复周五的差 异备份。 第二种情况是:周一夜间执行完整备份,然后在每周其他夜晚执 行增量备份。 如果周六早上发生故障,则恢复周一的完整备份,再按原始 时间顺序依次恢复每个增量备份。 大多数组织采用一种备份策略,结合使用三种备份类型中的多种,并配合介质 轮换方案。

这两种方式都使备份管理员能够访问足够广泛的备份,以满足用户 请求并提供容错能力,同时最小化在备份介质上的支出。 一种常见的策略是在 周末执行完整备份,而在每晚执行增量或差异备份。 具体的备份方法和备份程 序的所有细节取决于您组织的容错要求,这些要求由您的RPO值定义。 如果您 无法承受少量数据丢失,那么您的容错能力就较低。 然而,如果

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:框架帮助组织系统化管理控制,而不是想到哪做到哪。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

NIST:NIST 提供美国常用安全标准、框架和指南。

程序:程序是一步一步怎么做。

日志:日志记录系统和用户活动,用于监控、审计和调查。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“安全控制框架:用成熟框架组织安全”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

看到 SP 800 系列、CSF、RMF 常联想到 NIST。

Step-by-step、SOP 常对应 procedure。

日志要保护完整性、时间同步和访问控制。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
NIST NIST 提供美国常用安全标准、框架和指南。
程序 程序是一步一步怎么做。
日志 日志记录系统和用户活动,用于监控、审计和调查。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 45 / PDF P1261

安全控制框架:用成熟框架组织安全

框架帮助组织系统化管理控制,而不是想到哪做到哪。

教材原文段落

hours or days of data can be lost without serious consequence, your tolerance of faults is high. You should design your backup solution accordingly. The Oft-Neglected Backup Backups are probably the least practiced and most neglected preventive measure known to protect against computing disasters. A comprehensive backup of all operating system and personal data on workstations happens less frequently than for servers or mission-critical machines, but they all serve an equal and necessary purpose. Damon, an information professional, learned this the hard way when he lost months of work following a natural disaster that wiped out the first floor at an information brokering firm.

He never used the backup facilities built into his operating system or any of the shared provisions established by his administrator, Carol. Carol has been there and done that, so she knows a thing or two about backup solutions. She has established incremental backups on her production servers and differential backups on her development servers, and she's never had an issue restoring lost data. The toughest obstacle to a solid backup strategy is human nature, so a simple, transparent, and comprehensive strategy is the most practical.

Differential backups require only two container files (the latest full backup and the latest differential) and can be scheduled for periodic updates at some specified interval. That's why Carol elects to implement this approach and feels ready to restore from her backups any time she's called on to do so. Disk-to-Disk Backup Over the past decade, disk storage has become increasingly inexpensive. With drive capacities now measured in terabytes, tape and optical media can't cope with data volume requirements anymore. Many enterprises now use disk-todisk (D2D) backup solutions for some portion of their disaster recovery strategy.

中文直译 / 整理

丢失数小时或数天的数据不会造成严重后果,则您的容错能力较高。 您应据此设计 您的备份解决方案。 常被忽视的备份 备份可能是最不常实践、最被忽视的预防措施,用于防范计算灾难。 工作 站上所有操作系统和个人数据的完整备份,其执行频率低于服务器或关键 任务机器,但它们的作用同等重要且必不可少。 信息专业人士达蒙在一场自然灾害摧毁了一家信息中介公司一楼后,失去 了数月的工作成果,才深刻体会到这一点。 他从未使用过操作系统内置的 备份功能,也从未使用过管理员卡罗尔设置的任何共享备份方案。 卡罗尔曾亲身经历过这些,因此对备份解决方案颇有心得。 她在生产服务 器上设置了增量备份,在开发服务器上设置了差异备份,从未遇到过无法 恢复丢失数据的问题。 实施稳健备份策略最难克服的障碍是人性,因此简单、透明且全面的策略 最为实用。 差异备份仅需两个容器文件(最新的完整备份和最新的差异备 份),并可按指定间隔定期更新。 这就是卡罗尔选择采用这种方法的原因, 她随时都准备好在需要时从备份中恢复数据。 磁盘到磁盘备份 在过去十年中,磁盘存储变得越来越便宜。 随着驱动器容量现在以太字节为单 位,磁带和光盘介质已无法满足数据量需求。

许多企业现在将磁盘到磁盘( D2D)备份解决方案用于其灾难恢复策略的一部分。

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:框架帮助组织系统化管理控制,而不是想到哪做到哪。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

NIST:NIST 提供美国常用安全标准、框架和指南。

强制访问控制 MAC:MAC 由系统根据标签和级别强制决定访问。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“安全控制框架:用成熟框架组织安全”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

看到 SP 800 系列、CSF、RMF 常联想到 NIST。

政府/军方、机密级别、标签、不可由用户随意改通常是 MAC。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
NIST NIST 提供美国常用安全标准、框架和指南。
强制访问控制 MAC MAC 由系统根据标签和级别强制决定访问。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 46 / PDF P1262

第 1262 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Many backup technologies are designed around the tape paradigm. Virtual tape libraries (VTLs) support the use of disks with this model by using software to make disk storage appear as tapes to backup software. One important note: organizations seeking to adopt an entirely disk-to-disk approach must remember to maintain geographical diversity. Some of those disks have to be located off-site. Many organizations solve this problem by hiring managed service providers to manage remote backup locations. Cloud Storage Cloud storage provides a flexible and scalable solution for backups, offering remote, geographically diverse data storage.

It mitigates the risk of data loss due to local disasters by enabling data retrieval from any location. Cloud backups often incorporate redundancy and can be more cost-effective, eliminating the need for physical storage management. Regulatory considerations apply when storing data across jurisdictions, making compliance an integral part of cloud storage strategy in disaster recovery planning. Backup Best Practices No matter what the backup solution, media, or method, you must address several common issues with backups. For instance, backup and restoration activities can be bulky and slow.

Such data movement can significantly affect the performance of a network, especially during regular production hours. Thus, backups should be scheduled during the low peak periods (for example, at night). The amount of backup data increases over time. This causes the backup (and restoration) processes to take longer each time you perform a backup. Each backup also consumes more space on the backup media. Thus, you need to build sufficient capacity to handle a reasonable amount of growth over a reasonable amount of time into your backup solution. What is reasonable all depends on your environment and budget.

With periodic backups (that is, backups that are run every 24 hours), there is always the potential for data loss up to the length of the period. Murphy's law dictates that a server never crashes immediately after a successful backup. Instead, it is always just before the next backup begins. To avoid the problem with periods, you may deploy some form of real-time continuous backup, such as RAID, clustering, or server mirroring.

中文直译 / 整理

许多备份技术都是围绕磁带模式设计的。 虚拟磁带库(VTLs)通过软件将 磁盘存储呈现为磁带,从而支持在此模型中使用磁盘。 一个重要注意事项:寻求采用全磁盘到磁盘方法的组织必须记住保持地理多 样性。 这些磁盘中的一些必须位于异地。 许多组织通过聘请托管服务提供商 来管理远程备份位置来解决这个问题。 云存储 云存储为备份提供了一种灵活且可扩展的解决方案,支持远程、地理分布的 数据存储。 它通过允许从任何位置检索数据,降低了因本地灾难导致数据丢 失的风险。 云备份通常包含冗余机制,且更具成本效益,无需管理物理存储 设备。 当数据跨越司法管辖区存储时,需考虑监管要求,因此合规性成为灾 难恢复规划中云存储策略的重要组成部分。 备份最佳实践 无论采用何种备份解决方案、介质或方法,都必须解决备份中的几个常见问题。 例如,备份和恢复操作可能非常繁重且缓慢。 这种数据传输会显著影响网络性 能,尤其是在常规生产时段。 因此,备份应安排在低峰期(例如夜间)。 备份数据量随时间增加。 这导致每次执行备份时,备份(和恢复)过程所需时 间越来越长。 每次备份还会占用备份介质上更多的空间。

因此,您需要在备份 解决方案中预留足够的容量,以应对合理时间范围内的合理增长。 何为合理, 完全取决于您的环境和预算。 通过定期备份(即每24小时运行一次的备份),始终存在最多长达一个周期的 数据丢失风险。 墨菲定律指出,服务器永远不会在成功备份后立即崩溃,而总 是在下一次备份开始前发生故障。 为避免周期性备份的问题,您可以部署某种 实时连续备份形式,例如RAID、集群或服务器镜像。

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

成本效益:安全控制不能无限堆钱,要用合理成本降低最重要的风险。

日志:日志记录系统和用户活动,用于监控、审计和调查。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1262 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

CISSP 喜欢考成本收益:控制成本不应明显超过被降低的风险价值。

日志要保护完整性、时间同步和访问控制。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
成本效益 安全控制不能无限堆钱,要用合理成本降低最重要的风险。
日志 日志记录系统和用户活动,用于监控、审计和调查。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 47 / PDF P1263

第 1263 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Only include necessary information in backups. For example, it might not be important to store operating system files in routine backups. Do you really need hundreds of copies of the operating system? The answer to this question should be influenced by your recovery objectives. If your RTO dictates a rapid recovery capability, the storage cost of maintaining many copies of the operating system may be justified by the fact that it makes restoring the entire system from a stored image quite fast. If you can tolerate a longer recovery time, you might be able to reduce your storage costs by eliminating the backup of redundant files.

Finally, remember to test your organization's recovery processes. Organizations often rely on the fact that their backup software reports a successful backup and fail to attempt recovery until it's too late to detect a problem. This is one of the biggest causes of backup failures. Tape Rotation There are several commonly used tape rotation strategies for backups: the Grandfather-Father-Son (GFS) strategy, the Tower of Hanoi strategy, and the Six Cartridge Weekly Backup strategy. These strategies can be fairly complex, especially with large tape sets.

They can be implemented manually using a pencil and a calendar or automatically by using either commercial backup software or a fully automated hierarchical storage management (HSM) system. An HSM system is an automated robotic backup jukebox consisting of 32 or 64 optical or tape backup devices. All the drive elements within an HSM system are configured as a single drive array (a bit like RAID). Details about various tape rotations are beyond the scope of this book, but if you want to learn more about them, search by their names on the Internet.

Software Escrow Arrangements A software escrow arrangement is a unique tool used to protect a company against the failure of a software developer to provide adequate support for its products or against the possibility that the developer will go out of business and no technical support will be available for the product.

中文直译 / 整理

仅在备份中包含必要的信息。 例如,常规备份中可能无需存储操作系统文件。 您真的需要数百份操作系统副本吗? 这个问题的答案应受您的恢复目标影响。 如果您的RTO要求快速恢复能力,那么维护多个操作系统副本的存储成本可能 因其能显著加快从存储镜像中恢复整个系统而得到合理化。 如果您能接受更长 的恢复时间,则可以通过删除冗余文件的备份来降低存储成本。 最后,请务必测试您组织的恢复流程。 组织通常依赖备份软件报告备份成功,却直到为时已晚、无法发现问题时才 尝试恢复。 这是备份失败的最主要原因之一。 磁带轮换 备份中常用的磁带轮换策略有几种:祖父‑父亲‑儿子(GFS)策略、汉诺塔策 略和六磁带周备份策略。 这些策略可能相当复杂,尤其是在磁带数量庞大的情 况下。 它们可以通过手工方式使用铅笔和日历实现,也可以通过商业备份软件 或全自动分层存储管理(HSM)系统自动实现。 HSM系统是一种自动化的机 器人磁带库,包含32或64个光盘或磁带备份设备。 HSM系统中的所有驱动器 元件均被配置为一个单一的驱动器阵列(类似于RAID)。 关于各种磁带轮换的详细信息超出了本书的范围,但如果您想了解更 多,可以在互联网上通过其名称进行搜索。

软件托管安排 一种软件托管安排是一种独特的工具,用于保护公司免受软件开发人员未能为 其产品提供充分支持的影响,或避免开发人员破产导致产品无法获得技术支持 的风险。

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

分层:分层把控制按层排列,让攻击者必须连续突破。

恢复时间目标 RTO:RTO 是业务或系统最多能中断多久。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1263 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

serial controls 更深,parallel controls 更宽;题目会考深度和广度。

RTO 问时间:多久必须恢复。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
分层 分层把控制按层排列,让攻击者必须连续突破。
恢复时间目标 RTO RTO 是业务或系统最多能中断多久。
学习单元 48 / PDF P1264

第三方治理:外包不外包责任

供应商也要被合同、审计、评估和持续监控管理起来。

教材原文段落

Focus your efforts on negotiating software escrow agreements with those suppliers you fear may go out of business because of their size. It's not likely that you'll be able to negotiate such an agreement with a firm such as Microsoft, unless you are responsible for an extremely large corporate account with serious bargaining power. On the other hand, it's equally unlikely that a firm of Microsoft's magnitude will go out of business, leaving end users high and dry. If your organization depends on custom-developed software or software products produced by a small firm, you may want to consider developing this type of arrangement as part of your disaster recovery plan.

Under a software escrow agreement, the developer provides copies of the application source code to an independent third-party organization. This third party then maintains updated backup copies of the source code in a secure fashion. The agreement between the end user and the developer specifies “trigger events,” such as the failure of the developer to meet terms of a service-level agreement (SLA) or the liquidation of the developer's firm. When a trigger event takes place, the third party releases copies of the application source code to the end user. The end user can then analyze the source code to resolve application issues or implement software updates.

Utilities As discussed in previous sections of this chapter, your organization is reliant on several utilities to provide critical elements of your infrastructure (e.g., electric power, water, natural gas, sewer service). Your disaster recovery plan should contain contact information and procedures to troubleshoot these services if problems arise during a disaster. Logistics and Supplies The logistical problems surrounding a disaster recovery operation are immense. You will suddenly face the problem of moving large numbers of people, equipment, and supplies to alternate recovery sites.

It's also possible that the people will be living at those sites for an extended period of time and that the disaster recovery team will be responsible for providing them with food, water, shelter, and appropriate facilities. Your disaster recovery plan

中文直译 / 整理

将你的努力集中在与那些你担心可能因规模太小而倒闭的供应商谈判软 件托管协议上。 除非你负责一个拥有强大议价能力的极其大型的企业账户, 否则不太可能与微软这样的公司达成此类协议。 另一方面,像微软这样规模 的公司也很不可能倒闭,从而让最终用户陷入困境。 如果您的组织依赖于自研软件或由小型公司开发的软件产品,您可能希望将此 类安排纳入您的灾难恢复计划中。 在软件托管协议下,开发方会将应用程序源 代码的副本提供给一个独立的第三方机构。 该第三方则以安全的方式维护源代 码的更新备份副本。 终端用户与开发方之间的协议规定了“触发事件”,例如 开发方未能履行服务水平协议(SLA)的条款,或开发方公司破产。 当触发事 件发生时,第三方会将应用程序源代码的副本释放给终端用户。 终端用户随后 可以分析源代码以解决应用程序问题或实施软件更新。 实用程序 如本章前几节所述,您的组织依赖于多种公用事业服务来提供基础设施的关键 要素(例如电力、水、天然气、污水处理服务)。 您的灾难恢复计划应包含联 系信息和故障排除程序,以便在灾难发生时应对这些服务的问题。 物流与物资 灾难恢复操作所涉及的后勤问题极为复杂。

您将突然面临将大量人员、设备和 物资转运至备用恢复站点的问题。 此外,人员可能需要在这些站点长期居住, 而灾难恢复团队将负责为他们提供食物、水、住所和适当的设施。 您的灾难恢 复计划

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:供应商也要被合同、审计、评估和持续监控管理起来。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

程序:程序是一步一步怎么做。

日志:日志记录系统和用户活动,用于监控、审计和调查。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第三方治理:外包不外包责任”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Step-by-step、SOP 常对应 procedure。

日志要保护完整性、时间同步和访问控制。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
程序 程序是一步一步怎么做。
日志 日志记录系统和用户活动,用于监控、审计和调查。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 49 / PDF P1265

第 1265 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

should contain provisions for this type of operation if it falls within the scope of your expected operational needs. Recovery vs. Restoration It is sometimes useful to separate disaster recovery tasks from disaster restoration tasks. This is especially true when a recovery effort is expected to take a significant amount of time. A disaster recovery team may be assigned to implement and maintain operations at the recovery site, and a salvage team is assigned to restore the primary site to operational capacity. Make these allocations according to the needs of your organization and the types of disasters you face. Recovery and restoration are separate concepts.

In this context, recovery involves bringing business operations and processes back to a working state. Restoration involves bringing a business facility and environment back to a workable state. The recovery team members have a very short time frame in which to operate. They must put the DRP into action and restore IT capabilities as swiftly as possible. If the recovery team fails to restore business processes within the MTD/RTO, then the company fails. Once the original site is deemed safe for people, the salvage team members begin their work. Their job is to restore the company to its full original capabilities and, if necessary, to the original location.

If the original location is no longer in existence, a new primary spot is selected. The salvage team must rebuild or repair the IT infrastructure. Since this activity is basically the same as building a new IT system, the return activity from the alternate/recovery site to the primary/original site is itself a risky activity. Fortunately, the salvage team has more time to work than the recovery team. The salvage team must ensure the reliability of the new IT infrastructure. This is done by returning the least mission-critical processes to the restored original site to stress-test the rebuilt network. As the restored site shows resiliency, more important processes are transferred.

A serious vulnerability exists when mission-critical processes are returned to the original site. The act of returning to the original site could cause a disaster of its own.

中文直译 / 整理

如果此类操作属于您预期的运营需求范围,则应包含相关安排。 恢复与重建 有时将灾难恢复任务与灾难重建任务区分开来是有益的。 当预计恢复工作需要 较长时间时,这一点尤其重要。 可以指派一个灾难恢复团队在恢复站点实施和 维持运营,同时指派一个抢修团队将主站点恢复至可运行状态。 请根据贵组织 的需求以及所面临的灾难类型进行这些分工。 恢复和重建是两个不同的概念。 在此语境中,恢复是指将业务运营和 流程恢复至可运行状态; 重建则是指将业务设施和环境恢复至可运作状态。 恢复团队成员的操作时间非常紧迫。 他们必须立即执行灾难恢复计划( DRP),并尽可能迅速地恢复IT能力。 如果恢复团队未能在MTD/RTO时 限内恢复业务流程,则公司将面临失败。 一旦原址被确认对人员安全,抢修团队便开始工作。 他们的任务是将公司恢复 至完全的原始能力,必要时还需恢复至原址。 如果原址已不复存在,则需选择 一个新的主站点。 抢修团队必须重建或修复IT基础设施。 由于此活动本质上与 构建新的IT系统相同,因此从备用/恢复站点返回主/原站点的过程本身也是一 项高风险活动。 幸运的是,抢修团队拥有比恢复团队更充裕的时间。

救援团队必须确保新的IT基础设施的可靠性。 这是通过将最不关键的业务流 程恢复到重建的原站点以压力测试重建的网络来实现的。 随着恢复站点展现出 韧性,更关键的流程将逐步转移。 当关键业务流程返回原站点时,存在严重漏 洞。 返回原站点的行为本身可能引发一场灾难。

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

恢复时间目标 RTO:RTO 是业务或系统最多能中断多久。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1265 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

RTO 是多久恢复,RPO 是能丢多少数据。

RTO 问时间:多久必须恢复。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
恢复时间目标 RTO RTO 是业务或系统最多能中断多久。
学习单元 50 / PDF P1266

第 1266 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

Therefore, the state of emergency cannot be declared over until full normal operations have returned to the restored original site. At the conclusion of any disaster recovery effort, the time will come to restore operations at the primary site and terminate any processing sites operating under the disaster recovery agreement. Your DRP should specify the criteria used to determine when it is appropriate to return to the primary site and guide the DRP recovery and salvage teams through an orderly transition. Training, Awareness, and Documentation As with a business continuity plan, it is essential that you provide training to all personnel who will be involved in the disaster recovery effort.

The level of training required will vary according to an individual's role in the effort and their position within the company. When designing a training plan, consider including the following elements: Orientation training for all new employees Initial training for employees taking on a new disaster recovery role for the first time Detailed refresher training for disaster recovery team members Brief awareness refreshers for all other employees (can be accomplished as part of other meetings and through a medium like email newsletters sent to all employees) Loose-leaf binders are an excellent way to store disaster recovery plans.

You can distribute single-page changes to the plan without destroying an entire forest! The disaster recovery plan should also be fully documented. Earlier in this chapter, we discussed several of the documentation options available to you. Be sure you implement the necessary documentation programs and modify the documentation as changes to the plan occur. Because of the rapidly changing nature of the disaster recovery and business continuity plans, you might consider publication on a secured portion of your organization's intranet.

中文直译 / 整理

因此,在所有正常业务完全恢复到重建的原站点之前,不得宣布紧急状态结束。 在任何灾难恢复工作结束后,将需要恢复主站点的运营,并终止根据灾难恢复 协议运行的任何处理站点。 您的灾难恢复计划应明确用于确定何时适合返回主 站点的标准,并指导灾难恢复和救援团队有序过渡。 培训、意识与文档 与业务连续性计划一样,向所有参与灾难恢复工作的人员提供培训至关重要。 所需的培训水平将根据个人在恢复工作中的角色及其在公司内的职位而有所不 同。 在设计培训计划时,请考虑包含以下内容: 面向所有新员工的入职培训 首次承担灾难恢复职责的员工的初始培训 针对灾难恢复团队成员的详细复习培训 为所有其他员工提供简短的意识更新(可通过与其他会议结合或通过发送 给所有员工的电子邮件简报等方式完成) 活页夹是存储灾难恢复计划的绝佳方式。 您可以在不破坏整片 森林的情况下,分发计划的单页更改! 灾难恢复计划也应被完整记录。 本章前面我们讨论了您可以使用的几种记录选 项。 请确保实施必要的文档程序,并在计划发生变化时及时修改文档。 由于灾 难恢复和业务连续性计划变化迅速,您可考虑将文档发布在组织内网的安全区 域。

小白解释

场景先行:员工在家访问公司系统,流量要穿过家庭网络、互联网、防火墙、VPN、服务器。网络安全题就是让你判断问题发生在哪一层、用哪个控制放在什么位置。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:不分层就会乱选设备:该加密的地方装防火墙,该监测的地方却只做访问控制。

你作为负责人可以这样想:先定位网络层次,再决定是分段、过滤、加密、检测还是阻断。

本页术语用人话说:

标准:标准给出必须满足的最低要求。

程序:程序是一步一步怎么做。

OSI 模型:OSI 用七层结构理解网络通信,从物理层到应用层。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

读完后用一句话复述:如果我是网络安全工程师,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1266 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是网络安全工程师在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Minimum level、mandatory requirement 常对应 standard。

Step-by-step、SOP 常对应 procedure。

网络题先定位层次,再判断协议、设备或攻击位置。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

本页术语拆解
标准 标准给出必须满足的最低要求。
程序 程序是一步一步怎么做。
OSI 模型 OSI 用七层结构理解网络通信,从物理层到应用层。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 51 / PDF P1267

可用性:需要时能用,且性能可接受

可用性关注中断、故障、DoS、备份和冗余。

教材原文段落

Your DRP should be treated as an extremely sensitive document and provided to individuals on a compartmentalized, need-to-know basis only. Individuals who participate in the plan should understand their roles fully, but they do not need to know or have access to the entire plan. Of course, it is essential to ensure that key DRP team members and senior management have access to the entire plan and understand the high-level implementation details. You certainly don't want this knowledge to rest in the mind of only one individual. Remember that a disaster may render your intranet unavailable.

If you choose to distribute your disaster recovery and business continuity plans through an intranet, be sure you maintain an adequate number of printed copies of the plan at both the primary and alternate sites and maintain only the most current copy! Testing and Maintenance Every disaster recovery plan must be tested on a periodic basis to ensure that the plan's provisions are viable and that it meets an organization's changing needs. The types of tests that you conduct will depend on the types of recovery facilities available to you, the culture of your organization, and the availability of disaster recovery team members.

The six main test types—readthroughs, tabletops, walk-throughs, simulation tests, parallel tests, and fullinterruption tests—are discussed in the remaining sections of this chapter. For more information on this topic, consult NIST SP 800-84 —Guide to Test, Training, and Exercise Programs for IT Plans and Capabilities, available at http://csrc.nist.gov/pubs/sp/800/84/final. Read-Through The read-through is one of the simplest tests to conduct, but it's also one of the most critical. In this test, you distribute copies of disaster recovery plans to the members of the disaster recovery team for review. This lets you accomplish three goals simultaneously:

中文直译 / 整理

您的DRP应被视为极其敏感的文件,仅限于根据职责需要、按最小权限原则提 供给相关人员。 参与计划的人员应充分了解自己的职责,但无需知晓或访问整 个计划。 当然,必须确保关键的DRP团队成员和高级管理层能够访问整个计划 并理解其高层级实施细节。 您绝对不希望这些知识仅存在于某一个人的脑海中。 请记住,灾难可能导致您的内部网络无法使用。 如果您选择通过内 部网络分发灾难恢复和业务连续性计划,请务必在主站点和备用站点均 保留足够数量的计划印刷副本,并仅保留最新版本! 测试与维护 每个灾难恢复计划都必须定期进行测试,以确保计划的条款切实可行,并能满 足组织不断变化的需求。 您所进行的测试类型将取决于您可用的恢复设施类型、 组织的文化以及灾难恢复团队成员的可用性。 本章后续部分将讨论六种主要的 测试类型——阅读审查、桌面推演、走查、模拟测试、并行测试和全面中断测试。 有关此主题的更多信息,请参阅NISTSP800-84——IT计划与能力的测试、 培训和演练计划指南,可从http://csrc.nist.gov/pubs/sp/800/84/final获取。 读取穿透 通过通读是最简单的测试之一,但也是最关键的测试之一。

在此测试中,您将 灾难恢复计划的副本分发给灾难恢复团队成员进行审阅。 这使您能够同时实现 三个目标:

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:可用性关注中断、故障、DoS、备份和冗余。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

可用性:可用性保证授权用户需要时能及时使用系统和数据。

NIST:NIST 提供美国常用安全标准、框架和指南。

指南:指南是建议做法,不一定强制。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“可用性:需要时能用,且性能可接受”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

冗余、备份、BCP/DRP、抗 DoS、容量规划都对应可用性。

看到 SP 800 系列、CSF、RMF 常联想到 NIST。

Recommended、not compulsory 常对应 guideline。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
可用性 可用性保证授权用户需要时能及时使用系统和数据。
NIST NIST 提供美国常用安全标准、框架和指南。
指南 指南是建议做法,不一定强制。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 52 / PDF P1268

政策、标准、程序、指南

高层原则、最低要求、操作步骤、建议做法要分清。

教材原文段落

It ensures that key personnel are aware of their responsibilities and have that knowledge refreshed periodically. It provides individuals with an opportunity to review the plans for obsolete information and update any items that require modification because of changes within the organization. In large organizations, it helps identify situations in which key personnel have left the company and nobody bothered to reassign their disaster recovery responsibilities. This is also a good reason why disaster recovery responsibilities should be included in job descriptions.

Tabletop During a tabletop, members of the disaster recovery team gather in a large conference room and role-play a disaster scenario. Usually, the exact scenario is known only to the test moderator, who presents the details to the team at the meeting. The team members then refer to their copies of the disaster recovery plan and discuss the appropriate responses to that particular type of disaster. Walk-Through Walk-throughs may vary in their scope and intent. Some exercises include taking physical actions or at least considering their impact on the exercise. For example, a walk-through might require that everyone leave the building and return home to participate in the exercise.

Simulation Test In simulation tests, disaster recovery team members are presented with a scenario and asked to develop an appropriate response. Unlike with the tests previously discussed, some of these response measures are then tested. This may involve the interruption of noncritical business activities and the use of some operational personnel. Parallel Test Parallel tests represent the next level in testing and involve relocating personnel to the alternate recovery site and implementing site activation procedures. The employees relocated to the site perform their disaster recovery responsibilities just as they would for an actual disaster. The only

中文直译 / 整理

它确保关键人员了解其职责,并定期巩固这一知识。 它为个人提供了审查过时信息计划的机会,并根据组织内部的变化更 新任何需要修改的项目。 在大型组织中,它有助于识别关键人员离职后无人重新分配其灾难恢复职 责的情况。 这也是为什么应将灾难恢复职责纳入职位描述的充分理由。 桌面演练 在桌面演练中,灾难恢复团队的成员聚集在大型会议室中,模拟灾难场景。 通 常,确切的场景仅由测试主持人知晓,主持人会在会议中向团队呈现详细情况。 团队成员随后查阅其手中的灾难恢复计划副本,讨论针对该类灾难的适当应对 措施。 步行演练 步行演练的范围和目的可能有所不同。 一些演练包括采取实际行动或至 少考虑其对演练的影响。 例如,一次步行演练可能要求所有人离开大楼并回 家参与演练。 模拟测试 在模拟测试中,灾难恢复团队成员会面临一个场景,并被要求制定相应的应对 措施。 与之前讨论的测试不同,这些应对措施中的一部分会被实际测试。 这可 能涉及中断非关键业务活动以及使用部分运营人员。 并行测试 并行测试代表了测试的下一阶段,涉及将人员转移到备用恢复站点并实施站 点激活程序。 被转移至站点的员工将像应对真实灾难一样履行其灾难恢复职 责。 仅

小白解释

场景先行:你是公司的安全负责人,正在读第 1268 页这一组概念。老板不会问你背定义,而是问:这件事会不会影响业务、谁负责、要不要花钱、出了事能不能解释清楚。

这一页真正想让你理解的是:高层原则、最低要求、操作步骤、建议做法要分清。

把它放进公司里看,关键不是背定义,而是判断:概念没放进业务场景,容易只背词,做题时不知道该选管理动作还是技术动作。

你作为负责人可以这样想:先确认业务目标和风险,再选控制措施,最后留下政策、审批、日志或证据。

本页术语用人话说:

程序:程序是一步一步怎么做。

常见误区:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

读完后用一句话复述:如果我是安全负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“政策、标准、程序、指南”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是安全负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Step-by-step、SOP 常对应 procedure。

排除法提醒:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

本页术语拆解
程序 程序是一步一步怎么做。
学习单元 53 / PDF P1269

安全控制框架:用成熟框架组织安全

框架帮助组织系统化管理控制,而不是想到哪做到哪。

教材原文段落

difference is that operations at the main facility are not interrupted. That site retains full responsibility for conducting the day-to-day business of the organization. Full-Interruption Test Full-interruption tests operate like parallel tests, but they involve actually shutting down operations at the primary site and shifting them to the recovery site. These tests involve a significant risk, since they require the operational shutdown of the primary site and transfer to the recovery site, followed by the reverse process to restore operations at the primary site. For this reason, full-interruption tests are extremely difficult to arrange, and you often encounter resistance from management.

Lessons Learned At the conclusion of any disaster recovery operation or other security incident, the organization should conduct a lessons learned session. The lessons learned process is designed to provide everyone involved with the incident response effort an opportunity to reflect on their individual roles in the incident and the team's response overall. It is an opportunity to improve the processes and technologies used in incident response to better respond to future security crises. The most common way to conduct lessons learned is to gather everyone in the same room, or connect them via videoconference or telephone, and ask a trained facilitator to lead a lessons learned session.

Ideally, this facilitator should have played no role in the incident response, leaving them with no preconceived notions about the response. The facilitator should be a neutral party who simply helps guide the conversation. Time is of the essence with the lessons learned session because, as time passes, details quickly become fuzzy and memories are lost. The more quickly you conduct a lessons learned session, the more likely it is that you will receive valuable feedback that can help guide future responses. In SP 800-61, NIST offers a series of questions to use in the lessons learned process. They include the following: Exactly what happened and at what times?

How well did staff and management perform in dealing with the incident?

中文直译 / 整理

不同之处在于,主设施的运营不会中断。 该站点仍全面负责组织的日常业务运 行。 完全中断测试 完全中断测试类似于并行测试,但它们涉及实际关闭主站点的运营并将操作转 移至恢复站点。 这些测试存在显著风险,因为它们要求关闭主站点的运营并转 移至恢复站点,随后再执行反向过程以恢复主站点的运营。 因此,完全中断测 试极难安排,您常常会遇到管理层的抵触。 经验教训 在任何灾难恢复操作或其他安全事件结束后,组织应召开一次经验教训会议。 经验教训流程旨在为所有参与事件响应的人员提供机会,反思他们在事件中的 个人角色以及团队的整体响应情况。 这是改进事件响应中所使用流程和技术的 好机会,以便在未来应对安全危机时表现得更好。 开展经验教训的最常见方式是将所有人聚集在同一房间,或通过视频会议或电 话连接,并请一位受过培训的引导者主持经验教训会议。 理想情况下,该引导 者不应参与过事件响应,从而避免对响应过程产生先入为主的观念。 引导者应 作为一个中立方,仅帮助引导讨论。 由于随着时间推移,细节会迅速变得模糊,记忆也会丢失,因此经验总结会议 刻不容缓。 越早开展经验总结会议,就越有可能获得宝贵的反馈,从而帮助指 导未来的应对措施。

在SP 800‑61中,NIST提供了一系列用于经验总结过程的问题。 其中包括以下内 容: 确切发生了什么? 发生在什么时间? 员工和管理层在处理该事件时表现如何?

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:框架帮助组织系统化管理控制,而不是想到哪做到哪。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

NIST:NIST 提供美国常用安全标准、框架和指南。

日志:日志记录系统和用户活动,用于监控、审计和调查。

事件响应:事件响应是发现、遏制、根除、恢复并复盘安全事件的过程。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“安全控制框架:用成熟框架组织安全”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

看到 SP 800 系列、CSF、RMF 常联想到 NIST。

日志要保护完整性、时间同步和访问控制。

准备、检测、遏制、根除、恢复、经验教训是常见顺序。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
NIST NIST 提供美国常用安全标准、框架和指南。
日志 日志记录系统和用户活动,用于监控、审计和调查。
事件响应 事件响应是发现、遏制、根除、恢复并复盘安全事件的过程。
学习单元 54 / PDF P1270

政策、标准、程序、指南

高层原则、最低要求、操作步骤、建议做法要分清。

教材原文段落

Were documented procedures followed? Were the procedures adequate? What information was needed sooner? Were any steps or actions taken that might have inhibited the recovery? What would the staff and management do differently the next time a similar incident occurs? How could information sharing with other organizations have been improved? What corrective actions can prevent similar incidents in the future? What precursors or indicators should be watched for in the future to detect similar incidents? What additional tools or resources are needed to detect, analyze, and mitigate future incidents?

The responses to these questions, if given honestly, will provide valuable insight into the state of the organization's incident response program. They can help provide a road map of future improvements designed to bolster disaster recovery. The facilitator should work with the team leader to document the lessons learned in a report that includes suggested process improvement actions. Maintenance Remember that a disaster recovery plan is a living document. As your organization's needs change, you must adapt the disaster recovery plan to meet those changed needs to follow suit. You will discover many necessary modifications by using a well-organized and coordinated testing plan.

Minor changes may often be made through a series of telephone conversations or emails, whereas major changes may require one or more meetings of the full disaster recovery team. A disaster recovery planner should refer to the organization's business continuity plan as a template for its recovery efforts. This and all the supportive material may need to comply with applicable regulations and reflect current business needs. Business processes such as payroll and order generation should contain specified metrics mapped to related IT systems and infrastructure.

中文直译 / 整理

是否遵循了既定程序? 程序是否充分? 哪些信息需要更早提供? 是否采取了任何可能阻碍恢复的步骤或行动? 下次发生类似事件时,员工和管理层会采取哪些不同的措施? 如何改进与其他组织的信息共享? 哪些纠正措施可以防止未来发生类似事件? 未来应关注哪些前兆或指标,以检测类似事件? 需要哪些额外的工具或资源来检测、分析和缓解未来的事件? 如果诚实地回答这些问题,将有助于深入了解组织事件响应计划的现状。 它 们可以为未来旨在加强灾难恢复的改进提供路线图。 引导者应与团队负责人 合作,将所学到的经验教训记录在一份报告中,其中应包括建议的流程改进 措施。 维护 请记住,灾难恢复计划是一个动态文档。 随着组织需求的变化,您必须调整灾 难恢复计划以适应这些变化。 通过实施一个组织良好且协调的测试计划,您将 发现许多必要的修改。 小改动通常可以通过一系列电话或电子邮件完成,而重 大改动则可能需要召开一次或多次完整的灾难恢复团队会议。 灾难恢复规划者应将组织的业务连续性计划作为其恢复工作的模板。 此计划 及所有支持材料可能需要符合适用的法规,并反映当前的业务需求。 诸如工 资发放和订单生成等业务流程应包含与相关IT系统和基础设施映射的指定指 标。

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:高层原则、最低要求、操作步骤、建议做法要分清。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

程序:程序是一步一步怎么做。

事件响应:事件响应是发现、遏制、根除、恢复并复盘安全事件的过程。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“政策、标准、程序、指南”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Step-by-step、SOP 常对应 procedure。

准备、检测、遏制、根除、恢复、经验教训是常见顺序。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
程序 程序是一步一步怎么做。
事件响应 事件响应是发现、遏制、根除、恢复并复盘安全事件的过程。
学习单元 55 / PDF P1271

政策、标准、程序、指南

高层原则、最低要求、操作步骤、建议做法要分清。

教材原文段落

Most organizations apply formal change management processes so that whenever the IT infrastructure changes, all relevant documentation is updated and checked to reflect such changes. Regularly scheduled fire drills and dry runs to ensure that all elements of the DRP are used properly to keep staff trained present a perfect opportunity to integrate changes into regular maintenance and change management procedures. Design, implement, and document changes each time you go through these processes and exercises. Know where everything is, and keep each element of the DRP working properly. In case of an emergency, use your recovery plan.

Finally, make sure the staff stays trained to keep their skills sharp—for existing support personnel—and use simulated exercises to bring new people up to speed quickly. Test Communications Before embarking on any test, it's essential to inform all stakeholders about what to expect. This includes giving them an idea of the scheduled timing, the potential impacts, and the overarching goals of the test. By doing so, you not only ensure that business operations continue smoothly, but you're also managing and setting accurate expectations. During the test, especially ones that might disrupt normal operations like full-interruption tests, giving regular updates becomes crucial.

Stakeholders need to be kept in the loop about the progress, any challenges faced, and any deviations from the expected end time. Such transparency not only keeps everyone informed but also helps in building trust. Post-test, a debriefing session provides an opportunity for discussing the outcomes of the test, highlighting both the successes and pinpointing areas that need improvement. It provides closure to the current test and paves the way for future enhancements. Many industries and regions have stringent regulations dictating the details of disaster recovery plan testing.

Keeping regulators informed is not just about compliance, but it also underscores the organization's commitment to resilience and good governance. Furthermore, maintaining comprehensive records and sharing them as required reinforces this commitment and keeps the regulatory relationship transparent. Summary

中文直译 / 整理

大多数组织采用正式的变更管理流程,以确保每当IT基础设施发生变化时,所 有相关文档都会更新并核对,以反映这些变更。 定期安排的消防演习和模拟演 练,可确保灾难恢复计划(DRP)的所有要素得到正确使用,从而保持员工的 培训水平,这为将变更整合到常规维护和变更管理流程中提供了绝佳机会。 每 次进行这些流程和演练时,都应设计、实施并记录变更。 清楚了解所有内容的 位置,并确保DRP的每个要素正常运行。 在紧急情况下,使用您的恢复计划。 最后,确保员工持续接受培训,以保持现有支持人员的技能熟练度,并通过模 拟演练快速提升新员工的能力。 测试通信 在开始任何测试之前,必须通知所有相关方预期的内容。 这包括让他们了解计 划的时间安排、潜在影响以及测试的总体目标。 这样做不仅能确保业务运营顺 利进行,还能有效管理并设定准确的预期。 在测试期间,尤其是可能干扰正常运营的全面中断测试,定期更新变得至关重 要。 需要让相关方及时了解进展、遇到的任何挑战以及与预期结束时间的任何 偏差。 这种透明度不仅能让所有人保持知情,还有助于建立信任。 测试后,复盘会议提供了一个讨论测试结果的机会,既突出成功之处,也明确 需要改进的领域。

它为当前测试画上句号,并为未来的改进铺平道路。 许多行业和地区都有严格的法规,规定了灾难恢复计划测试的细节。 及时向监 管机构通报情况不仅关乎合规,还体现了组织对韧性和良好治理的承诺。 此外, 保持完整的记录并按要求共享,将进一步强化这一承诺,并确保监管关系透明。 摘要

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:高层原则、最低要求、操作步骤、建议做法要分清。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

程序:程序是一步一步怎么做。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“政策、标准、程序、指南”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Step-by-step、SOP 常对应 procedure。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
程序 程序是一步一步怎么做。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 56 / PDF P1272

章末总结与练习题

章末内容用来反查自己是否真的理解,而不是只背答案。

教材原文段落

Disaster recovery planning is critical to a comprehensive information security program. DRPs serve as a valuable complement to business continuity plans and ensure that the proper technical controls are in place to keep the business functioning and to restore service after a disruption. In this chapter, you learned about the different types of natural and humanmade disasters that may impact your business. You also explored the types of recovery sites and backup strategies that bolster your recovery capabilities. An organization's disaster recovery plan is one of the most important documents under the purview of security professionals.

It should provide guidance to the personnel responsible for ensuring the continuity of operations in the face of disaster. The DRP provides an orderly sequence of events designed to activate alternate processing sites while simultaneously restoring the primary site to operational status. Once you've successfully developed your DRP, you must train personnel on its use, ensure that you maintain accurate documentation, and conduct periodic tests to keep the plan fresh in the minds of responders. Study Essentials Know the common types of natural disasters that may threaten an organization.

Natural disasters that commonly threaten organizations include earthquakes, floods, storms, fires, pandemics, tsunamis, and volcanic eruptions. Know the common types of human-made disasters that may threaten an organization. Explosions, electrical fires, terrorist acts, power outages, other utility failures, infrastructure failures, hardware/software failures, labor difficulties, theft, and vandalism are all common human-made disasters. Be familiar with the common types of recovery facilities. The common types of recovery facilities are cold sites, warm sites, hot sites, mobile sites, cloud computing, and multiple sites.

Be sure you understand the benefits and drawbacks of each such facility. Explain the potential benefits behind mutual assistance agreements as well as the reasons they are not commonly implemented in businesses today. Mutual assistance agreements (MAAs) provide an inexpensive alternative to disaster recovery sites, but they are not commonly used because they are difficult to enforce. Organizations participating in an

中文直译 / 整理

灾难恢复规划是全面信息安全计划的关键组成部分。 灾难恢复计划(DRP)作 为业务连续性计划的重要补充,确保具备适当的技控措施,以维持业务运转并 在中断后恢复服务。 在本章中,您了解了可能影响您业务的各种自然灾害和人为灾害。 您还探讨了 能够增强您恢复能力的恢复站点类型和备份策略。 组织的灾难恢复计划是安全专业人员职责范围内最重要的文档之一。 它应为负 责确保在灾难发生时业务持续运行的人员提供指导。 灾难恢复计划提供了一套 有序的事件序列,旨在激活备用处理站点,同时将主站点恢复至正常运行状态。 一旦您成功制定了灾难恢复计划,就必须对人员进行使用培训,确保维护准确 的文档,并定期进行测试,以使响应人员始终保持对计划的熟悉。 学习要点 了解可能威胁组织的常见自然灾害类型。 常见的威胁组织的自然灾害包括地震、 洪水、风暴、火灾、大流行、海啸和火山喷发。 了解可能威胁组织的常见人为灾害类型。 爆炸、电气火灾、恐怖行为、停电、 其他公用事业故障、基础设施故障、硬件/软件故障、劳资困难、盗窃和破坏 行为都是常见的人为灾害。 熟悉常见的恢复设施类型。 常见的恢复设施类型包括冷站点、温站点、热站点、 移动站点、云计算和多站点。

请务必了解每种设施的优缺点。 解释互助协议的潜在好处,以及它们为何在当今企业中不常被实施的原因。 互助 协议(MAAs)为灾难恢复站点提供了一种低成本的替代方案,但由于难以执行, 因此并不常见。 参与互助协议的组织

小白解释

场景先行:员工在家访问公司系统,流量要穿过家庭网络、互联网、防火墙、VPN、服务器。网络安全题就是让你判断问题发生在哪一层、用哪个控制放在什么位置。

这一页真正想让你理解的是:章末内容用来反查自己是否真的理解,而不是只背答案。

把它放进公司里看,关键不是背定义,而是判断:不分层就会乱选设备:该加密的地方装防火墙,该监测的地方却只做访问控制。

你作为负责人可以这样想:先定位网络层次,再决定是分段、过滤、加密、检测还是阻断。

本页术语用人话说:

OSI 模型:OSI 用七层结构理解网络通信,从物理层到应用层。

灾难恢复计划 DRP:DRP 关注 IT 系统、数据和基础设施如何恢复。

常见误区:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

读完后用一句话复述:如果我是网络安全工程师,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“章末总结与练习题”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是网络安全工程师在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

网络题先定位层次,再判断协议、设备或攻击位置。

RTO 是多久恢复,RPO 是能丢多少数据。

排除法提醒:不要以为防火墙能解决所有网络问题;它只是控制流量的一类工具。

本页术语拆解
OSI 模型 OSI 用七层结构理解网络通信,从物理层到应用层。
灾难恢复计划 DRP DRP 关注 IT 系统、数据和基础设施如何恢复。
学习单元 57 / PDF P1273

机密性:让该看的人看,不该看的人看不到

机密性重点是防泄露,同时不能妨碍授权访问。

教材原文段落

MAA may also be shut down by the same disaster, and MAAs raise confidentiality concerns. Understand the technologies that may assist with database backup. Databases benefit from three backup technologies. Electronic vaulting is used to transfer database backups to a remote site as part of a bulk transfer. In remote journaling, data transfers occur on a more frequent basis. With remote mirroring technology, database transactions are mirrored at the backup site in real time. Explain the common processes used in disaster recovery programs.

These programs should take a comprehensive approach to planning and include considerations related to the initial response effort, personnel involved, communication among the team members and with internal and external entities, assessment of response efforts, and restoration of services. DR programs should also include training and awareness efforts to ensure personnel understand their responsibilities and lessons learned sessions to continuously improve the program. Know the six types of disaster recovery plan tests and the impact each has on normal business operations.

The six types of disaster recovery plan tests are read-throughs, tabletops, walk-throughs, simulation tests, parallel tests, and full-interruption tests. Read-throughs are purely paperwork exercises, whereas tabletops and walk-throughs involve project team meetings. They have no impact on business operations. Simulation tests may shut down noncritical business units. Parallel tests involve relocating personnel but do not affect day-to-day operations. Full-interruption tests involve shutting down primary systems and shifting responsibility to the recovery facility. Written Lab 1. What are some of the main concerns businesses have when considering adopting a mutual assistance agreement? 2.

List and explain the six types of disaster recovery tests. 3. Explain the differences between the three types of backup strategies discussed in this chapter. 4. Describe how cloud computing influences disaster recovery programs.

中文直译 / 整理

也可能因同一灾难而停摆,且互助协议会引发机密性方面的担忧。 了解可能有助于数据库备份的技术。 数据库受益于三种备份技术。 电子 Vaulting 用于作为批量传输的一部分,将数据库备份传输到远程站点。 在远程 日志记录中,数据传输更为频繁。 使用远程镜像技术,数据库事务会实时在备份 站点进行镜像。 解释灾难恢复中常用的过程 程序。 这些程序应采取全面的规划方法,包括对初始响应工作、相关人员、团队 成员之间以及与内外部实体的沟通、响应评估和恢复服务的考虑。 灾难恢复程序 还应包括培训和意识提升工作,以确保人员了解其职责,并开展经验总结会议, 以持续改进该程序。 了解六种灾难恢复计划测试类型及其对正常业务运营的影响。 六种灾难恢复计划 测试类型包括阅读检查、桌面推演、步行演练、模拟测试、并行测试和完全中断 测试。 阅读检查纯粹是文书工作,而桌面推演和步行演练涉及项目团队会议,它 们对业务运营没有影响。 模拟测试可能会关闭非关键业务单元。 并行测试涉及人 员调动,但不影响日常运营。 完全中断测试涉及关闭主系统并将责任转移至恢复 设施。 书面实验 1. 企业在考虑采用互助协议时,主要关注哪些问题?

2. 列出并解释六种灾难恢复测试类型。 3. 解释本章讨论的三种备份策略之间的差异。 4. 描述云计算如何影响灾难恢复计划。

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:机密性重点是防泄露,同时不能妨碍授权访问。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

机密性:机密性让该看的人能看,不该看的人看不到。

程序:程序是一步一步怎么做。

日志:日志记录系统和用户活动,用于监控、审计和调查。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“机密性:让该看的人看,不该看的人看不到”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

加密、访问控制、分类、培训都常用于保护机密性。

Step-by-step、SOP 常对应 procedure。

日志要保护完整性、时间同步和访问控制。

遇到章末题时,不要只看选项。先判断题干在问定义、责任归属、最佳下一步,还是控制措施选择。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
机密性 机密性让该看的人能看,不该看的人看不到。
程序 程序是一步一步怎么做。
日志 日志记录系统和用户活动,用于监控、审计和调查。
学习单元 58 / PDF P1274

章末总结与练习题

章末内容用来反查自己是否真的理解,而不是只背答案。

教材原文段落

Review Questions 1. James is working with his organization's leadership to help them understand the role that disaster recovery plays in their cybersecurity strategy. The leaders are confused about the differences between disaster recovery and business continuity. What is the end goal of disaster recovery planning? A. Preventing business interruption B. Setting up temporary business operations C. Restoring normal business activity D. Minimizing the impact of a disaster 2. Kevin is attempting to determine an appropriate backup frequency for his organization's database server and wants to ensure that any data loss is within the organization's risk appetite.

Which one of the following security process metrics would best assist him with this task? A. RTO B. MTD C. RPO D. MTBF 3. Brian's organization recently suffered a disaster and wants to improve their disaster recovery program based upon their experience. Which one of the following activities will best assist with this task? A. Training programs B. Awareness efforts C. BIA review D. Lessons learned 4. Adam is reviewing the fault tolerance controls used by his organization and realizes that they currently have a single point of failure in the disks used to support a critical server. Which one of the following controls can provide fault tolerance for these disks? A. Load balancing B. RAID

中文直译 / 整理

复习问题 1. 詹姆斯正在与组织的领导层合作,帮助他们理解灾难恢复在网络安全策略 中的作用。 领导层对灾难恢复和业务连续性之间的区别感到困惑。 灾难恢复 的最终目标是什么 恢复计划? A. 防止业务中断 B. 建立临时业务运营 C. 恢复正常的业务活动 D. 最小化灾难的影响 2. 凯文正在尝试确定其组织数据库服务器的适当备份频率,并希望确保任何 数据丢失都在组织的风险承受范围内。 以下哪一项安全流程指标最能帮助他 完成此任务? A. RTO B. MTD C. RPO D. MTBF 3. 布赖恩的组织最近遭遇了一次灾难,希望根据其经验改进其灾难恢复计划。 以下哪项活动最能帮助完成此任务? A. 培训计划 B. 意识提升工作 C. BIA 审查 D. 经验教训 4. 亚当正在审查其组织使用的容错控制措施,并意识到当前用于支持关键服 务器的磁盘存在单点故障。 以下哪一项控制措施可以为这些磁盘提供容错能 力? A. 负载均衡 B. RAID

小白解释

场景先行:机房断电,业务部门问多久能恢复、最多会丢多少数据。BCP/DRP 不是背缩写,而是把业务能承受的中断时间和数据损失说清楚。

这一页真正想让你理解的是:章末内容用来反查自己是否真的理解,而不是只背答案。

把它放进公司里看,关键不是背定义,而是判断:只做备份但没测试,真正灾难时可能恢复不了。

你作为负责人可以这样想:先做业务影响分析,再定 RTO/RPO,最后设计备份、冗余和演练。

本页术语用人话说:

恢复时间目标 RTO:RTO 是业务或系统最多能中断多久。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:RTO 问时间,RPO 问数据;这两个不要混。

读完后用一句话复述:如果我是业务连续性负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“章末总结与练习题”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务连续性负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

RTO 问时间:多久必须恢复。

RPO 问数据:最多丢到哪个时间点。

遇到章末题时,不要只看选项。先判断题干在问定义、责任归属、最佳下一步,还是控制措施选择。

排除法提醒:RTO 问时间,RPO 问数据;这两个不要混。

本页术语拆解
恢复时间目标 RTO RTO 是业务或系统最多能中断多久。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 59 / PDF P1275

可用性:需要时能用,且性能可接受

可用性关注中断、故障、DoS、备份和冗余。

教材原文段落

C. Clustering D. High availability (HA) pairs 5. Brad is helping to design a disaster recovery strategy for his organization and is analyzing possible storage locations for backup data. He is not certain where the organization will recover operations in the event of a disaster and would like to choose an option that allows them the flexibility to easily retrieve data from any DR site. Which one of the following storage locations provides the best option for Brad? A. Primary data center B. Field office C. Cloud computing D. IT manager's home 6. Which of the following statements about business continuity planning and disaster recovery planning are correct? (Choose all that apply.) A.

Business continuity planning is focused on keeping business functions uninterrupted when a disaster strikes. B. Organizations can choose whether to develop business continuity planning or disaster recovery planning plans. C. Business continuity planning picks up where disaster recovery planning leaves off. D. Disaster recovery planning guides an organization through recovery of normal operations at the primary facility. 7. Tonya is reviewing the flood risk to her organization and learns that their primary data center resides within a 100-year floodplain. What conclusion can she draw from this information? A. The last flood of any kind to hit the area was more than 100 years ago. B.

The odds of a flood at this level are 1 in 100 in any given year. C. The area is expected to be safe from flooding for at least 100 years. D. The last significant flood to hit the area was more than 100 years ago. C.

中文直译 / 整理

聚类 D. 高可用性(HA)对 5. 布拉德正在帮助其组织设计灾难恢复策略,并分析备份数据的可能存储位 置。 他不确定在发生灾难时组织将在何处恢复运营,因此希望选择一种允许 他们从任何灾难恢复站点轻松检索数据的选项。 以下哪个存储位置为布拉德 提供了最佳选择? A. 主数据中心 B. 分支办公室 C. 云计算 D. IT经理的家 6. 以下关于业务连续性规划和灾难恢复规划的陈述,哪些是正确的? (可多选。 ) A. 业务连续性规划旨在灾难发生时保持业务功能不间断。 B. 组织可以选择是否制定业务连续性规划或灾难恢复规划。 C. 业务连续性规划在灾难恢复规划结束后接续进行。 D. 灾难恢复规划指导组织在主设施恢复正常的运营。 7. 托尼娅正在审查其组织面临的洪水风险,并了解到其主要数据中心位于百 年一遇的洪泛区内。 她能从这一信息中得出什么结论? A. 该地区上一次发生任何类型的洪水是在100多年前。 B. 任意一年发生此级别洪水的概率为100分之一。 C. 预计该地区在未来至少100年内不会发生洪水。 D. 该地区上一次发生重大洪水是在100多年前。

小白解释

场景先行:想象公司有一个客户订单系统:客户资料被别人看到是机密性问题,订单金额被偷偷改是完整性问题,系统打不开是可用性问题。教材这一页就是教你把事故先翻译成安全目标。

这一页真正想让你理解的是:可用性关注中断、故障、DoS、备份和冗余。

把它放进公司里看,关键不是背定义,而是判断:把泄露、篡改、宕机混在一起,就会选错控制措施。

你作为负责人可以这样想:先判断事故破坏了 CIA 哪一项,再选择对应控制:防泄露、防篡改、保可用。

本页术语用人话说:

可用性:可用性保证授权用户需要时能及时使用系统和数据。

常见误区:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

读完后用一句话复述:如果我是业务系统负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“可用性:需要时能用,且性能可接受”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是业务系统负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

冗余、备份、BCP/DRP、抗 DoS、容量规划都对应可用性。

遇到章末题时,不要只看选项。先判断题干在问定义、责任归属、最佳下一步,还是控制措施选择。

排除法提醒:不要把所有安全问题都归成“被黑了”。考试会逼你分清到底是泄露、篡改还是中断。

本页术语拆解
可用性 可用性保证授权用户需要时能及时使用系统和数据。
学习单元 60 / PDF P1276

第 1276 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

8. Randi is designing a disaster recovery mechanism for her organization's critical business databases. She selects a strategy where an exact, up-todate copy of the database is maintained at an alternative location. What term describes this approach? A. Transaction logging B. Remote journaling C. Electronic vaulting D. Remote mirroring 9. Bryn runs a corporate website and currently uses a single server, which is capable of handling the site's entire load. She is concerned, however, that an outage on that server could cause the organization to exceed its RTO. What action could she take that would best protect against this risk? A. Install dual power supplies in the server. B.

Replace the server's hard drives with RAID arrays. C. Deploy multiple servers behind a load balancer. D. Perform regular backups of the server. 10. Carl recently completed his organization's annual business continuity plan refresh and is now turning his attention to the disaster recovery plan. What output from the business continuity plan can he use to prepare the business unit prioritization task of disaster recovery planning? A. Vulnerability analysis B. Business impact analysis C. Risk management D. Continuity planning 11. Nolan is considering the use of several different types of alternate processing facility for his organization's data center.

Which one of the following alternative processing sites takes the longest time to activate but has the lowest cost to implement? A. Hot site B. Mobile site C. Cold site 8.

中文直译 / 整理

兰迪正在为其组织的关键业务数据库设计灾难恢复机制。 她选择了一种 策略,即在备用位置维护数据库的精确、最新副本。 这种做法的术语是什么? A. 事务日志记录 B. 远程日记记录 C. 电子存档 D. 远程镜像 9. Bryn 运营一个企业网站,目前使用一台服务器,该服务器能够处理网站 的全部负载。 然而,她担心该服务器发生故障会导致组织超出其 RTO。 她可 以采取什么措施来最好地防范此风险? A. 在服务器中安装双电源。 B. 使用RAID阵列替换服务器的硬盘。 C. 在负载均衡器后部署多台服务器。 D. 定期备份服务器。 10. 卡尔最近完成了其组织的年度业务连续性计划更新,现在正将注意力 转向灾难恢复计划。 他可以使用业务连续性计划中的哪些输出来准备灾难 恢复规划中的业务单元优先级任务? A. 漏洞分析 B. 业务影响分析 C. 风险管理 D. 连续性规划 11. 纳兰正在为组织的数据中心考虑使用几种不同类型的备用处理设施。 以 下哪种备用处理站点激活时间最长但实施成本最低? A. 热站点 B. 移动站点 C. 冷站点

小白解释

场景先行:凌晨监控告警:某台服务器开始大量外连。你不能先忙着写报告,也不能直接关全网。事件响应要按顺序做:确认、遏制、根除、恢复、复盘。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:步骤乱了会扩大损失,或者破坏证据。

你作为负责人可以这样想:先保全证据和控制影响,再清除原因并恢复业务。

本页术语用人话说:

日志:日志记录系统和用户活动,用于监控、审计和调查。

恢复时间目标 RTO:RTO 是业务或系统最多能中断多久。

恢复点目标 RPO:RPO 是最多能接受丢失多少时间范围的数据。

常见误区:不要一上来就删除文件或重装系统;可能会破坏调查证据。

读完后用一句话复述:如果我是事件响应负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1276 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是事件响应负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

日志要保护完整性、时间同步和访问控制。

RTO 问时间:多久必须恢复。

RPO 问数据:最多丢到哪个时间点。

排除法提醒:不要一上来就删除文件或重装系统;可能会破坏调查证据。

本页术语拆解
日志 日志记录系统和用户活动,用于监控、审计和调查。
恢复时间目标 RTO RTO 是业务或系统最多能中断多久。
恢复点目标 RPO RPO 是最多能接受丢失多少时间范围的数据。
学习单元 61 / PDF P1277

章末总结与练习题

章末内容用来反查自己是否真的理解,而不是只背答案。

教材原文段落

D. Warm site 12. Ingrid is concerned that one of her organization's data centers has been experiencing a series of momentary power outages. Which one of the following controls would best preserve their operating status? A. Generator B. Dual-power supplies C. UPS D. Redundant network links 13. Which one of the following items is a characteristic of hot sites but not a characteristic of warm sites? A. Communications circuits B. Workstations C. Servers D. Current data 14. Harry is conducting a disaster recovery test. He moved a group of personnel to the alternate recovery site where they are mimicking the operations of the primary site but do not have operational responsibility.

What type of disaster recovery test is he performing? A. Read-through B. Walk-through C. Simulation test D. Parallel test 15. What type of document will help public relations specialists and other individuals who need a high-level summary of disaster recovery efforts while they are underway? A. Executive summary B. Technical guides C. Department-specific plans D. Checklists D.

中文直译 / 整理

温备站点 12. 英格丽担心她组织的一个数据中心最近经历了一系列短暂的断电。 以下 哪种控制措施最能维持其运行状态? A. 发电机 B. 双电源 C. 不间断 电源 D. 冗余网络链路 13. 以下哪一项是热备站点的特征,但不是温备站点的特征? A. 通信电路 B. 工作站 C. 服务器 D. 当前数据 14. 哈里正在执行灾难恢复测试。 他将一组人员转移到备用恢复站点,他们正 在模拟主站点的操作,但不承担运营责任。 他正在执行哪种类型的灾难恢复 测试? A. 读取演练 B. 实地演练 C. 模拟测试 D. 并行测试 15. 哪种类型的文档有助于公关专家和其他 人员在灾难恢复进行期间获得高层概要? A. 执行摘要 B. 技术指南 C. 部门特定计划 D. 检查清单

小白解释

场景先行:你是公司的安全负责人,正在读第 1277 页这一组概念。老板不会问你背定义,而是问:这件事会不会影响业务、谁负责、要不要花钱、出了事能不能解释清楚。

这一页真正想让你理解的是:章末内容用来反查自己是否真的理解,而不是只背答案。

把它放进公司里看,关键不是背定义,而是判断:概念没放进业务场景,容易只背词,做题时不知道该选管理动作还是技术动作。

你作为负责人可以这样想:先确认业务目标和风险,再选控制措施,最后留下政策、审批、日志或证据。

本页术语用人话说:

指南:指南是建议做法,不一定强制。

常见误区:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

读完后用一句话复述:如果我是安全负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“章末总结与练习题”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是安全负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

Recommended、not compulsory 常对应 guideline。

排除法提醒:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

本页术语拆解
指南 指南是建议做法,不一定强制。
学习单元 62 / PDF P1278

第 1278 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

16. What disaster recovery planning tool can be used to protect an organization against the failure of a critical software firm to provide appropriate support for their products? A. Differential backups B. Business impact assessment C. Incremental backups D. Software escrow agreement 17. What type of backup involves always storing copies of all files modified since the most recent full backup? A. Differential backups B. Partial backup C. Incremental backups D. Database backup 18. You operate a grain processing business and are developing your restoration priorities. Which one of the following systems would likely be your highest priority? A. Order-processing system B.

Fire suppression system C. Payroll system D. Website 19. What combination of backup strategies provides the fastest backup restoration time? A. Full backups and differential backups B. Partial backups and incremental backups C. Full backups and incremental backups D. Incremental backups and differential backups 20. What type of disaster recovery plan test fully evaluates operations at the backup facility but does not shift primary operations responsibility from the main site? A. Walk-through 16.

中文直译 / 整理

哪种灾难恢复规划工具可用于保护组织免受关键软件公司无法为其产 品提供适当支持的影响? A. 差异备份 B. 业务影响评估 C. 增量备份 D. 软件托管协议 17. 哪种类型的备份始终存储自最近一次完整备份以来所有已修改文件的副本? A. 差异备份 B. 部分备份 C. 增量备份 D. 数据库备份 18. 您经营一家粮食加工业务,正在制定恢复优先级。 以下哪个系统最可能 是您的最高优先级? A. 订单处理系统 B. 火灾抑制系统 C. 工资系统 D. 网站 19. 哪种备份策略组合能提供最快的备份恢复时间? A. 完全备份和差异备份 B. 部分备份和增量备份 C. 完整备份和增量备份 D. 增量备份和差异备份 20. 何种灾难恢复计划测试能够全面评估备用设施的运行情况,但不会将主要 操作责任从主站点转移? A. 走查

小白解释

场景先行:你是公司的安全负责人,正在读第 1278 页这一组概念。老板不会问你背定义,而是问:这件事会不会影响业务、谁负责、要不要花钱、出了事能不能解释清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:概念没放进业务场景,容易只背词,做题时不知道该选管理动作还是技术动作。

你作为负责人可以这样想:先确认业务目标和风险,再选控制措施,最后留下政策、审批、日志或证据。

如果这一页没有明显术语,就按“谁在做事、保护什么、怕什么、用什么控制、留下什么证据”来拆。

常见误区:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

读完后用一句话复述:如果我是安全负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1278 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是安全负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

排除法提醒:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

本页术语拆解

本页没有识别到重点术语,按原文顺序理解即可。

学习单元 63 / PDF P1279

第 1279 页学习单元

这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

教材原文段落

B. Parallel test C. Full-interruption test D. Simulation test B.

中文直译 / 整理

并行测试 C. 全中断测试 D. 模拟测试

小白解释

场景先行:你是公司的安全负责人,正在读第 1279 页这一组概念。老板不会问你背定义,而是问:这件事会不会影响业务、谁负责、要不要花钱、出了事能不能解释清楚。

这一页真正想让你理解的是:这一页属于本章连续内容,先读原文和译文,再看下方把概念拆成小白能理解的版本。

把它放进公司里看,关键不是背定义,而是判断:概念没放进业务场景,容易只背词,做题时不知道该选管理动作还是技术动作。

你作为负责人可以这样想:先确认业务目标和风险,再选控制措施,最后留下政策、审批、日志或证据。

如果这一页没有明显术语,就按“谁在做事、保护什么、怕什么、用什么控制、留下什么证据”来拆。

常见误区:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

读完后用一句话复述:如果我是安全负责人,我会先识别风险,再选择控制,并保留能证明判断合理的证据。

考点提醒

考题会把“第 1279 页学习单元”包装成一个业务场景:有人要上线系统、处理事故、审供应商、分配权限或选择控制。

先抓题干里的角色和目标:这里更像是安全负责人在做判断。

最佳答案通常不是“最强工具”,而是能降低风险、符合职责、成本合理、还能留下证据的动作。

排除法提醒:不要一看到安全题就直接选最强工具;CISSP 更常考“在这个场景下谁该负责、下一步是什么”。

本页术语拆解

本页没有识别到重点术语,按原文顺序理解即可。