实战大型运维环境安全加固 3
八、全面展开通过前一阶段的工作,基本可以到达如下效果:
1)业务部门领导到技术层对于整个加固的稳定性有了初步认可。
2)参与配合的实际运维人员对于操作方法、流程和人员有了熟悉和操作经验。
3)加固项目在加固内容上可能存在的问题和不兼容基本被消化。
4)加固项目组内技术人员得到锻炼,能应付一般突发情况,并对各个部门的业务结构、人员组成结构相当的认识和了解。
此阶段主要矛盾也有对于加固内容的稳定性的担心,逐渐转化为对工程操作方法不了解,以及担心在后续工作中可能碰到未知问题,所造成的不安。
因此该阶段的重点为:
1)同运维部门Leader和骨干共同回顾前期的项目进度和成果。
2)同运维部门骨干和部门领导确认回退方案,认可回退方案的可靠性和可行性。
举例:
当加固后,运维中出现故障,是否为安全加固导致,往往会带来很多争论和工作量,尤其是如果因为此类故障,导致对加固稳定性的质疑,将直接影响整个工程的进度。如果能够双方认可回退方案,一旦出现问题,运维部门执行回退后,即可迅速定位是否是“加固造成的影响”,便于双方进行排障。
*同运维部门就项目中的人员分工、操作内容、时间等进行落实,并进行备忘。
*对新装主机加固纳入装机流程,保证后续上架主机全部闭合为“加固主机”。
*对相关运维技术人员进行培训,重点在于回退技术的反复演练。并让运维部门领导了解到此技术,在部门内进行强化。
*向运维技术人员表明态度,并做出行动,加固相关支持的将以持续性的姿态进行,不会在加固完结后终止。
*组织“实战演练”,通过搭建模拟环境,让一线人员有机会操作实际工具,增加其操作和动手能力。
九、重点关注
因为此阶段将会完成整个实施过程的95%以上的加固工作,因此在部署时的技巧十分重要,部署实的几个大原则为:
1)阶梯式部署,部署之初应该采取逐步递增的方式,如分5个阶段,在3个月内部署3000台主机,可以采取如下步骤1%-9%-10%-30%-50%。
2)选取角色考虑,在部署时应充分利用业务的冗余特性,尽量避免按照业务角色分类、分组,在一次部署时,选取单一角色的主机进行部署。如果部署时出现故障,那么整个业务都将受到影响,对用户提供的服务不得不中断。
因此不应该以业务系统为单位进行部署,而应该纵向切片进行部署,这样如果出现故障,即便部分节点不可用,但是由于同一角色服务器被分批次部署,提供了冗余,服务提供商依然可以为用户提供持续服务。
1)每完成一个阶段,如50%,80%应该时时输出加固阶段性报告,对具体实施人员和相关部门Leader进行通告和知会。
2)此阶段应该注意收集加固效果体现的案例,作为阶段性报告输出和结项报告素材。
十、项目收尾完结
项目进入到此阶段,大部分主机完成加固,主要矛盾基本消失,主要工作集中在:
1)主要是对剩余主机做好加固收尾工作,不残留未加固主机,如果有特殊情况,需要进行文档备案。
2)整理项目资料,文档、代码等进行封闭,不再进行改动,保存归档并进行备份。
3)酬谢相关配合领导和技术人员。
4)发出结项报告,对于整个项目进行回顾,总结案例、加固成效和问题。
5)作为持续性安全工程,提出下一阶段的构想蓝图。
页:
[1]