知识库管理员(知识库管理员考核)居然可以这样
本文以数据中心为研究对象,旨在通过分析数据中心基础设施运维管理的通用需求,结合现有办公管理平台,建设一套数据中心基础设施运维管理系统,研究利用技术手段提升管理精细化水平和工作效率,保障数据中心基础设施及其承载的业务系统高效、安全及稳定运行
感谢大家一直以来的关注和支持,以下内容为回顾链接,直接点击内容标题即可直接查看往期链接: 资料福利篇:免费领取数据中心基础设施运维资料模块化数据中心机房技术连载汇编数据中心相关标准及规范汇编0315(附下载方法)。
数据中心建设流程与建设标准(附下载方法)某数据中心机房项目验收检查表(完整版)数据中心主机房的加湿量和除湿量如何计算数据中心机房工程运维管理制度要求解决方案,内附完整表格数据中心基础设施工程验收检查表-Excel电子表格
《数据中心基础设施运维工程师培训教材》免费领取…… 运维篇:数据中心基础设施运维之故障处理数据中心基础设施运维之事件级别定义及说明数据中心基础设施运维之空调系统(上)数据中心基础设施运维之空调系统(中)
数据中心基础设施运维之空调系统(下)数据中心基础设施运行维护——术语篇数据中心基础设施运行维护——任务界面篇数据中心基础设施运维——制度篇数据中心基础设施运维——备品备件、工具管理数据中心基础设施运维——技术资料管理
数据中心基础设施运维——代维管理数据中心基础设施运维——供配电系统维护…… 应急流程篇:UPS故障应急响应流程图列头柜故障应急处理流程图发电机故障应急处理流程图UPS故障应急响应流程图市电闪断应急处理流程图
双路市电中断应急处理流程图空调故障应急处理流程图…… 技术分析讨论篇:某数据中心供电系统切换逻辑分析(上)某数据中心供电系统切换逻辑分析(下)关于数据中心UPS输出端重复接地的探讨UPS电池的" 三防、一及时 ”
数据中心阀控铅酸蓄电池漏液危害及预防措施数据中心暖通系统检测中案例浅析数据中心蓄电池室通风换气量多大合适?是否必须设置事故排风?如何做好基础设施运维的安全防范和检查工作数据中心USP供电系统的运维管理探析
……1 建设背景 《“十四五”国家信息化规划》指出我国已进入加快数字发展、建设数字中国的新阶段,将启动全国一体化大数据中心体系建设工程,优化数据中心分类分级建设布局,实现集约化、规模化和绿色化发展。
同时,数据中心已被纳入“新基建”的重要组成内容,是未来云计算、大数据、人工智能、物联网、5G 等新兴信息技术发展的基础底座 数据中心基础设施主要包含供配电系统、空气调节系统、安全防范系统、消防设施系统、动力和环境监控系统、综合布线系统、服务器计算设施、网络安全设施、机柜设施、数据存储设施等。
这些基础设施具有专业性强、种类多和故障事件影响大等特点,运维管理存在依赖人工记录、工作效率低、信息化水平不高的问题因此,有必要建设一套数据中心基础设施运维管理系统,实现运维管理的电子化、规范化、精细化,便于运维信息共享与统计分析,提高运维管理工作效率,为数据中心内业务系统正常稳定运行提供坚实的基础保障。
2 建设需求 数据中心基础设施运维管理需要按照本单位制定的数据中心基础设施运行维护规范做好日常运维管理工作,及时发现并处置应急事件,定期开展风险排查和处置工作,做好日常统计、知识库归集和日常管理审批工作。
总体业务框架如图 1 所示
2.1 我的首页 我的首页主要包括我的待办、已办、委托、流程等常用功能模块待办模块主要用于显示流程已经到达本节点,需要进行处理的工作内容已办模块主要用于查看用户已经办理的工作内容委托模块主要用于将工作给其他人员办理。
流程模块主要用于查看用户处理的流程详情2.2 日常运维管理 数据中心日常运维工作可以分为巡检、维保、维修、设备管理、运维人员管理、服务商管理在日常运维工作中,根据本单位制定的数据中心基础设施运行维护规范要求,编制具体工作表格,运维人员按照制式表格开展日常工作,加入PDCA质量管理思想,在开展巡检、维保、维修工作的同时,实现对设备相关信息记录入库、对人员和服务商信息考核评价,并形成知识库。
把工作内容与设备、运维人员、服务商有机联系在一起2.2.1 巡检管理 巡检管理通过预留接口与巡更设施相连,获取巡更数据,并对其数据进行分析,来了解巡检人员是否按时按路线巡检,并将巡检结果导入数据库保存、分析、处理,同时具备手工导入巡检数据功能。
每日生成基础设施巡检报告,对运维人员巡检工作进行考核,考核数据进入运维人员考核数据库实现获取巡更数据、查看巡检记录、查看巡检报告的功能2.2.2 维保管理 维保管理是通过制定维保计划,执行时细化到运维人员和设备,完成后进行设备维保数据录入、服务商评价考核、运维人员评价考核。
设备维保后的信息数据进入设备数据库,考核数据进入运维人员和服务商数据库实现制定维保计划、查询维保计划、查询维保内容、登记维保工作结果、考核评价运维人员与服务商的功能2.2.3 维修管理 维修管理实现针对基础设施系统和设备进行维修管理、服务商考核、运维人员考核。
设备维修后信息数据进入设备数据库,考核数据进入运维人员和服务商数据库实现制定维修计划、查询维修计划、登记维修工作内容、考核评价运维人员与服务商等功能2.2.4 设备管理 设备管理实现数据中心设备增加与删除、设备信息登记、设备信息浏览,获取巡检、维保、维修工作中设备信息数据并进入设备数据库。
可以实现设备备品备件数据管理,具有备品数据统计、出入库登记、数量不足时智能提醒,智能预测需要备品数量的功能,具备导出设备信息的功能2.2.5 人员管理 人员管理实现运维人员信息登记、人员量化考核(汇总工作中的考核数据和综合评价考核数据),人员培训记录管理,值班安排管理,假期与加班管理,人员离职登记、导出人员联系方式等功能。
2.2.6 服务商管理 服务商管理实现服务商信息管理、服务商考核管理、服务商考评信息浏览、服务商考评报告生成等功能,用于服务商合同付款考核 2.3 风险与应急管理2.3.1 风险管理 风险管理是通过开展定期和专项风险排查工作,及时早发现数据中心基础设施风险隐患,对于发现的风险按照其可能产生影响和紧急程度进行管控。
做到有记录、有对策、有预案,实现风险发现、登记、处置、关闭等全流程管理将所有风险按类归纳整理,及时总结应对措施,形成风险管理知识库实现制定风险排查计划、登记风险点(涉及到设备的应与设备数据库相关联)、风险解决对策与预案制定、风险总结分析等功能。
2.3.2 应急管理 应急管理是根据本单位建立的应急管理机制,将这些机制的工作流程、计划、内容电子化没有应急事件发生时,针对特定情况制定应急预案,形成各系统应急预案列表供便捷查询应急预案需要每名运维人员十分熟悉,定期考核应急知识和预案内容,开展应急演练总结,形成应急管理知识库。
实现应急处置记录、应急预案制定、应急演练计划制定与总结,具备应急知识考试题库、考试评分功能并进入运维人员数据库、导出应急考试成绩2.4 统计与知识库管理2.4.1 数据统计 数据统计是对日常工作、设备、运维人员、服务商、能源资源消费的相关指标项进行数据归纳统计,定期生成报表,并可以实现导出报表、调整统计项目等功能。
2.4.2 知识库管理 知识库管理包括建立和完善知识库可以建立常识、标准规范、设备手册、操作说明、建设文档、竣工文档、设计图纸、报表等知识库,也可实现在运维过程中,有关数据与报告转化成知识库内容,如风险知识库、应急知识库、维修知识库、维保知识库、报表知识库、会议纪要知识库等。
2.5 审批管理 审批管理用于具有审批需求的业务部门人员,完成审批单起草、流转、查看流转进度、批准、执行、办结归档的整个流程 数据中心基础设施审批内容有设备上下电审批单、外来人员进出审批单、门禁申请及权限变更审批单、视频录像查看审批单、数据中心临时通行证审批单、动火证审批单,按照审批单关键要素优化设计流程。
具备查看流转过程、审批单据自动编号和归档、建立多种索引查询方式2.5.1 审批单起草 审批需求人员可起草设备上下电审批单、外来人员进出审批单、门禁申请及权限变更审批单、视频录像查看审批单、数据中心临时通行证审批单、动火证审批单。
起草后可以实现流转到对应部门审核人处 审批单内容与制度要求保持一致,可实现对未完成起草审批单保存、待下次完成后再进行流转为每个部门建立一个外来人员名单库,外来人员名单可以保存一份,后续再填写时直接通过搜索填充。
2.5.2 待办审批单 主要是用于在流转过程中处理等待办理的审批单,根据流程先后顺序,在权限范围内实现审批审核签字和填写有关意见,并实现往下流转或结束办理审批单2.5.3 已办审批单 审批需求人、审批审核人、审批执行人可查看自己已经办理的审批单。
2.5.4 容量查询 设备上下电涉及到空间和电源容量限制,可建立一张反应数据中心实时空间和电源容量图,输入设备相关参数后可自动判断是否满足需求如不能满足,则无法起草成功,无法流转 一般业务人员仅有查看容量权限,空间分配人员有权对空间情况进行相关操作和批准、设施管理人员有权对电源情况进行相关操作和批准。
实现空间容量和电源容量操作全程记录备案功能设备上电后自动完成容量图更新工作,每日对更新后容量数据需进行定时备份当容量不足时,可以实现智能预警提醒功能2.5.5 审批单查询 业务办理人员可以查询自己办理过的历史审批类单据和本部门同事办理过的历史审批类单据。
为控制信息范围,不能查询其他部门历史审批类单据 空间分配员可以查看他所有审批过涉及到空间分配单据,运维人员可分类查看所有历史单据,并完成相关数据分析2.6 系统管理 2.6.1 身份认证 用户使用系统时必须通过身份认证方可允许登录并进行权限范围内的业务操作。
要求如下: (1)用户首次登录系统时必须修改系统已赋予的初始密码,否则不予登录系统用户修改密码时,新输入密码不能与旧密码相同设置密码有效期要求用户对密码进行定期更改,密码有效期以天为单位,管理员具有配置权限。
(2)本系统采用“用户名 + 强密码口令”的用户身份核实和登录控制手段密码强度必须符合至少10位字符,且同时含大写字母、小写字母、数字,密码不得含有与用户名相同的字段或者常见连续数字和字母段用户密码应加密存储,选用国内常用加密算法。
(3)连续登录失败多次后应锁定用户账号,连续失败登录次数管理员可自行配置解锁方式可采取由系统管理员解锁或回答安全问题解锁应具备失败信息提示,告知失败原因,授权范围外使用系统的用户显示警告信息 (4)系统具备用户新增、停用、重新启用和删除的功能。
用户被删除后,用户使用系统的数据仍然保留,仅做用户删除标识2.6.2 角色管理 角色为一个或多个权限的集合系统管理员角色为系统预先设置,不可新创建或删除,对应系统管理类权限系统管理员仅能创建业务类角色。
应用系统应基于角色进行访问控制,角色管理包括角色创建、修改、删除、查询、停用 / 启用等功能 用户可以通过角色唯一代码和角色名称标识等条件查询该角色,查询结果列表应能按照角色唯一代码、角色名称标识、创建时间等进行排序。
2.6.3 用户管理 采用系统管理员和业务用户分开权限的设置原则系统管理员具有本系统管理层面的所有权限,且不能被删除为了保障安全,系统管理员不能开展具体的业务操作系统管理员可以根据需要创建和删除业务用户,但业务用户不具有任何系统管理操作权限。
系统管理员账号永久存在,首次登录应完成密码修改,否则无法登录 用户管理应包括查询、新增、修改、密码重新设置及账户解除锁定、账户停用及启用等功能 (1)查询功能:用户列表应能够根据部门名称(或部门代码)、用户名、创建时间、停用标志、锁定标志等信息进行排序;列出部门用户时,应能够在该部门内按照条件查询用户信息,查询条件包括用户编号、用户姓名、部门名称、创建时间、停用标志、锁定标志等;可通过用户列表查看用户详细信息;查询结果页面应提供能够进行新增、修改、停用 / 启用、解锁、密码重置等功能入口。
(2)新增功能:输入用户基本信息至少包含用户唯一标识、用户姓名、用户部门;增加一个用户,用户密码自动进行初始化处理 (3)修改功能:用户唯一标识不能修改,其他必备信息和扩展信息都可以被修改 (4)密码重新设置及账户解除锁定功能:出现密码遗忘的情况,系统管理员可对用户的密码开展重新设置。
用户账号被锁后,系统管理员可对用户账户开展解除锁定操作 (5)账户停用及启用功能:根据业务需要,系统管理员可对用户账户采取停用或启用操作2.6.4 用户授权管理 系统管理员依据用户的角色,对用户业务操作权限分类授予权限。
当角色被授予的权限改变时,拥有该角色的用户使用权限也立即随之发生变更2.6.5 业务日志管理 为了便于后续追溯,业务操作动作应纳入日志记录管理每条业务日志应记载日志编号、触发时间、用户名称、操作动作、操作内容等信息。
业务日志管理内容包括日志查看、日志导出、日志清理、日志备份等功能 2.7 权限管理 权限管理包括用户权限查询、修改、停用及启用等功能对权限修改仅限于修改权限名称、权限内容、权限说明等信息,权限代码为系统自动生成不可修改。
业务类权限包括审批类业务权限和基础设施运维管理类业务权限等 运维类权限包括应用系统监控、业务日志管理、运维日志管理、参数管理、运维常规操作、用户管理等3 建设方案 3.1 应用架构设计 数据中心基础设施运维管理系统是运维办公工作任务电子化和流程化的工具。
其用户信息可以调用原有人员信息,其流程可使用专业化的流程管理工具,其工作表单可以使用专业化的表单管理工具,可以集成在统一办公门户方便用户登录系统基于上述需求,可以结合原有的综合办公管理平台,进行定制化开发设计,充分利用原有的资源,提升系统建设效率。
按照平台化、组件化的建设原则,具体应用架构如图 2 所示
3.2 应用架构划分 本系统应用架构采用松耦合分层调用的设计原则,主要由应用层、服务层和组件层构成 应用层主要是业务功能的体现,现已包括公文流转、督办督查、人力资源管理、财务管理、集中采购、法律服务、工会家园、项目管理等应用的业务操作功能,数据中心基础设施运维管理系统也将在这一层体现。
可以通过表单服务定制业务类表单、通过流程服务定义业务流程,实现业务展现、业务操作和数据流转等功能集成的综合登录门户作为这些应用的统一访问入口 服务层主要为综合办公类应用提供相关基础服务,包括Web 内容管理、全文检索服务、工作流服务、公文流转服务、表单服务、用户权限配置服务等。
利用综合办公管理基础软件平台封装的业务功能服务,可供其它应用直接调用,实现平台基础服务功能的共用共享 组件层是业务功能的基础单元,包括日常安排、待办已办、附件管理、打印模板、电子印章、报表定义、综合查询、即时消息等。
组件是为了最大功能复用相同的业务操作,尽管大多组件不能直接作为页面展现,但可以作为页面组合元素与业务绑定在一起呈现 外部系统主要是基础相关系统,包括统一用户系统、门户系统和数据交换平台等4 系统运行情况。
数据中心基础设施运维管理系统现已建成投产,系统运行稳定,达到预期建设目标。日常运维管理、风险与应急管理、统计与知识库管理、审批管理等模块使用正常。具体如图 3 所示。
5 建设总结 通过建设数据中心基础设施运维管理系统,将原来人工记录纸质版运维工作数据转化成电子数据,沉淀的运维数据转化成知识库,极大便利了基础设施数据查询和问题定位分析,还可以用作分析预测基础设施问题;通过将运维工作、运维人员考核和服务商考核等有机结合,实现了工作同步开展量化考核,提高了运维工作质量,提升了数据中心基础设施运维管理水平;通过对数据中心访问、门禁权限申请等流程电子化,极大提升了审批工作效率。
免责声明除非特别说明,本站所载内容来源于互联网、微信公众号等公开媒体渠道,目的在于传递更多信息,内容仅供读者参考,不确保文章的准确性,不代表本站观点,仅供参考、交流之目的转载的稿件版权归原作者或机构所有,。
如有侵犯版权请告知,我们将在24小时内删除!往期回顾链接:1. 《数据中心基础设施运维工程师培训教材》免费领取2. 免费领取数据中心基础设施运维资料礼包3. 数据中心基础设施工程验收检查表-Excel电子表格
扫码入群,获取更多运维资料
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186