网络连通性是首要验收点,必须确保从目标客户群到香港机房的访问路径稳定、延迟符合业务需求以及带宽承诺到位。
核对网络带宽是否与合同一致、检查公网IP与路由白名单、确认是否有专线或BGP多线支持、验证机房对DDoS防护的承诺及其生效方式。
使用ping/traceroute检测多地连通性并记录RTT和丢包率;用iperf3做带宽基准测试,分别测试上行/下行;通过网站速度监测工具(如WebPageTest)从目标区域打点,评估首屏与完整加载时间。
记录多次测试结果并与SLA对照,要求供应商提供网络监控日志,并在出现异常时能快速定位链路问题。
性能与稳定性直接影响用户体验和系统可用性,验收时要进行压力、负载以及长时稳定性测试。
验证CPU、内存、磁盘IOPS与延迟、磁盘容量与RAID配置、主机是否启用虚拟化资源限制、是否支持弹性扩容。
使用负载生成工具(如ApacheBench、wrk、JMeter)对应用进行并发压测,模拟真实业务峰值流量;用fio做磁盘IO基准测试,测量随机/顺序读写性能;运行48-72小时的稳定性测试,观察内存泄漏、CPU飙高以及服务重启情况。
确认在目标并发下平均响应时间、95/99百分位响应时间及错误率均在预期范围内,若不满足须记录并要求整改或扩容计划。
安全与权限管理是上线前必须严格审查的部分,涉及机房物理安全、系统安全配置与运维权限控制。
确认机房访问控制、监控与告警、主机操作系统补丁状态、防火墙与入侵检测(IDS/IPS)、SSH/远程管理的访问控制策略。
进行端口扫描与漏洞扫描(如Nessus、OpenVAS)以发现暴露的弱点;验证SSH密钥管理与多因素认证是否启用;模拟权限分离场景,检查运维账号的最小权限策略是否生效。
要求供应商提供最近的安全审计与补丁清单,对于发现的高危漏洞应在验收前修复或给出可行的缓解方案。
备份与容灾确保在事故发生时可以快速恢复业务,验收时要验证策略的完整性与可操作性。
核查备份频率、备份保留周期、异地备份是否生效、快照策略与数据库备份的一致性、恢复时长(RTO)与数据恢复点目标(RPO)。
执行一次完整恢复演练:从备份中恢复文件、数据库并在隔离环境中验证一致性;进行应用层灾难切换测试,验证业务能否在规定RTO内通过备用节点或异地恢复运行。
记录恢复时间与数据完整性校验结果,确认备份加密与传输通道(如VPN或专线)安全,确保供应商将备份日志与监控纳入可视化管理。
运维与合规关系到长期稳定运行与法律风险,验收时要覆盖监控体系、日志管理、SLA与合规证书等。
确认是否提供24x7运维支持、故障响应时间、监控项(主机、网络、应用、业务指标)与告警策略、日志集中化与保存周期,以及是否具备PCI/DSS、ISO27001等合规证书(如适用)。
触发模拟故障(如单机宕机、网络中断),验证运维响应流程与故障单处理时效;检查监控告警是否能及时上报并包含必要的上下文信息;审核日志采集与留存是否满足合规要求。
获取运维SOP与应急预案文档,要求供应商提供历史故障处理记录与绩效指标,并确认合同中有明确的赔偿或补救条款以保障上线风险可控。