HCI(含对应交换机)维护必读¶
背景:基于Y25国庆节、Y26元旦节对TB5/TB2 HCI交换机进行固件升级期间出现的异常(维护集群所有VM异常HA到非维护集群),制作此HCI维护必读手册。
后续针对HCI进行维护前,需要参考本手册先检查确认相关信息后再进行维护操作。
1. 健康检查¶
1.1 容量评估¶
升级前检查确认集群空间使用情况:建议
首选集群(TB2)和扩展集群(TB5)总资源使用量不超过**90%**
1.2 网络环境检查¶
- 升级前检查确认HCI网络(业务、管理、vSAN等)均正常工作
- 检查HCI网络的HA配置,确保HA线路均配置连到两台不同的交换机上
- 现场网络环境准备和确认(如:交换机/服務器前后是否有阻挡的障碍物,或有障碍物需与机房管理员确认解决方案;笔记本及USB权限、U盘、Console;)
1. HCI交换机维护¶
1.1 升级前准备动作¶
若未进行提前检查确认Active/Standby链路情况或拔错线,可能会使TB2/TB5集群失联导致虚拟机被异常HA(开启副本虚拟机,需要手动开服務才能恢复业务)
-
HCI检查
-
确认HCI 当前vSAN网络活动链接
- 单击
网络-> 展开HCI ->VMware HCIA Distributed Switch->Virtual SAN-794fccc7-cb22-4dbc-b1a4-de3b246fc613,并点击配置->策略, 检查当前活动上行链路和备用上行链路对应的uplink
- 单击
-
确认
活动上行链接和备用上行链路对应的网卡 (vmnic) 及 MAC 地址- 单击
主机,选择需要维护的主机,点击配置->虚拟交换机,点击Virtual SAN-794fccc7-cb22-4dbc-b1a4-de3b246fc613,可以查看到链路指向uplink4, 展开uplink4便可以查看到对应使用的是==vmnic3==
- 单击
-
Switch检查
-
确认当前HCI配置对应交换机的 Active/Standby状态
- 登陆交换机01 (10.41.8.25) 检查连接到交换机01上的网卡MAC地址
- 登陆交换机02 (10.41.8.26) 检查连接到交换机02上的网卡MAC地址
通过交换机MAC地址确认到当前HCI 的 vSAN网络对应的Active 交换机为
交换机02 (10.41.8.26)故:在升级交换机/停机维护时,需要先停机/维护
交换机01(10.41.8.25)
1.2 交换机固件升级/维护¶
- 升级
交换机01 (10.41.8.25) -
升级完成检查交换机配置及HCI集群业务状态均正常后,进行下一步操作
-
切换HCI vSAN网络的Active/Standby
uplink(确保停机/维护的交换机处于Standby) -
登陆HCI vCenter
- 单击
网络-> 展开HCI ->VMware HCIA Distributed Switch->Virtual SAN-794fccc7-cb22-4dbc-b1a4-de3b246fc613,并点击配置->属性, 点击编辑按钮進行調整
- 將Active切换为Standby
点击
绑定与故障切换,选择活动上行链路uplink4,并点击下移,將活动链路切换为备用链路选择备用上行链路
uplink3,并点击上移,將备用链路切换为活动链路 - 单击
-
检查交换机状态及HCI集群业务状态
-
升级
交换机02(10.41.8.26) -
升级完成检查交换机配置及HCI集群业务状态均正常
1.3 开机关¶
- 交换机开机关需要至现场拔出电源线(交换机上无开关按键,系统无关机/重啟指令)








