Skip to content

HCI(含对应交换机)维护必读

背景:基于Y25国庆节、Y26元旦节对TB5/TB2 HCI交换机进行固件升级期间出现的异常(维护集群所有VM异常HA到非维护集群),制作此HCI维护必读手册。

后续针对HCI进行维护前,需要参考本手册先检查确认相关信息后再进行维护操作。

1. 健康检查

1.1 容量评估

升级前检查确认集群空间使用情况:建议首选集群(TB2)扩展集群(TB5)总资源使用量不超过**90%**

image-20260122163939649

1.2 网络环境检查

  • 升级前检查确认HCI网络(业务、管理、vSAN等)均正常工作
  • 检查HCI网络的HA配置,确保HA线路均配置连到两台不同的交换机上
  • 现场网络环境准备和确认(如:交换机/服務器前后是否有阻挡的障碍物,或有障碍物需与机房管理员确认解决方案;笔记本及USB权限、U盘、Console;)

1. HCI交换机维护

1.1 升级前准备动作

若未进行提前检查确认Active/Standby链路情况或拔错线,可能会使TB2/TB5集群失联导致虚拟机被异常HA(开启副本虚拟机,需要手动开服務才能恢复业务)

  • HCI检查

  • 确认HCI 当前vSAN网络活动链接

    • 单击网络 -> 展开HCI -> VMware HCIA Distributed Switch -> Virtual SAN-794fccc7-cb22-4dbc-b1a4-de3b246fc613,并点击配置 -> 策略, 检查当前活动上行链路备用上行链路对应的uplink

    image-20260115093143088

  • 确认活动上行链接备用上行链路 对应的网卡 (vmnic) 及 MAC 地址

    • 单击主机,选择需要维护的主机,点击配置 -> 虚拟交换机,点击Virtual SAN-794fccc7-cb22-4dbc-b1a4-de3b246fc613,可以查看到链路指向 uplink4, 展开uplink4便可以查看到对应使用的是==vmnic3==

    image-20260115093810843

    • 切换到物理适配器便可以确认到 vmnic3 对应的 MAC 地址为:e4:3d:1a:01:83:81 (此网卡为Active,对应物理交换机也为Active)

      image-20260115094625674

  • Switch检查

  • 确认当前HCI配置对应交换机的 Active/Standby状态

    • 登陆交换机01 (10.41.8.25) 检查连接到交换机01上的网卡MAC地址
    show lldp neighbors
    

    image-20260115165959920

    • 登陆交换机02 (10.41.8.26) 检查连接到交换机02上的网卡MAC地址
    show lldp neighbors
    

    image-20260115170116748

    通过交换机MAC地址确认到当前HCI 的 vSAN网络对应的Active 交换机为 交换机02 (10.41.8.26)

    故:在升级交换机/停机维护时,需要先停机/维护交换机01(10.41.8.25)

1.2 交换机固件升级/维护

  • 升级交换机01 (10.41.8.25)
  • 升级完成检查交换机配置及HCI集群业务状态均正常后,进行下一步操作

  • 切换HCI vSAN网络的Active/Standby uplink确保停机/维护的交换机处于Standby

  • 登陆HCI vCenter

    • 单击网络 -> 展开HCI -> VMware HCIA Distributed Switch -> Virtual SAN-794fccc7-cb22-4dbc-b1a4-de3b246fc613,并点击配置 -> 属性, 点击编辑按钮進行調整

    image-20260115192249384

    • 將Active切换为Standby

    点击绑定与故障切换,选择活动上行链路uplink4,并点击下移,將活动链路切换为备用链路

    image-20260115192607775

    选择备用上行链路uplink3,并点击上移,將备用链路切换为活动链路

    image-20260115192902607

  • 检查交换机状态及HCI集群业务状态

  • 升级交换机02(10.41.8.26)

  • 升级完成检查交换机配置及HCI集群业务状态均正常

1.3 开机关

  • 交换机开机关需要至现场拔出电源线(交换机上无开关按键,系统无关机/重啟指令)