Hola Amigos del Blog, hoy les escribiré respecto a una situación que se considera falso positivo bajo un ambiente VMware vSphere 6.7.
Esta situación alerta sobre una falla de un ventilador (Fan) sobre el hardware de servidores HPE Gen10.
Si se te presenta situación, podrás observar que a nivel de hardware está todo en orden no existen alarmas a nivel físico a nivel de HPE ILO.
Sin embargo, vCenter Server nos muestra una alerta constante de una falla en uno de los ventiladores de nuestro Host vSphere ESXi.
Para solucionar esta situación VMware recomienda actualizar a versión VMware ESXi670-202006001 Build 16316930 el cual podrás descargar en el siguiente link.
Existe una solución alternativa la cual podrás realizar siguiente los pasos a continuación.
Esta alternativa (Work Arround) consiste en ignorar específicamente esta alerta.
Sintoma
Dentro de los síntomas que nos aparecerás están los siguientes:
Alerta a nivel de vCenter Server:
a Nivel de Hardware no se aprecian alertas ni advertencias sobre HPE ILO.
Por ende esta situación es considerada un falso positivo por VMware documentado en el siguiente KB.
Solución Defintiva
Para solucionar esta situación VMware recomienda actualizar a versión VMware ESXi670-202006001 Build 16316930 el cual podrás descargar en el siguiente link.
Solución Alernativa
Se debe correr unos comandos y una configuración avanzada sobre el Host vSphere ESXi afectado que nos permitirán ignorar esta condición.
Debemos conectar por SSH a nuestro servidor vSphere ESXi afectado y determinar el componente de Hardware con su respectivo Node-Sendor ID, para lo cual se debe correr el siguiente comando:
#esxcli hardware ipmi sdr list
En mi caso el Node-Sensor ID tiene un valor de «0.49″ es el que presenta problemas es el que está marcado en la siguiente imagen, corresponde a «Cooling Unit 1 Fans» coincide con las alertas anteriores.
A continuación se debe correr el siguiente comando alusivo al Node-Sensor ID obtenido al listar los componentes de Hardware, el valor a ingresa siempre es el valor que sigue al 0. en mi caso el valor completo es 0.49 e ingresaré al comando solo el valor especifico 49.
#esxcfg-advcfg -s 49 /UserVars/HardwareHealthIgnoredSensors
El siguiente comando es para verificar el valor configurado.
#esxcfg-advcfg -g /UserVars/HardwareHealthIgnoredSensors
Posterior a correr estos comandos y verificar que el valor sea el correcto, debemos realizar la siguiente configuración avanzada sobre el mismo Host vSphere en donde hemos aplicado los comandos anteriores.
Estando en el vSphere Web Cliente sobre nuestro vCenter Server debemos seleccionar:
ESXi Host > Configure > Advanced System Settings > UserVars.HardwareHealthIgnoredSensors
Pues bien, ya realizado estas acciones se debe esperar unos minutos para que la alerta desaparezca definitivamente, si es necesario podrás refrescar la consola si fuese necesario.
Con estos simples pasos hemos realizado una solución alternativa a la situación descrita en este Post.
De esta forma hemos llegado al final de este post, te agradezco que te hayas dado el tiempo de leerlo en su totalidad, espero que te sea de mucha utilidad.
Te agradeceré puedas comentar, recomendar y compartir el Blog, además de suscribirte a nuestras redes sociales,
Un gran abrazo.