-
Problem report
-
Resolution: Won't fix
-
Trivial
-
None
-
None
-
3 equipos en la misma red: 1 Servidor Windows (Windows Server 2008 R2 Standard) y 2 servidores Linux (Ubuntu 18.04.6 LTS y Ubuntu 16.04.7 LTS). Se dispone también de un firewall (SonicWall).
Buenos días,
Actualmente tenemos montado un servidor Zabbix 6.2 montado en un Oracle Linux Server 8.6 donde monitoreamos 3 equipos que están en la misma red protegidos con un firewall (Sonicwall). Durante 3 meses funcionaron sin problemas. Hace 3 semanas, de repente los 2 servidores Linux dejaron de monitorearse y aparece en cada uno el error: Get value from agent failed: cannot connect to [[IP de nuestro hosts]:10050]: [4] Interrupted system call
El servidor Windows se sigue monitoreando sin problemas.
Realizamos las siguientes comprobaciones:
- El servicio Zabbix-Agent se esta ejecutando.
- Archivo de configuración de los agentes correctamente configurados:
Server= IP de nuestro servidor Zabbix
ListenPort=10050
ServerActive= IP de nuestro servidor Zabbix
Hostname: asignamos el mismo nombre que también hemos puesto a la hora de crear un
nuevo hosts.
- Los servidores tienen salida a Internet
- Las reglas para escuchar el puerto 10050 y 10051 están activas en nuestro SonicWall
- Revisamos que el servidor Zabbix este escuchando al puerto 10050 y al 10051 con el comando netstat -tunlp | grep 10050/10051
- Revisamos los logs de los 2 servidores Linux
En el servidor Ubuntu 18.04.6 LTS los ultimos regisitros que se van repitiendo son:
20086:20230518:183204.825 active check configuration update from [13.36.191.140
:10051] started to fail (cannot connect to [[13.36.191.140]:10051]: [4] Interrup
ted system call)
20086:20230519:073210.076 active check configuration update from [13.36.191.140
:10051] is working again
En el servidor Ubuntu 16.04.7 LTS los ultimos registros son:
20086:20230518:183204.825 active check configuration update from [13.36.191.140
:10051] started to fail (cannot connect to [[13.36.191.140]:10051]: [4] Interrup
ted system call)
20086:20230519:073210.076 active check configuration update from [13.36.191.140
:10051] is working again
Cosas que hemos probado:
- Reiniciar ambos agentes zabbix
- Reiniciar el servidor Oracle Linux donde se encuentra el zabbix sevrer.
- Cambiar la configuración de los archivos de los agentes esppecificamente la linea de ListenPort, donde probamos diferentes opciones (ListenPort=10050, ListenPort=10051 y #ListenPort=0.0.0.0).
- Eliminar completamente Zabbix-Agent de ambos servidores y volverlos a instalar y configurar. Al mismo tiempo borrar los hosts que teníamos en la interfaz grafica de Zabbix.
Lo único en que nos salió error es que probamos de realizar un telnet al puerto 10050 y 10051 en los 2 servidores Linux con el comando* telnet (IP servidor Zabbix) 10050/10051*, ambos nos conecta sin problemas en el puerto 10051, en cambio en el 10050 nos sale error.
Revisamos la configuración de nuestro SonicWall y hemos comprobado de que la regla que permite el trafico del puerto 10050 y 10051 esta activada.
Hay alguna otra configuración que debemos de tener en cuenta para poder volver a monitorear los servidores Linux?
Gracias