Uploaded image for project: 'ZABBIX BUGS AND ISSUES'
  1. ZABBIX BUGS AND ISSUES
  2. ZBX-22821

Error al monitorizar servidores Linux

XMLWordPrintable

    • Icon: Problem report Problem report
    • Resolution: Won't fix
    • Icon: Trivial Trivial
    • None
    • None
    • Server (S)
    • 3 equipos en la misma red: 1 Servidor Windows (Windows Server 2008 R2 Standard) y 2 servidores Linux (Ubuntu 18.04.6 LTS y Ubuntu 16.04.7 LTS). Se dispone también de un firewall (SonicWall).

      Buenos días,

      Actualmente tenemos montado un servidor Zabbix 6.2 montado en un Oracle Linux Server 8.6 donde monitoreamos 3 equipos que están en la misma red protegidos con un firewall (Sonicwall). Durante 3 meses funcionaron sin problemas. Hace 3 semanas, de repente los 2 servidores Linux dejaron de monitorearse y aparece en cada uno el error: Get value from agent failed: cannot connect to [[IP de nuestro hosts]:10050]: [4] Interrupted system call

      El servidor Windows se sigue monitoreando sin problemas.

      Realizamos las siguientes comprobaciones:

      • El servicio Zabbix-Agent se esta ejecutando.
      • Archivo de configuración de los agentes correctamente configurados:
        Server= IP de nuestro servidor Zabbix
        ListenPort=10050
        ServerActive= IP de nuestro servidor Zabbix
        Hostname: asignamos el mismo nombre que también hemos puesto a la hora de crear un
        nuevo hosts.
      • Los servidores tienen salida a Internet
      • Las reglas para escuchar el puerto 10050 y 10051 están activas en nuestro SonicWall
      • Revisamos que el servidor Zabbix este escuchando al puerto 10050 y al 10051 con el comando netstat -tunlp | grep 10050/10051
      • Revisamos los logs de los 2 servidores Linux
        En el servidor Ubuntu 18.04.6 LTS los ultimos regisitros que se van repitiendo son:
        20086:20230518:183204.825 active check configuration update from [13.36.191.140
        :10051] started to fail (cannot connect to [[13.36.191.140]:10051]: [4] Interrup
        ted system call)
        20086:20230519:073210.076 active check configuration update from [13.36.191.140
        :10051] is working again

      En el servidor Ubuntu 16.04.7 LTS los ultimos registros son:
      20086:20230518:183204.825 active check configuration update from [13.36.191.140
      :10051] started to fail (cannot connect to [[13.36.191.140]:10051]: [4] Interrup
      ted system call)
      20086:20230519:073210.076 active check configuration update from [13.36.191.140
      :10051] is working again

      Cosas que hemos probado:

      • Reiniciar ambos agentes zabbix
      • Reiniciar el servidor Oracle Linux donde se encuentra el zabbix sevrer.
      • Cambiar la configuración de los archivos de los agentes esppecificamente la linea de ListenPort, donde probamos diferentes opciones (ListenPort=10050, ListenPort=10051 y #ListenPort=0.0.0.0).
      • Eliminar completamente Zabbix-Agent de ambos servidores y volverlos a instalar y configurar. Al mismo tiempo borrar los hosts que teníamos en la interfaz grafica de Zabbix.

      Lo único en que nos salió error es que probamos de realizar un telnet al puerto 10050 y 10051 en los 2 servidores Linux con el comando* telnet (IP servidor Zabbix) 10050/10051*, ambos nos conecta sin problemas en el puerto 10051, en cambio en el 10050 nos sale error.

      Revisamos la configuración de nuestro SonicWall y hemos comprobado de que la regla que permite el trafico del puerto 10050 y 10051 esta activada.

      Hay alguna otra configuración que debemos de tener en cuenta para poder volver a monitorear los servidores Linux?

      Gracias

            zabbix.support Zabbix Support Team
            Joan242424 Joan Hornos
            Votes:
            0 Vote for this issue
            Watchers:
            2 Start watching this issue

              Created:
              Updated:
              Resolved: