Categories
Últimas Noticias

Conmutación por error en 90 segundos para mantener el servicio: Práctica con la alta disponibilidad de QNAP

La alta disponibilidad (HA) de QNAP es la solución de redundancia en tiempo real de QNAP, que permite conectar dos dispositivos NAS mediante cables de red y formar un clúster virtual. Cuando se interrumpe el servicio de un NAS, HA puede realizar automáticamente la conmutación por error y restaurar el servicio. En esta demostración, probaremos el funcionamiento y el efecto de la “HA activa-pasiva”. Normalmente, cuando falla un solo dispositivo, los servicios pueden restablecerse en 90 segundos y los datos que se transfieren a través de SMB pueden reanudarse automáticamente tras una breve pausa.

Resumen y configuración

HA tiene requisitos de hardware, que pueden consultarse en la guía de configuración de referencia. Para esta prueba, utilizamos un QNAP TVS-h474 junto con la serie TOSHIBA N300 y discos duros específicos para NAS. El N300 de 6TB es un unidad mecánico de 3,5” que funciona a 7.200 rpm con un búfer de 512 MB. Gracias a las bandejas sin herramientas del TVS-h474, la instalación es rápida. Cada NAS estaba equipado con tres unidades N300 de 6TB configurados en un conjunto RAID 5.

Para configurar HA, las dos unidades NAS deben ser del mismo modelo y tener especificaciones de hardware idénticas. HA sincroniza los datos entre ambas unidades para permitir una conmutación por error sin interrupciones. En este artículo, utilizamos dos unidades QNAP TVS-474 y seis discos duros TOSHIBA N300. Para ver la lista completa de hardware compatible, consulte la referencia proporcionada.

Como HA funciona mediante una aplicación, es necesario descargar la app “High Availability” desde el App Center. El requisito previo es que el sistema operativo sea QTS hero versión 5.3 (beta pública) o superior.

La configuración del cableado es la siguiente. Para mayor claridad, los cables están codificados por colores. Ambas unidades NAS deben estar en el mismo Conmutador y subred. Los cables azules conectan cada NAS al Conmutador, mientras que un cable negro conecta directamente las dos unidades NAS para establecer un enlace Heartbeat. Esta conexión Heartbeat garantiza la sincronización en tiempo real de los datos. Si una unidad falla, la otra puede asumir rápidamente el servicio para mantener la continuidad.

Simulamos fallos desconectando y volviendo a conectar físicamente los cables de red y alimentación, cubriendo escenarios como fallo del dispositivo, desconexión de red y cortes de energía.

Una vez completada la configuración, la página principal de la aplicación High Availability muestra el clúster creado por las dos unidades NAS, denominado “C1” (el nombre se puede personalizar durante la configuración). La página principal se asemeja a un panel de control, mostrando el estado de los nodos activo y pasivo, incluyendo el uso de CPU y DRAM, velocidades de lectura/escritura de disco, velocidades individuales de conexión de red, así como la velocidad de transferencia y latencia entre los dos dispositivos NAS.

Desde el panel, puede gestionar el clúster—for ejemplo, actualizar el firmware, actualizar la aplicación HA, alternar entre los nodos activo y pasivo, eliminar el nodo pasivo o borrar el clúster. Al apagar, también puede apagar o reiniciar simultáneamente ambas unidades NAS a través del clúster.

En esta configuración, la IP del nodo activo es 192.168.0.114 y la del nodo pasivo es 192.168.0.2. High Availability Manager creó el clúster “C1” con una IP de clúster 192.168.0.99. Este C1 se comporta como un NAS virtual—puede transmitir contenido multimedia y gestionar cargas y descargas de archivos.

En la interfaz “Network & Virtual Conmutador”, también puede ver las conexiones de red actuales, incluido el clúster HA virtual en 192.168.0.99.

En el panel izquierdo “Nodos”, puede ver la información básica de ambos dispositivos NAS, incluyendo modelo, CPU, memoria, número de serie, versión de BIOS, versión del sistema operativo y versión de HA. También muestra la velocidad de los ventiladores, temperaturas clave y el estado de la red. Desde aquí, también puede apagar o reiniciar individualmente los dispositivos NAS.

Escenario de desconexión del nodo activo

En la prueba, desconectamos manualmente el cable de red entre NAS_A y el Conmutador para simular una desconexión.

Poco después, el Panel de control de HA mostró una advertencia de que NAS_A se había desconectado. El sistema cambió automáticamente el nodo activo a NAS_B, completando el failover en 89 segundos.

Tras producirse el problema, el registro de advertencia también podía encontrarse en la sección “Registros de eventos” del menú de la izquierda.

Después de volver a conectar el cable de red, la pantalla mostró un fondo azul con texto blanco que decía “Comprobando el estado de alta disponibilidad del sistema”. Desde la reconexión hasta que el sistema HA completó la recuperación de Conmutador y reanudó la operación, transcurrieron unos 74 segundos.

Escenario de desconexión del nodo pasivo

Desconectamos manualmente el cable de red entre NAS_B y el Conmutador para simular una desconexión.

Después de que NAS_B se desconectó, los servicios se restablecieron en aproximadamente 82 segundos.

Si inicias sesión en la página principal de QuTS hero del nodo pasivo mientras HA está en funcionamiento (en este caso a través de 192.168.0.99), lo verás en «Modo de mantenimiento». Sin embargo, la interfaz de Alta Disponibilidad sigue siendo accesible.

Escenario de desconexión del Heartbeat

De los tres cables de red, el tercer enlace Heartbeat también puede fallar por varias razones. Aquí simulamos la desconexión de este enlace.

La interfaz mostró una advertencia indicando que la conexión entre los dos dispositivos NAS se había interrumpido y que no se podía mostrar su estado básico. Sin embargo, en esta situación, el impacto en el uso fue mínimo. Por ejemplo, al reproducir un vídeo, incluso después de desconectar el enlace Heartbeat, saltar rápidamente a cualquier punto del vídeo seguía reproduciéndose de inmediato y sin interrupciones. Para las cargas o descargas de archivos en curso, el impacto fue casi nulo: los archivos continuaron transfiriéndose.

Si lo que se desconecta es el cable azul (la conexión NAS a switch), y el corte es breve —alrededor de 3 a 5 segundos—, entonces es posible que HA no inicie un failover y la tarea de transferencia de archivos podría continuar hasta completarse sin interrupciones.

HA hace que los servicios SMB se pausen pero no se interrumpan

Al transferir mediante el protocolo SMB, si el nodo activo se desconecta a mitad de la transferencia, el archivo se pausará temporalmente. Sin embargo, en un plazo de 90 segundos, la transferencia se reanudará y completará automáticamente sin empezar de nuevo. En el gráfico de velocidad de transferencia, se puede ver una caída (valle), que representa la pausa. Un ejemplo práctico: un editor está descargando 200 archivos multimedia desde el NAS y deja el ordenador sin supervisión. Si el host NAS se desconecta sin HA, el editor tendría que reiniciar toda la descarga. Pero con HA, el nodo pasivo reanuda automáticamente la transferencia en menos de 90 segundos. Cuando el editor regresa, puede que ni siquiera note la interrupción.

Si en cambio se desconecta el nodo pasivo o la conexión Heartbeat, los servicios no se verán interrumpidos y, durante las transferencias SMB, no habrá ralentización ni interrupción perceptible. Los archivos seguirán transfiriéndose a la velocidad original de forma continua.

De estas pruebas podemos observar el rendimiento y el valor de la Alta disponibilidad de QNAP en la operación real. Ya sea el nodo activo, el nodo pasivo o incluso la desconexión de Heartbeat, HA puede completar el failover en un plazo razonable, manteniendo los servicios sin interrupciones o minimizando cualquier impacto.

La HA activa-pasiva es rentable y versátil, lo que la hace adecuada para pequeñas y medianas empresas o estudios de tamaño medio. Cuando se necesita una recuperación NAS estable y rápida, la Alta disponibilidad de QNAP es una opción sólida. Según las pruebas, el failover siempre se completa en menos de 90 segundos, y el hardware restaurado en menos de 90 segundos también puede volver a unirse al clúster original. Para empresas con mayores requisitos de estabilidad del servicio, se puede considerar la HA de red para un failover sin tiempo de inactividad, garantizando que los servicios estén siempre operativos.

Leave a comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *