Categories
Uncategorized

90초 내 페일오버로 서비스 유지: QNAP 고가용성 실습 체험

QNAP High Availability(HA)는 QNAP의 실시간중복솔루션으로, 두 대의NAS장치를 네트워크 케이블로 연결하여 가상 클러스터를 구성할 수 있습니다. 한NAS서비스가 중단되면 HA가 자동으로 페일오버하여 서비스를 복구할 수 있습니다. 이 시연에서는 “Active-Passive HA”의 동작과 효과를 테스트합니다. 일반적으로 단일 장치에 장애가 발생하면 90초 이내에 서비스가 복구되며, SMB를 통해 전송 중인데이터도 일시 중단 후 자동으로 재개됩니다.

개요 및 설정

HA에는 하드웨어 요구 사항이 있으며, 참조된 설정 가이드에서 확인할 수 있습니다. 이번 테스트에서는 QNAP TVS-h474와 TOSHIBA N300 시리즈NAS전용하드 드라이브를 사용했습니다. N300 6TB는 7,200rpm 속도와 512MB 버퍼를 갖춘 3.5인치 기계식드라이브입니다. TVS-h474의 무공구 트레이 덕분에 설치가 빠릅니다. 각 NAS에는 N300 6TB 드라이브 3개씩 장착하여 RAID 5 풀로 구성했습니다.

HA를 설정하려면 두NAS유닛의 모델과 하드웨어 사양이 동일해야 합니다. HA는 두 유닛 간데이터을 동기화하여 원활한 페일오버를 지원합니다. 본 기사에서는 QNAP TVS-474 두 대와 TOSHIBA N300 하드 드라이브 6개를 사용했습니다. 지원되는 하드웨어 전체 목록은 제공된 참조를 확인하세요.

HA는 애플리케이션을 통해 동작하므로App Center에서 “High Availability” 앱을 다운로드해야 합니다. 사전 조건으로 운영체제는QTS hero 버전 5.3(퍼블릭 베타) 이상이어야 합니다.

배선 구성은 다음과 같습니다. 명확성을 위해 케이블에 색상을 지정했습니다. 두NAS유닛은 동일한스위치및 서브넷에 있어야 합니다. 파란색 케이블은 각NAS를스위치에 연결하고, 검은색 케이블은 두NAS유닛을직렬로 연결하여 Heartbeat 링크를 구축합니다. 이 Heartbeat 연결은 실시간데이터동기화를 보장합니다. 한 유닛에 장애가 발생하면 다른 유닛이 신속하게 서비스를 인계할 수 있습니다.

우리는 네트워크 및 전원 케이블을 물리적으로 분리했다가 다시 연결하여 장치 고장, 네트워크 연결 끊김, 정전과 같은 시나리오를 시뮬레이션했습니다.

설정이 완료되면 High Availability App 홈페이지에 두 대의NAS유닛으로 생성된 클러스터가 표시되며, 이름은 “C1”(구성 중에 이름을 사용자 지정할 수 있음)입니다. 홈페이지는 대시보드와 유사하게 활성 및 패시브 노드의 상태를 나열하며, CPU 및 DRAM 사용량, 디스크읽기/쓰기 속도, 개별 네트워크 연결 속도, 두NAS장치 간의 전송 속도 및레이턴시을 포함합니다.

패널에서 클러스터를 관리할 수 있습니다. 예를 들어, 펌웨어 업데이트, HA 앱 업데이트, 활성 및 패시브 노드 간 전환, 패시브 노드 제거, 클러스터 삭제 등이 가능합니다. 종료 시에는 클러스터를 통해 두 대의NAS유닛을 동시에 종료하거나 재시작할 수도 있습니다.

이 설정에서 활성 노드의 IP는 192.168.0.114이고 패시브 노드의 IP는 192.168.0.2입니다. High Availability Manager는 클러스터 “C1”을 생성했으며, 클러스터 IP는 192.168.0.99입니다. 이 C1은 가상NAS처럼 동작하여 미디어 스트리밍 및 파일 업로드/다운로드를 처리할 수 있습니다.

“Network & Virtual 스위치” 인터페이스에서는 현재 네트워크 연결도 확인할 수 있으며, 여기에는 192.168.0.99의 가상 HA 클러스터도 포함됩니다.

왼쪽 “Nodes” 패널에서는 두NAS장치의 모델, CPU, 메모리, 일련번호, BIOS 버전, 운영체제 버전, HA 버전 등 기본 정보를 볼 수 있습니다. 또한 팬 속도, 주요 온도, 네트워크 상태도 표시됩니다. 여기에서 개별NAS장치를 종료하거나 재시작할 수도 있습니다.

활성 노드 연결 끊김 시나리오

테스트에서는NAS_A와스위치사이의 네트워크 케이블을 수동으로 분리하여 연결 끊김을 시뮬레이션했습니다.

잠시 후 HA 제어판에서NAS_A가 연결 해제되었다는 경고가 표시되었습니다. 시스템은 자동으로 활성 노드를NAS_B로 전환하여 89초 만에 장애 조치를 완료했습니다.

문제가 발생한 후에는 왼쪽 메뉴의 “Event Logs” 섹션에서도 경고 기록을 확인할 수 있습니다.

네트워크 케이블을 다시 연결한 후 화면에는 파란색 배경에 흰색 글씨로 “Checking system high availability status.”가 표시되었습니다. 재연결부터 HA 시스템이스위치을 복구하고 정상 작동을 재개하기까지 약 74초가 소요되었습니다.

패시브 노드 연결 끊김 시나리오

우리는NAS_B와스위치사이의 네트워크 케이블을 수동으로 분리하여 연결 해제를 시뮬레이션했습니다.

NAS_B가 연결 해제된 후 약 82초 만에 서비스가 복구되었습니다.

HA가 실행 중일 때 패시브 노드의QuTS hero홈페이지에 로그인하면(이 경우 192.168.0.99를 통해) ‘유지보수 모드’로 표시됩니다. 하지만 High Availability 인터페이스는 계속 접근할 수 있습니다.

하트비트 연결 해제 시나리오

세 개의 네트워크 케이블 중 세 번째 하트비트 링크도 여러 가지 이유로 실패할 수 있습니다. 여기서는 이 링크의 연결 해제를 시뮬레이션했습니다.

인터페이스에는 두NAS장치 간의 연결이 중단되었으며 기본 상태를 표시할 수 없다는 경고가 나타났습니다. 하지만 이 상황에서 사용에 미치는 영향은 거의 없었습니다. 예를 들어영상를 스트리밍할 때 하트비트 링크가 끊겨도영상의 어느 지점으로 빠르게 건너뛰어도 즉시 재생이 중단 없이 이루어졌습니다. 진행 중인 파일 업로드나 다운로드에도 거의 영향이 없었으며 파일 전송이 계속되었습니다.

파란색 케이블(NAS와 스위치 간 연결)이 분리되고, 이 장애가 짧게(약 3~5초) 발생하는 경우, HA는 장애 조치를 시작하지 않을 수 있으며 파일 전송 작업이 중단 없이 완료될 수 있습니다.

HA는SMB서비스를 일시 중지시키지만 중단시키지는 않습니다

SMB프로토콜을 통해 전송 중 활성 노드가 전송 도중 오프라인이 되면 파일 전송이 일시적으로 중단됩니다. 하지만 90초 이내에 자동으로 재개되어 처음부터 다시 시작하지 않고 완료됩니다. 전송 속도 그래프에서 일시 중지를 나타내는 하락(골짜기)을 볼 수 있습니다. 실제 예시: 에디터가NAS에서 200개의 미디어 파일을 다운로드하고 컴퓨터를 자리에 두고 떠난 경우, NAS호스트가 HA 없이 오프라인이 되면 전체 다운로드를 다시 시작해야 합니다. 하지만 HA가 적용되어 있다면, 패시브 노드가 90초 이내에 자동으로 전송을 재개합니다. 에디터가 돌아왔을 때 중단 사실을 알아차리지 못할 수도 있습니다.

반대로 패시브 노드나 하트비트 연결이 오프라인이 되는 경우, 서비스는 중단되지 않을 뿐만 아니라SMB전송 중에도 눈에 띄는 속도 저하나 끊김 없이 원래 속도로 파일이 계속 전송됩니다.

이러한 테스트를 통해 실제 환경에서 QNAP 고가용성의 성능과 가치를 확인할 수 있습니다. 활성 노드, 패시브 노드, 심지어 하트비트 연결이 끊어져도 HA는 합리적인 시간 내에 장애 조치를 완료하여 서비스가 중단되지 않거나 영향을 최소화합니다.

액티브-패시브 HA는 비용 효율적이고 다재다능하여 중소기업이나 중형 스튜디오에 적합합니다. 안정적이고 빠른NAS복구가 필요할 때 QNAP 고가용성은 확실한 선택입니다. 테스트 결과, 장애 조치는 항상 90초 이내에 완료되며, 90초 이내에 복구된 하드웨어도 원래 클러스터에 다시 합류할 수 있습니다. 더 높은 서비스 안정성이 요구되는 기업의 경우, 네트워크 HA를 통해 무중단 장애 조치를 구현하여 서비스가 항상 운영되도록 할 수 있습니다.

Leave a comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다