국가정보자원관리원 화재로 인해 정부 관련 서비스가 중단되면서, 안전 기준, 보험료, 인프라 설계에 변화를 가져올 가능성이 높아지고 있다. 해외 분석가들은 기업이 효율성과 복원력, 규제 준수 사이에서 균형을 새롭게 잡아야 하는 상황에 놓였다고 진단했다.

지난 26일 국가정보자원관리원(NIRS) 데이터센터에서 발생한 대형 화재로 인해 정부 647개 시스템이 마비됐다. 이 가운데 96개는 직접 손상됐고, 551개는 사전 차단 조치가 이뤄져 결과적으로 일주일 가까이 정상 운영이 중단됐다. 전문가들은 이번 사태가 재해복구 실행과 배터리 안전 프로토콜의 치명적인 취약점을 드러냈으며, 전 세계 기업 CIO가 즉각 주목해야 할 사안이라고 분석했다.
이번 사고는 대전 소재 시설에서 진행된 무정전 전원 공급 장치(UPS) 정기 점검 중 리튬이온 배터리가 폭발하면서 발생했다. 그 결과 은행 및 우편 서비스, 신원 인증, 응급 서비스 등 필수적인 정부 기반 서비스가 마비됐다.
정부 당국은 화재 발생 나흘 뒤인 30일 기준, 전체 서비스 가운데 87개가 복구됐으며 최대 4주에 걸친 복구 작업이 필요하다고 밝혔다.
이날 영국의 통신망 사업자 오픈리치(Openreach)는 BT 교환국에 설치된 모든 리튬 배터리를 48시간 내 제거하라는 긴급 지침을 통신사들에 전달했다. 매체 IS프리뷰(ISPreview)는 열 폭주, 화재, 폭발 위험이 상당히 높다는 판단에 따른 조치였다고 보도했다.
안전 조치가 역효과를 낸 사고
국정자원 화재는 원래 리스크를 줄이기 위한 작업 도중 발생했다. 당초 계획은 5층 서버실에 있던 UPS 배터리를 지하로 옮겨 핵심 IT 인프라와 물리적으로 분리하고자 했다.
이때 이동을 위해 분리해 둔 UPS 배터리에서 화재가 시작됐다. 이 배터리가 폭발하면서 열 폭주가 발생했고, 극심한 열 방출로 인해 진화 작업에 차질이 생겼다. 당국은 초기 대응에서 데이터 손상 방지를 위해 물을 사용하지 않고 이산화탄소 소화 방식을 택했다. 소방본부는 이로 인해 신속한 진화에 한계가 있었다며, 설치돼 있던 384개 리튬이온 배터리 전량이 불에 탔다고 밝혔다. 화재를 완전히 진압하기까지는 약 22시간이 소요됐다.
코리아헤럴드 보도에 따르면 해당 배터리는 LG에너지솔루션이 제작해 2012~2013년에 설치됐으며, 이미 수명 10년을 초과했음에도 지난 6월 안전 검사에서는 적합 판정을 받았다. 업계 전문가들은 작업자가 전원을 완전히 차단하지 않은 채 케이블을 분리했을 가능성을 지적하며, 이로 인해 직류(DC) 시스템에 전압 스파이크가 발생했을 수 있다고 설명했다.
이재명 대통령은 지난 28일 공식 사과를 발표하는 한편 “예측 가능한 일이 벌어졌다. 비용을 들여서라도 대책을 세웠어야 하는데 대비책이 없었다”라고 비판했다. 이번 장애로 인해 은행 및 공항의 모바일 신원 인증, 우편 서비스, 교통 시스템, 정부 내부망인 온나라(Onnara) 인트라넷 등 광범위한 서비스가 차질을 빚고 있다.
리튬이온 배터리의 위험성 계산
전문가들은 이번 사고가 업계 전반의 기술 전환 추세에 중요한 시사점을 제시했다고 봤다. 데이터센터 배터리 시장 내 리튬이온 배터리의 점유율은 2020년 15%에서 2025년에는 38.5%까지 확대될 것으로 전망되고 있다.
에베레스트그룹(Everest Group) 수석 애널리스트 탄비 라이는 “리튬이온 시스템이 확산될수록 안전 관리 범위는 더욱 엄격해져야 한다”라며 “배터리 모듈을 서버 공간과 분리하고, 조기 열·가스 감지 센서, 리튬이온 전용 소화 시스템을 도입하며 엄격한 운영 프로토콜을 적용하는 것이 필수적”이라고 설명했다.
지난 2018년부터 2022년 10월까지 국내에서 발생한 UPS 관련 화재는 55건이었다. 대표적인 사고는 SK C&C 판교캠퍼스A 화재 사고로 인한 카카오 서비스 접속 장애가 있었다. 특히 UPS 시스템이 대규모 에너지 저장 장치(ESS)보다는 안전 설계가 단순한 경우가 많고, 배터리가 서버 근처에 배치되는 경우가 빈번하다는 지적이 나온다. 실제로 국정자원 데이터센터에서는 배터리가 서버와 불과 60cm 간격으로 설치돼 있었다.
에베레스트그룹 수석 애널리스트 히만슈 마트레는 “리튬이온 화재 대응 방식이 근본적으로 재고돼야 한다”라며 “노벡 1230이나 이너젠 같은 청정소화약제를 고압 미세 물분무 냉각과 함께 사용하는 방식이 기존 스프링클러보다 훨씬 효과적”이라고 설명했다. 그는 또한 데이터센터에 폭발 압력 완화 패널과 강화된 환기 시스템을 도입해 시스템 전체의 고장 위험을 줄여야 한다고 덧붙였다.
IDC 아시아·태평양 클라우드 인프라 수석 연구원 미하일 자우라는 위험을 최소화하려는 조직이라면 이번 사고로 인해 일시적으로 리튬이온 배터리 기반 UPS 도입 속도를 늦출 것이라고 분석했다. 그러나 그는 “AI 데이터센터의 효율성과 고밀도 요구사항이 시장을 견인하기 때문에 전체적인 도입 추세는 계속될 것”이라며, “벤더들이 리튬이온 UPS 통합 안전 솔루션을 점차 확대 제공하고 있으며 규제 당국의 감시도 강화되고 있다”라고 설명했다.
재해복구 실행의 허점
전문가들은 이번 사고는 단순히 배터리 문제에 그치지 않고 재해복구 아키텍처의 치명적 취약점을 드러냈다고 지적했다.
국정자원은 약 1,600개 정부 시스템을 3곳의 분산된 센터에서 운영하고 있다. 그러나 이 가운데 647개 시스템, 즉 전체의 3분의 1 이상이 대전 시설에 집중돼 있었다. 화재가 발생하자 해당 시스템이 동시에 오프라인 상태로 전환됐다.
코리아헤럴드는 업계 전문가의 말을 인용해 해당 시설이 실시간 장애 전환을 가능하게 하는 ‘트윈 서버 아키텍처’를 갖추지 못했다고 보도했다. 윤호중 행정안전부 장관은 손상된 96개 시스템을 다른 지역의 클라우드 인프라로 이관하는 데 4주가 걸릴 것이라고 밝혔는데, 이는 초기 예상치의 2배에 달하는 기간이다.
에베레스트그룹의 라이는 “이번 사고는 과도한 중앙집중화가 시스템 취약성을 초래한다는 사실을 다시 보여줬다. 기업은 중앙 데이터센터의 규모 경제를 유지하되, 지역 분산형 장애 전환 노드, 서비스 세분화, 내장형 재해복구 체계를 결합한 하이브리드 토폴로지로 재조정해야 한다”라고 조언했다.
에베레스트그룹 리서치 디렉터 카스토리 자가데산은 “기업은 UPS, 냉각, 전력 공유 구역 간 상호 의존성을 면밀히 분석해 중앙집중화 리스크를 점검해야 한다. 국정자원 화재 사고는 단순한 이중화만으로는 취약한 구획화 문제를 막을 수 없음을 보여줬다”라고 말했다. 그는 또 장애가 발생할 경우 시간당 수백만 달러의 손실이 발생할 수 있다고 덧붙였다.
IDC 연구에 따르면 중앙집중형 데이터센터는 규모의 경제를 제공하지만 동시에 위험도 집중되는 특성이 있다. 자우라는 분산형·모듈형 접근법이 복원력을 강화하고 단일 장애 지점을 줄이는 효과가 있다고 설명하면서, “데이터센터 입지를 다양화해 지역적 리스크를 완화해야 한다. 모듈형 및 이동형 데이터센터 솔루션에 투자해 유연성과 신속한 복구 능력을 확보할 필요가 있다”라고 말했다.
시장에 미칠 영향
라이는 이번 사건이 업계 전반으로 하여금 사전 검증 절차를 강화하고 보다 신중하게 기술을 도입하도록 영향을 미칠 수 있다고 전망했다. 다만 그는 “리튬이온 기술의 장점은 여전히 매력적”이라고 평가하면서 “앞으로 기업은 더 강력한 안전 인증과 벤더의 책임을 요구하게 될 가능성이 높다. 동시에 재해복구 계획, 지리적 이중화, 복원력 프레임워크에 대한 투자를 가속화할 것”이라고 분석했다.
에베레스트그룹 수석 애널리스트 칼리아니 데브루크카르는 “앞으로 기업과 규제 당국 모두 안전 기준에 대한 요구 수준을 높일 것”이라고 내다봤다. 그는 “일부 조직은 나트륨이온 배터리나 개선형 밸브조절식 납축전지(VRLA) 같은 대체 기술을 검토할 수 있으며, 위험도가 높다고 판단되는 시설에는 보험사가 보험료를 인상할 가능성이 있다”라고 설명했다. 이어 “이미 NFPA 855와 최신 국제 화재 코드(International Fire Code) 개정판에는 리튬이온 배터리 시스템에 대한 보다 엄격한 규정이 반영돼 있다”라고 말했다.
자우라는 “기업이 비즈니스 연속성 관리, IT 재해복구 계획, 대체 사이트 운영을 위한 예산을 확대하고 있다”라고 전하며, CIO가 비즈니스 영향 분석(BIA)을 기반으로 효율성과 안전, 규제 준수 사이의 균형을 맞출 수 있는 프레임워크를 도입해야 한다고 권고했다. 그는 “단순히 리튬이온 배터리를 쓰느냐 마느냐의 이분법적 선택이 아니다. 고급 모니터링, 화재 진압 시스템, 모듈형 설계 같은 위험 완화 조치를 통해 저위험 환경에서는 리튬이온 배터리를 계속 활용할 수 있다”라고 말했다.
dl-ciokorea@foundryco.com