불과 열흘 전 아마존웹서비스(AWS) 장애에 이어 글로벌 주요 클라우드 서비스에서 잇따라 문제가 발생하면서 ‘디지털 인프라 과의존’에 대한 우려가 다시 커지고 있다.
MS에 따르면 이날 미 동부시간 오전 11시경부터 애저 접속 지연과 포털 오류가 보고되기 시작했다. 클라우드 네트워크에 문제가 생기면서 MS 사무용 소프트웨어 ‘365’, 인공지능(AI) 코파일럿, 애저 기반으로 운영되는 기업 시스템까지 줄줄이 영향을 받았다. 알래스카항공은 탑승 수속이 지연됐고 스코틀랜드 의회는 예정된 투표를 중단했다. 스타벅스, 크로거, 코스트코 등 주요 기업의 결제 및 웹서비스도 일시 다운됐다.
MS는 초기 공지를 통해 “애저 포털 접근에 문제가 발생해 조사를 진행 중”이라고 밝혔다. 이후 업데이트에서 “의도치 않은 시스템 구성 변경이 원인으로 추정된다”고 설명했다.
MS는 글로벌 트래픽 분산을 담당하는 ‘애저 프런트 도어’ 서비스 모든 변경을 차단하고 마지막으로 확인된 정상 상태로 되돌리는 조치를 시행했다. 한때 애저 상태 페이지에는 전 세계 모든 리전에서 네트워크 문제 보고가 표시됐다고 전해진다.
MS는 오후 7시20분(미 동부시간)까지 복구를 완료할 것으로 예측했다. 온라인 모니터링 사이트 ‘다운디텍터’ 기준 오후 6시30분에는 장애 신고가 100건 수준으로 줄었다고 밝혔다.
이번 장애는 지난 20일 AWS ‘US-EAST-1’ 리전에서 발생한 대규모 서비스 중단 이후 10일 만이다. 당시 AWS 장애로 미국과 한국을 포함한 다수 공공기관과 기업 서비스가 중단된 바 있다.
업계는 이번 사태가 특정 사업자에 집중된 글로벌 클라우드 인프라의 구조적 취약성을 다시 드러냈다고 분석한다.
로이터통신은 “단 한 번 설정 오류가 전 세계 주요 서비스에 영향을 미칠 수 있다는 점에서 클라우드 기반 인터넷 인프라 복잡성과 위험이 여실히 드러났다”고 평가했다.
MS는 이날 분기 실적을 발표했지만 클라우드 장애와 관련한 별도 공식 입장은 내놓지 않았다. 지난해에도 보안업체 크라우드스트라이크 업데이트 오류로 전 세계 윈도 시스템이 마비된 사례가 있어 연쇄적인 클라우드 리스크에 대한 경계가 한층 높아지고 있다.
- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -






























