그외

행정전산망 장애 전국민이 불편

by 잼잼아저씨 2023. 11. 20.
반응형

아래는 정부24에 올라온 공지문입니다.


정부24 서비스 중단 안내

- 국가정보자원관리원 네트워크 장비 오류 등으로 서비스를 일시중단합니다.

행정안전부는 이번 정부24 장애로 인하여 국민이 불이익을 받는 일이 없도록

금일 발생한 장애에 따라
1) 주민센터에서 처리되는 납부, 신고 등 공공 민원에 대해서는 납부기한을 연장하고
2) 확정일자 등과 같이 접수와 즉시 처리를 요하는 민원은 민원실에 수기 접수하면 오늘(11.17.)자로 소급하여 처리할 예정입니다.

아울러 행정안전부에서는 전산장애를 신속히 복구하여 불편을 해소할 수 있도록 최선을 다하겠습니다.

- 주민등록번호 확인이 필요한 증명서는 가족관계증명서로 대체 가능합니다.
* 전자가족관계등록시스템(https://efamily.scourt.go.kr)
- 아래 증명서의 경우 정부24외 개별시스템을 이용하여 발급 가능합니다.
* 건축물대장 : 세움터(https://www.eais.go.kr)[2]
* 납세증명, 소득금액증명 등 : 국세청홈택스(https://www.hometax.go.kr)
* 운전경력증명서 등 : 경찰 민원포털(https://www.efine.go.kr)
* 건강보험 자격득실 확인서 등 : 국민건강보험(https://www.nhis.or.kr)


2023년 11월 17일 공무원 전용 행정전산망인 '새올'에서 사용자 인증 문제로 장애가 발생하여 정부 온라인 민원서비스인 '정부24'도 서비스가 전면 중단되었습니다. 정부는 주말 사이 지자체 행정망 '새올'과 정부 온라인 민원 플랫폼 '정부 24'가 모두 이상 없이 작동하도록 복구했다고 밝혔습니다. 
장애의 원인은 네트워크 장애와 인증장치 고장, 이중화 장비 먹통이었습니다. 

 

정부24 등 전산망 복구 완료…먹통 원인 '네트워크 장애'

 

정부24 등 전산망 복구 완료…먹통 원인 '네트워크 장애'

[전국 지방자치단체 행정 전산망에 장애가 발생한 17일 오전 대전시 서구 둔산1동 행정복지센터에 민원업무처리 관련 안내문이 붙어있다. (사진=연합뉴스)]그저께(17일) 생긴 '정부24' 등 행정전산

biz.sbs.co.kr

 

행정안전부는 19일 보도자료를 통해 "이번 장애의 원인은 새올인증시스템에 연결된 네트워크의 장애인것으로 밝혀졌으며, 해당 장비 교체 이후 서비스를 정상 재개했다"고 밝혔습니다. 행안부는 17일 오전 새올지방행정정보시스템 접속 오류가 발생해 원인 분석 결과 이 시스템에 접속하는 GPKI 인증시스템에 장애가 생긴 것으로 확인했다고 설명했습니다.

해당 GPKI 인증시스템 서버 등을 모두 점검 분석한 결과, 인증시스템 일부인 네트워크 장비 L4 스위치에 이상이 있는 것으로 확인됐다며 18일 새벽에 교체하고 안정화 작업을 한 이후 테스트를 거쳐 서비스를 정상적으로 재개했다고 밝혔습니다. 정부24는 18일 오전 9시 재개 이후 현재까지 원활히 작동하고 있습니다.

주민등록 발급 등 24만여 건의 민원이 정상적으로 처리됐으며, 18일 오후 3시부터 지자체와 현장 점검 한 새올지방행정정보시스템 상태도 현재까지 양호하다고 설명했습니다. 

 

장애의 원인으로 지목된 네트워크 장애와 인증장치 고장, 이중화 장비 먹통은 똑같은 말이라고 할 수 있습니다. 인증서버는 이중화 장비(L4스위치) 아래에 연결되어 있고 이중화 장비는 네트워크 장비입니다. 이중화 장비가 정상 동작하지 않아 hang이 걸렸다고 할 수 있습니다.(추측)

이중화 장비는 한쪽으로 서비스를 하다가 한쪽에 문제가 생겼을 경우 다른 장비로 서비스를 넘겨서 정상적인 운영을 하게 하는 장비입니다. hang은 장비교체나 펌웨어 업그레이드 등의 작업으로 인해 흔히 발생하며 서비스 점검을 철저히 하지 않으면 사용자의 신고가 없을 경우 찾아내지 못하는 경우가 많습니다.  이중화 장비의 문제가 생기면 그아래에 서버가 수천대가 있어도 서버는 정상동작하지 않습니다. 네트워크 장비는 네트워크 엔지니어가 작업을 했을 것이고 인증서버의 서비스는 타 시스템에서 요청을 해서 정상동작 여부를 확인해야 하는데 네트워크 엔지니어는 대부분 서비스 점검을 하지 않습니다. 처음부터 작업 후 확인해야 할 내용에 서비스 확인은 없을 가능성이 높습니다.

그리고 인증서비스의 경우 사용자가 상대적으로 적은 주말에 작업을 하는게 좋습니다. 그러면서 한편에는 작업자의 처후 개선등 또 헛소리를 하는 곳이 많습니다. 대부분은 주말에 작업을 하면 대체 후무를 하고 있습니다. 그렇지 않은 곳은 귀한 엔지니어들이 들어가서 일할 이유가 없습니다. 목요일에서 금요일까지 작업을 한것은 처후가 좋다는 뜻입니다.

서비스 확인을 꼼꼼히 할 수 없는 원인이기도 합니다. 8시 쯤이 되면 사용자들이 접속을 하기 때문에 그전에 작업을 끝내기 마련인데 지연이 될 경우도 서비스 확인은 안되는 경우가 많습니다.

각설하고 장비의 장애가 문제라기 보다는 좀 더 꼼꼼한 서비스 확인이 필요하다는 것입니다. 해당 작업으로 영향을 받을 수 있는 서비스를 철저히 점검하는것이 필요합니다.

 

이번 사건 처럼 어떤 사건이 발생하면 이 사건에 옆에 걸처 있는 무언가 때문에 발생한 일이 아니냐는 식으로 사건의 본질을 흐리는 분석은 없으면 좋겠습니다. 

반응형

댓글