- 문제점
- 시스템 측면
1. 데이터 센터간 이중화가 미흡
(1) 일부 시스템이 판교 데이터 센터에만 이중화 되어 있었음
(캐시서버, 오브젝트 스토리지가 이중화 x => 카카오 로그인 및 사진 전송 등 문제 발생)
(2) 하나의 데이터 센터에서 장애가 발생하면 다른 데이터 센터로 자동 전환해주는 시스템이 작동해야하는데
이 시스템이 판교 데이터 센터에만 설치되어 있어서 수동 전환하느라 시간 오래걸림
2. 서비스 개발과 관리를 위한 운영관리 도구 부족
(1) 화재로 인한 모니터링 시스템 도구 사용 불가능
3. 이중화 전환 후 가용 자원 부족
- 관리 측면
1. 데이터 센터 전체의 장애 복구를 위한 인력과 자원 부족
2. 장애 대응을 위한 커뮤니케이션 채널에 혼선
=> 커뮤니케이션으로 카카오톡, 카카오 워크를 사용 => 사용불가로 인한 커뮤니케이션 불가
3. 재해 시 컨트롤 타워 체제의 부족
- 해결 방안
1. IT 엔지니어링 Data Goverance 강화
2. BCP 외부자문
3. 기술 R&D와 오픈소스화
4. 삼중화 +a의 DR 아키텍쳐 구현
5. 멀티 클라우드
ref)
https://www.youtube.com/watch?v=b50yVfxj-ug
728x90
'Conference' 카테고리의 다른 글
컨퍼런스 요약 [2022 데이터 톡톡 페스티벌] (0) | 2022.12.20 |
---|