BESPIN Tech Blog
  • Home
  • Tech
    • CSP

      AWS

      GCP

      NCP

      Cloud

      Migration

      LZ, Control Tower

      Backup

      Monitoring

      Container

      Infra

      OS

      Middleware

      Data

      RDB

      Big Data Platform

      Application

      CI/CD

      BESPICK 구독하기 ㅣ 1668-1280

  • Trend
  • IT
최신 리포트 다운로드 지금 바로 문의하기
BESPIN Tech Blog
  • Home
  • Tech
    • CSP

      AWS

      GCP

      NCP

      Cloud

      Migration

      LZ, Control Tower

      Backup

      Monitoring

      Container

      Infra

      OS

      Middleware

      Data

      RDB

      Big Data Platform

      Application

      CI/CD

      BESPICK 구독하기 ㅣ 1668-1280

  • Trend
  • IT
최신 리포트 다운로드 지금 바로 문의하기
BESPIN Tech Blog
BESPIN Tech Blog
  • Tech
    • CSP
      • AWS
      • GCP
      • NCP
    • Cloud
      • Migration
      • LZ, Control Tower
      • Backup
      • Monitoring
      • Container
    • Infra
      • OS
      • Middleware
    • Data
      • RDB
      • Big Data Platform
    • Application
      • CI/CD
  • Trend
  • IT
  • Contact US
Cloud

[WhaTap] RDS Failover / Reboot 관제 1 – Describe RDS

by 민우 서 2025년 05월 29일
2025년 05월 29일
33

안녕하세요 오늘은 BESPIN GLOBAL SRE실 지봉근님이 작성해주신 ‘[WhaTap] RDS Failover / Reboot 관제 1 – Describe RDS’ 에 대해 소개해드리도록 하겠습니다.

목차

  1. 개요
  2. 세부 내용
  3. 마치며

1. 개요

  • 목적: 본 문서는 WhaTap Failover / Reboot 관제를 위해 작성되었습니다.

    2. 세부 내용

    • 적용 배경
      • WhaTap에서는 RDS Failover / Reboot을 감지할 수 있는 지표(Metric)이 별도로 존재하지 않습니다.
        • Failover / Reboot은 정확히는 지표(Metric)가 아닌 이벤트(Event)로 분류됩니다.
      • Failover / Reboot을 감지할 수 있도록 자동화 Script를 작성했으며, 대상 자동화를 통해 신규 RDS의 생성 혹은 삭제 등이 발생할 경우에도 자동으로 관제 가능하도록 구성했습니다.
    • 주의 사항
      • IAM Role / Access Key를 혼용해서 사용하는 경우에는 ‘권한’ 충돌이 발생하지 않도록 ‘Profile’ 등을 통해 구분해야 합니다. (RDS Describe 권한이 필요)
      • 해당 Script들은 AWS CLI를 통해 Query하는 부분이 있어 리소스를 과점유할 수 있으니, Crontab에는 ‘5분’ 정도의 여유 시간을 할애하는 것을 권장합니다.
      • 해당 Script는 선행 작업되어야 Failover / Reboot 대상을 관제할 수 있습니다.
    • 코드 내용
      • describe_RDS.sh:
        • LOCATE_PATH: 해당 Script가 위치할 Path를 변수로 할당합니다. (마지막에 ‘/’ 포함 필수)
        • OUTPUT: ‘json’ 형식으로 AWS CLI 결과를 출력합니다. (변경 X)
        • REGION: AWS CLI로 검색할 리전 코드를 변수로 할당합니다.
        • ‘Run Command’ 이하 내용은 수정할 필요가 없습니다
          • ‘Profile’을 이용하여 모니터링 할 경우에는 17, 18번 줄의 AWS CLI 명령어 중간에 ‘–profile=[Profile User]’ 가 추가 되어야 합니다.
        • 해당 Script를 실행하여 생성되는 ‘RDS_Instance_List’ / ‘RDS_Cluster_List’는 Script가 수행될 때마다 ‘덮어쓰기’되어 갱신하는 구조입니다.
    #!/bin/bash
    # Amazon Linux 1 / Amazon Linux 2 / CentOS / Redhat
    # List creation script for detecting RDS Reboot / Failover
    # Enter the path where 'Script' will be located/operated.
    LOCATE_PATH=""
    # AWS CLI Output Type
    OUTPUT="json"
    # AWS CLI Target Region
    REGION="ap-northeast-2"
    ##### Run Command #####
    echo `aws rds describe-db-instances --output ${OUTPUT} --region ${REGION} | grep '"DBIn
    echo `aws rds describe-db-clusters --output ${OUTPUT} --region ${REGION} | grep "DBClus
    echo `cat ${LOCATE_PATH}describe_RDS_Instances | awk '{ gsub(" ","\n",$0); print }' > $
    echo `cat ${LOCATE_PATH}describe_RDS_Clusters | awk '{ gsub(" ","\n",$0); print }' > ${
    echo `rm -rf ${LOCATE_PATH}describe_RDS_Instances`
    echo `rm -rf ${LOCATE_PATH}describe_RDS_Clusters
    • Script 실행(Test)
      • Script가 위치한 디렉토리로 이동하여 해당 Script를 실행합니다.
      • 다음 2가지 내용으로 Script 정상 동작 여부를 확인합니다.
        • 동일한 디렉토리에 ‘RDS_Instance_List’ / ‘RDS_Cluster_List’ 파일 생성 여부
        • 각 List 파일 확인 시, RDS Console에서 확인 가능한 리소스 일치 여부
    • Script 등록
      • Crontab에 해당 Script를 실행할 User로 매일 1회 실행될 수 있도록 등록합니다.

    3. 마치며

    • 타 모니터링 솔루션과 다르게 WhaTap에서는 RDS Failover / Reboot을 Integration으로 관제할 수 있는 방안이 없어 해당 Script를 구현하여 고객사에 적용했습니다.
    • 해당 Script는 Failover / Reboot Script와 하나의 세트입니다.
      • 대상 자동화를 위한 세트 구성이기에 각 Script별로 올바른 설정이 필요합니다.

    여기까지 ‘[WhaTap] RDS Failover / Reboot 관제 1 – Describe RDS’에 대해 소개해드렸습니다. 유익한 정보가 되셨길 바랍니다. 감사합니다. 

    Written by 지 봉근 / SRE실

    BESPIN GLOBAL

    관련

    RDSFailoverRebootDescribe RDS

    HOT Trend

    Recent Posts

    • 딜로이트도, 맥킨지도, 베스핀글로벌도: AI 에이전트로 일 바꾸는 시대

      2025년 07월 04일 클라우드베스핀글로벌clouddata데이터AI인공지능HelpNow AIbespinglobalAI에이전트helpnow업무자동화딜로이트
    • ⚔️데이터센터에서 시작된 전쟁? 요즘 뜨는 AIDC 개념부터 트렌드까지!

      2025년 06월 27일 클라우드clouddata데이터AI데이터센터클라우드 데이터센터bespinglobalAIDCAI 인프라베스핀글로벌
    • 구글부터 엔비디아까지, 빅테크 기업들의 AI 전략 최신본📖

      2025년 06월 20일 cloud베스핀글로벌클라우드data데이터AI구글마이크로소프트엔비디아AI에이전트google I/ONVIDIA GTC 2025Microsoft build 2025
    • AI를 연결한다고? 업계가 주목하는 ‘MCP’ 알아보기🔍

      2025년 06월 13일 베스핀글로벌클라우드cloudAIMCP
    • [WhaTap] RDS Failover/Reboot 관제 2 – RDS Failover

      2025년 05월 30일 RDSRDS FailoverRebootFailoverbespin global

    베스핀글로벌은 모든 기업의 AI 혁신을 실현하기 위해, 세상에서 가장 혁신적이고 자동화된 AI 서비스와 솔루션을 만들어갑니다.
    상호 : 베스핀글로벌 주식회사 ㅣ 대표자명 : 김써니, 허양호 ㅣ 사업자등록증번호 : 638-87-00223 ㅣ 통신판매번호 : 2019-서울서초-0347 ㅣ 대표전화 : 1668-1280
    사업장주소지 : 서울특별시 서초구 강남대로 327, 13,14,15,16층(서초동,대륭서초타워) ㅣ 이메일 : info@bespinglobal.com ㅣ 개인정보 처리방침 ㅣ 개인정보 처리방침 안내

    © 2026 BESPIN GLOBAL, All Rights Reserved.

    BESPINGLOBAL
    패밀리 사이트
    China MEA SEA US

    BESPIN Tech Blog
    • Home
    • Tech
      • CSP

        AWS

        GCP

        NCP

        Cloud

        Migration

        LZ, Control Tower

        Backup

        Monitoring

        Container

        Infra

        OS

        Middleware

        Data

        RDB

        Big Data Platform

        Application

        CI/CD

        BESPICK 구독하기 ㅣ 1668-1280

    • Trend
    • IT