모니터링 항상 관심이였던..

Monitoring

100 대가 넘는 장비가 있다면, 가장 중요한 것은, 전반적으로 무슨 일이 일어나고 있는지 확인하는 일입니다.Munin이라는 모든 시스템을 Graph 형태로 보여주고 정상 범위가 넘어가면 경고를 주는 툴을 이용합니다.Python-Munin 기반으로 많은  Custom Munin plugin을 만들었고, System 수준이 아닌 것들도 그래프 형태로 표현했습니다.( 예를 들어, 분당 등록 유저 수, 초당 사진 등록 수 등 ) 서비스의 외부 모니터링 용도로는 Pingdom 을 이용하고,  PagerDuty 를 사고나 알림을 다루기 위해서 사용합니다. 파이썬 에러 리포팅을 위해서 Sentry 를 사용합니다. Sentry는 Disqus를 포크한 멋진 오픈 소스 Django 앱 입니다. 실시간으로 시스템에 무슨 에러가 발생하고 있는지 등록하고 볼 수 있습니다.

댓글 남기기