Monitoring
100 대가 넘는 장비가 있다면, 가장 중요한 것은, 전반적으로 무슨 일이 일어나고 있는지 확인하는 일입니다.Munin이라는 모든 시스템을 Graph 형태로 보여주고 정상 범위가 넘어가면 경고를 주는 툴을 이용합니다.Python-Munin 기반으로 많은 Custom Munin plugin을 만들었고, System 수준이 아닌 것들도 그래프 형태로 표현했습니다.( 예를 들어, 분당 등록 유저 수, 초당 사진 등록 수 등 ) 서비스의 외부 모니터링 용도로는 Pingdom 을 이용하고, PagerDuty 를 사고나 알림을 다루기 위해서 사용합니다. 파이썬 에러 리포팅을 위해서 Sentry 를 사용합니다. Sentry는 Disqus를 포크한 멋진 오픈 소스 Django 앱 입니다. 실시간으로 시스템에 무슨 에러가 발생하고 있는지 등록하고 볼 수 있습니다.