В докладе освещается опыт проекта XXXXXX по применению Splunk.
XXXXXX – это ведущий российский видеосервис, который был анонсирован в прошлом году. Сервис позволяет пользователям выбирать и смотреть фильмы на TV, Web, PC, iPhone/iPad. Каталог сервиса на данный момент включает более 3500 лицензионных художественных и анимационных фильмов ведущих российских и мировых киностудий, в том числе Sony Pictures, Disney, Warner Bros. и FOX, Universal.
Техническая инфраструктура сервиса XXXXXX представляет собой порядка 20 взаимосвязанных приложений, работающих на более чем 30 серверах. Создавая сервис, разработчики и служба поддержки столкнулись с потребностью в удобном инструменте, который позволил бы накапливать и анализировать логи со всех серверов в одной точке, через единый удобный интерфейс. Такой инструмент должен был сократить время устранения эксплуатационных проблем. В качестве решения был выбран Splunk. Оказалось, что этот продукт помогает не только быстро решать эксплуатационные проблемы, но и может гораздо больше.
С помощью Splunk сравнительно небольшими затратами усилий и без специальной экспертизы было реализовано:
- сбор логов в единое хранилище с возможностью удобного поиска по логам через Web-интерфейс (“Google для логов”). Это существенно уменьшило время на поиск и решение проблем на продуктовой площадке.
- дашборды отражающие “здоровье” сервиса – наглядная информация о количестве ошибок и проблем в сервисе за последние 24 часа. Таким образом, служба эксплуатации получила еще один инструмент для мониторинга состояния сервиса.
- статистические и аналитические дашборды, с информацией о количестве продаж, поведении пользователей сервиса и т.п. Пользователями этих дашбордов стали менеджер продукта, маркетологи, бизнес-аналитики.
Минимальная лицензия Splunk (объем собираемых данных до 500 МБ в сутки) бесплатна, поэтому этот инструмент может быть интересен в том числе и для небольших проектов с ограниченным бюджетом.