SlideShare una empresa de Scribd logo
1 de 47
Descargar para leer sin conexión
Типовое	внедрение	
мониторинга	
Николай	Сивко	
okmeter.io
okmeter.io
•  Сервис	мониторинга	
•  Фокус	на	подробные	метрики	
•  Автоконфигурация	
•  Встроенные	пополняемый	набор	автотриггеров	на	типичные	
проблемы
Зачем приходит клиент
•  Хочет	узнать,	что	что-то	сломалось	от	мониторинга,	а	не	от	
клиентов	
•  Хочет	понизить	MTTR	(mean	Qme	to	recovery)	
	TTR	=	время	понимание	причины	+	время	исправления
Узнать о проблеме
Регулярные	проверки	нужных	сценариев	
	
	+	Легко	сделать,	есть	куча	сервисов	
	+	Дешево/бесплатно	
	-	Большая	погрешность	
	-	Покрытие
Узнать о проблеме
Логи	
	
	++++	Видим	все	запросы	РЕАЛЬНЫХ	пользователей		
	+	Ошибки,	тайминги	
	-	Тратим	ресурсы	на	парсинг	
	-	Времена	считаем	по	версии	сервера	
	-	Сложно	обрабатывать	кейс,	когда	пропали	запросы	совсем	
(канал,	домен	итд)
Парсим логи nginx
Запарились	над	автоконфигурацией:	
		
•  Агент	видит	процесс	nginx	
•  Читаем	конфиг,	знаем	все	access_log’и	и	их	формат	
•  Вжух!	И	мы	уже	парсим	лог
Парсим логи nginx
Но	у	среднего	клиента	нет	в	логе	таймеров	:(	
Зажигаем	ему	алерт,	чтобы	расширил	формат	ибо	это	MUST	
	
Нужно	добавить	как	минимум:	
•  	$request_7me	
•  	$upstream_response_7me		
•  	$upstream_cache_status
Что напарсили
{	
	name="nginx.requests.rate"		
	file="/log_path.log”	
	plugin=“nginx”	
	source_hostname=“front1”	
	method="X"		
	status="YYY"		
	cache_status="zzz"		
	url="/xxx”	
}
Что напарсили: урлы
URL	естественно	не	полностью	
	
•  Выкинули	аргументы	
•  Выкинули	все,	что	похоже	на	идентификаторы	
•  Если	то,	что	осталось	по	количеству	запросов	>	N%	-	делаем	
отдельную	метрику	
•  Если	нет,	суммируем	все	в	url=“~other”
nginx.requests.rate
sum_by(source_hostname,	metric(name="nginx.requests.rate"))
nginx.requests.rate
sum_by(status,	metric(name="nginx.requests.rate",	status="4*"))
nginx.requests.rate
top(5,	sum_by(url,	metric(name="nginx.requests.rate",	status="4*")))
Тайминги: гистограмма
{	
	name="nginx.response_Qme.histogram"		
	file="/log_path.log”	
	plugin=“nginx”	
	source_hostname=“front1”	
	method="X"		
	cache_status="zzz"		
	url="/xxx”	
	level=”ll”	
}
nginx.response_Pme.histogram
sum_by(level,	metric(name="nginx.response_Qme.histogram"))
nginx.response_Pme.histogram
sum_by(level,	metric(name="nginx.response_Qme.histogram",	url="/api*"))
$request_Pme VS $upstream_response_Pme
•  Нужно	смотреть	на	обе	метрики	
•  На	$request_Qme	видно	и	тупняки	бэкенда	и	тупняки	канала	до	
клиента	и	время	бана	при	достижении	limit_req+burst	
•  На	$upstream_response_Qme	видно	только	тупняки	бэкенда	(или	
ложные	тупняки	бэкенда,	если	ioloop	nginx	где-то	блокируется)
Общие принципы мониторинга SOA
•  Что	пользователь	думает	про	фронтенд?	
•  Что	фронтенд	думает	про	бэкенд?	
•  Что	бэкенд	думает	про	соседние	сервисы?	
•  Что	бэкенд	думает	про	БД?	
•  Что	БД	думает	про	запросы	от	бэкенда?	
•  Как	OS	видит	потребление	ресурсов	от	приложений/БД?
Все врут
•  Никому	не	верим	
•  Асинхронный	h•p	клиент	может	заблокироваться	и	насчитать	
неправильное	время	ответа	сервера	
•  Считаем	на	всех	уровнях,	сравниваем,	исследуем	несостыковки
Backend
•  Использование	ресурсов:	cpu/mem/disk	io/fd	для	процессов	
приложения	
•  Исчерпание	ограниченных	ресурсов:	open	files	limit,	tcp	ack	
backlog	limit	итд	
•  Метрики	runQme:	gc,	memory	pools,	workers	
•  Инструментируем	код:	statsd,*-metrics,	pinba
Backend: cpu
sum_by(source_hostname,	metric(name="process.cpu.*",	process="/usr/bin/python"))
Backend: memory
sum_by(source_hostname,	metric(name="process.mem.rss",	process=”/usr/bin/python"))
Backend: runPme
counter_rate(metric(name="okagent.gc.Qme",	source_hostname=["srv10*",	"es10*"]))
Backend: runPme
counter_rate(metric(name="okagent.memstats.total_alloc",	source_hostname=["srv10*",	"es10*"]))
Backend: инструментируем
top(5,	sum_by(script,	metric(name="pinba.cpu.Qme")))
Backend: инструментируем
top(5,	sum_by(script,	metric(name="pinba.traffic.rate")))
Backend: инструментируем
top(5,	sum_by(stage,	metric(name="gokserver.handler_stages.sum",	handler="/metric/query")))
БД
•  Потребление	ресурсов	базой	с	точки	зрения	OS	(cpu/mem/disk	io/
net,…)	
•  Про	ресурсы	хорошо	бы	проверить,	что	их	не	стало	меньше	
•  Идеально	разложить	это	потребление	по	запросам
БД: ресурсы
•  sum_by(process,	metric(name="process.disk.ops.write",	process="/usr/libexec/mysqld"))
БД: деградация по ресурсам
БД: ресурсы по запросам
•  PostreSQL:	pg_stat_statements	покажет	cpu*/disk	io*/net*	по	
разным	типам	запросов	
•  MySQL:	performance	schema,	но	все	сложнее,	только	свежие	
версии,	иногда	дороговатенько	
•  Redis:	покажет	cpu	в	разрезе	команд	
•  Cassandra:	время	по	запросам	к	таблицам,	а	так	как	1	таблица	=	1	
тип	запроса,	достаточно
Redis: ресурсы по запросам
top(5,	sum_by(command,	counter_rate(metric(name="redis.commands.seconds"))))
Сassandra: ресурсы по запросам
top(5,	sum_by(table,	counter_rate(metric(name="cassandra.table.ops.total_Qme”,	operaQon=“Read”))))
Алерты
•  Правильные	severity	
•  Работа	с	инцидентами
Алерты: правильные severity
•  CRITICAL:	уведомляем	по	SMS/IM	
•  WARNING:	можно	уведомлять	на	email	или	без	уведомления	
•  INFO:	без	уведомления
Алерты: CRITICAL
•  Сайт	не	работает	
•  Ошибки	приема	платежей	
•  Пропал	поток	покупок
Алерты: CRITICAL
•  Бросаем	все	и	чиним	
•  Починку	нельзя	отложить	
•  Никто	никуда	не	уходит	пока	есть	проблема
Алерты: WARNING
•  Диск	кончается	
	
•  Какой-то	сервис	недоступен,	дает	много	ошибок	или	тупит	
•  Много	ошибок	на	сетевом	интерфейсе	
•  Сервер	недоступен	(ДА,	это	реально	warn!!!)	
	
•  Swap	IO	процесса	>	1	Mb/s
Алерты: WARNING
•  Желательно	закрыть	в	течении	дня	
•  Если	алерт	не	по	делу	–	добавляем	исключение	
•  Если	часто	флапает	-	сглаживаем
Алерты: INFO
•  CPU	usage	>	99%	
•  Disk	IO	>	99%	
•  Использование	других	ресурсов
Алерты: INFO
•  Используем	как	подсказки	во	время	поиска	причин	CRITICAL	или	
WARNING	
•  Если	загораются	бессмысленные	алерты	–	добавляем	
исключения
Алерты: общие принципы
•  Алерты	должны	показывать	причину	проблем	
•  Зависимости	и	автомагия	не	нужны	
•  Глазами	можно	быстро	просмотреть	100+	алертов	и	выбрать	
подходящий	
•  Алертам,	которые	не	помогают,	можно	понизить	severity
Алерты: работа с инцидентами
•  Важно	считать	продолжительность		CRITICAL	(он	же	down7me)	
•  Если	criQcal	!=	downQme	(чиним	severity)
Алерты: работа с инцидентами
•  Круто	классифицировать	факапы:		
			-	плохой	релиз	
			-	человеколажа	
			-	перегруз	
			-	хостинг/ДЦ	
			..	что-то	еще	по	вкусу
Алерты: работа с инцидентами
•  Сначала	тушим	пожар	
•  Потом	докапываемся	до	причины	
•  Классифицируем	
•  Заводим	задачи,	чтобы	не	повторялось	тоже	самое	
•  PROFIT	через	N	итераций
Алерты: работа с инцидентами
•  Смотрим,	какой	класс	проблем	доставляет	больше	всего	проблем	
•  Если	хостинг	–	переезжаем	
•  Если	человеки	–	автоматизируем	стрёмные	места,	нагоняем	страх	на	
человеков,	дальше	в	зависимости	от	управленческих	навыков:)	
•  Если	релизы	– нагоняем	страх	на	QA	
•  Ну	и	далее	по	стеку
Итого
•  Мониторинг	=	обнаружение	проблем	+	поиск	причины	проблемы	
	
•  Мониторинг	—	оптимизация	над	ручной	диагностикой	
	
•  Чем	точнее	мониторинг,	тем	быстрее	понятна	причина	проблемы	
•  Алгоритм	внедрения:	обеспечиваем	нужную	точность	
обнаружения,	потом	оптимизируем	диагностику
Спасибо за внимание!
Вопросы?	
	
Николай	Сивко	
nsv@okmeter.io

Más contenido relacionado

La actualidad más candente

Zabbix в Badoo или о чем не пишут в мануале, Илья Аблеев (Badoo)
Zabbix в Badoo или о чем не пишут в мануале, Илья Аблеев (Badoo)Zabbix в Badoo или о чем не пишут в мануале, Илья Аблеев (Badoo)
Zabbix в Badoo или о чем не пишут в мануале, Илья Аблеев (Badoo)Badoo Development
 
Доклад Ильи Аблеева на DevOps Meetup "Мониторинг высоконагруженного проекта".
Доклад Ильи Аблеева на DevOps Meetup "Мониторинг высоконагруженного проекта".Доклад Ильи Аблеева на DevOps Meetup "Мониторинг высоконагруженного проекта".
Доклад Ильи Аблеева на DevOps Meetup "Мониторинг высоконагруженного проекта".Badoo Development
 
мониторинг производительности приложения на PINBA
мониторинг производительности приложения на PINBAмониторинг производительности приложения на PINBA
мониторинг производительности приложения на PINBASlach
 
Zabbix: Прошлое, настоящее и будущее (Zabbix: Past, present and the future)
Zabbix: Прошлое, настоящее и будущее (Zabbix: Past, present and the future)Zabbix: Прошлое, настоящее и будущее (Zabbix: Past, present and the future)
Zabbix: Прошлое, настоящее и будущее (Zabbix: Past, present and the future)Zabbix
 
Сравнение решений по балансировке высоконагруженных систем / Евгений Пивень (...
Сравнение решений по балансировке высоконагруженных систем / Евгений Пивень (...Сравнение решений по балансировке высоконагруженных систем / Евгений Пивень (...
Сравнение решений по балансировке высоконагруженных систем / Евгений Пивень (...Ontico
 
«Секретные» технологии инвестиционных банков / Алексей Рагозин (Дойче Банк)
«Секретные» технологии инвестиционных банков / Алексей Рагозин (Дойче Банк)«Секретные» технологии инвестиционных банков / Алексей Рагозин (Дойче Банк)
«Секретные» технологии инвестиционных банков / Алексей Рагозин (Дойче Банк)Ontico
 
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...Ontico
 
Jinba - frontendconf.ru/2015
Jinba - frontendconf.ru/2015Jinba - frontendconf.ru/2015
Jinba - frontendconf.ru/2015Pavel Dovbush
 
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Coit-people
 
Monitoring-driven эксплуатация (rootconf2015)
Monitoring-driven эксплуатация (rootconf2015)Monitoring-driven эксплуатация (rootconf2015)
Monitoring-driven эксплуатация (rootconf2015)Nikolay Sivko
 
Microsoft и Linux на одном проекте: как получить лучшее из обоих миров и не р...
Microsoft и Linux на одном проекте: как получить лучшее из обоих миров и не р...Microsoft и Linux на одном проекте: как получить лучшее из обоих миров и не р...
Microsoft и Linux на одном проекте: как получить лучшее из обоих миров и не р...Ontico
 
«Тотальный контроль производительности» Михаил Юматов, ЦИАН
«Тотальный контроль производительности» Михаил Юматов, ЦИАН«Тотальный контроль производительности» Михаил Юматов, ЦИАН
«Тотальный контроль производительности» Михаил Юматов, ЦИАНit-people
 
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...Ontico
 
Максим Барышников, Что такое типовые проблемы нагруженных проектов и как их р...
Максим Барышников, Что такое типовые проблемы нагруженных проектов и как их р...Максим Барышников, Что такое типовые проблемы нагруженных проектов и как их р...
Максим Барышников, Что такое типовые проблемы нагруженных проектов и как их р...Tanya Denisyuk
 
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)Ontico
 
Веб-разработка без наркотиков с помощью PostgreSQL, Nginx и c2h5oh / Миша Кир...
Веб-разработка без наркотиков с помощью PostgreSQL, Nginx и c2h5oh / Миша Кир...Веб-разработка без наркотиков с помощью PostgreSQL, Nginx и c2h5oh / Миша Кир...
Веб-разработка без наркотиков с помощью PostgreSQL, Nginx и c2h5oh / Миша Кир...Ontico
 
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)Ontico
 
Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)
Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)
Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)Ontico
 

La actualidad más candente (20)

Zabbix в Badoo или о чем не пишут в мануале, Илья Аблеев (Badoo)
Zabbix в Badoo или о чем не пишут в мануале, Илья Аблеев (Badoo)Zabbix в Badoo или о чем не пишут в мануале, Илья Аблеев (Badoo)
Zabbix в Badoo или о чем не пишут в мануале, Илья Аблеев (Badoo)
 
Доклад Ильи Аблеева на DevOps Meetup "Мониторинг высоконагруженного проекта".
Доклад Ильи Аблеева на DevOps Meetup "Мониторинг высоконагруженного проекта".Доклад Ильи Аблеева на DevOps Meetup "Мониторинг высоконагруженного проекта".
Доклад Ильи Аблеева на DevOps Meetup "Мониторинг высоконагруженного проекта".
 
мониторинг производительности приложения на PINBA
мониторинг производительности приложения на PINBAмониторинг производительности приложения на PINBA
мониторинг производительности приложения на PINBA
 
Zabbix: Прошлое, настоящее и будущее (Zabbix: Past, present and the future)
Zabbix: Прошлое, настоящее и будущее (Zabbix: Past, present and the future)Zabbix: Прошлое, настоящее и будущее (Zabbix: Past, present and the future)
Zabbix: Прошлое, настоящее и будущее (Zabbix: Past, present and the future)
 
Сравнение решений по балансировке высоконагруженных систем / Евгений Пивень (...
Сравнение решений по балансировке высоконагруженных систем / Евгений Пивень (...Сравнение решений по балансировке высоконагруженных систем / Евгений Пивень (...
Сравнение решений по балансировке высоконагруженных систем / Евгений Пивень (...
 
«Секретные» технологии инвестиционных банков / Алексей Рагозин (Дойче Банк)
«Секретные» технологии инвестиционных банков / Алексей Рагозин (Дойче Банк)«Секретные» технологии инвестиционных банков / Алексей Рагозин (Дойче Банк)
«Секретные» технологии инвестиционных банков / Алексей Рагозин (Дойче Банк)
 
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...
 
Jinba - frontendconf.ru/2015
Jinba - frontendconf.ru/2015Jinba - frontendconf.ru/2015
Jinba - frontendconf.ru/2015
 
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co
 
Monitoring-driven эксплуатация (rootconf2015)
Monitoring-driven эксплуатация (rootconf2015)Monitoring-driven эксплуатация (rootconf2015)
Monitoring-driven эксплуатация (rootconf2015)
 
переезд мониторинга
переезд мониторингапереезд мониторинга
переезд мониторинга
 
Microsoft и Linux на одном проекте: как получить лучшее из обоих миров и не р...
Microsoft и Linux на одном проекте: как получить лучшее из обоих миров и не р...Microsoft и Linux на одном проекте: как получить лучшее из обоих миров и не р...
Microsoft и Linux на одном проекте: как получить лучшее из обоих миров и не р...
 
«Тотальный контроль производительности» Михаил Юматов, ЦИАН
«Тотальный контроль производительности» Михаил Юматов, ЦИАН«Тотальный контроль производительности» Михаил Юматов, ЦИАН
«Тотальный контроль производительности» Михаил Юматов, ЦИАН
 
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
 
Zabbix v2
Zabbix v2Zabbix v2
Zabbix v2
 
Максим Барышников, Что такое типовые проблемы нагруженных проектов и как их р...
Максим Барышников, Что такое типовые проблемы нагруженных проектов и как их р...Максим Барышников, Что такое типовые проблемы нагруженных проектов и как их р...
Максим Барышников, Что такое типовые проблемы нагруженных проектов и как их р...
 
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)
Как обслужить 60 миллионов абонентов, Артем Руфанов (ПЕТЕР-СЕРВИС)
 
Веб-разработка без наркотиков с помощью PostgreSQL, Nginx и c2h5oh / Миша Кир...
Веб-разработка без наркотиков с помощью PostgreSQL, Nginx и c2h5oh / Миша Кир...Веб-разработка без наркотиков с помощью PostgreSQL, Nginx и c2h5oh / Миша Кир...
Веб-разработка без наркотиков с помощью PostgreSQL, Nginx и c2h5oh / Миша Кир...
 
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
NVMf: 5 млн IOPS по сети своими руками / Андрей Николаенко (IBS)
 
Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)
Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)
Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)
 

Similar a Как обычно происходит внедрение мониторинга с нуля

SECON'2017, Сивко Николай, Эксплуатация веб-проектов: мониторинг
SECON'2017, Сивко Николай, Эксплуатация веб-проектов: мониторингSECON'2017, Сивко Николай, Эксплуатация веб-проектов: мониторинг
SECON'2017, Сивко Николай, Эксплуатация веб-проектов: мониторингSECON
 
Доклад "Мониторинг серверных приложений"
Доклад "Мониторинг серверных приложений"Доклад "Мониторинг серверных приложений"
Доклад "Мониторинг серверных приложений"Grigoriy Orlov
 
Хорошо поддерживаемое в продакшне приложение / Николай Сивко (okmeter.io)
Хорошо поддерживаемое в продакшне приложение / Николай Сивко (okmeter.io)Хорошо поддерживаемое в продакшне приложение / Николай Сивко (okmeter.io)
Хорошо поддерживаемое в продакшне приложение / Николай Сивко (okmeter.io)Ontico
 
Allure framework. Пример настройки исчерпывающего репорта на реальном проекте
Allure framework. Пример настройки исчерпывающего репорта на реальном проектеAllure framework. Пример настройки исчерпывающего репорта на реальном проекте
Allure framework. Пример настройки исчерпывающего репорта на реальном проектеCOMAQA.BY
 
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)Ontico
 
Жизнь проекта на production
Жизнь проекта на productionЖизнь проекта на production
Жизнь проекта на productionNikolay Sivko
 
Gnevshev мониторинг
Gnevshev   мониторингGnevshev   мониторинг
Gnevshev мониторингkuchinskaya
 
Чему мы научились, разрабатывая микросервисы / Вадим Мадисон (RuTube)
Чему мы научились, разрабатывая микросервисы / Вадим Мадисон (RuTube)Чему мы научились, разрабатывая микросервисы / Вадим Мадисон (RuTube)
Чему мы научились, разрабатывая микросервисы / Вадим Мадисон (RuTube)Ontico
 
Чему мы научились разрабатывая микросервисы?
Чему мы научились разрабатывая микросервисы?Чему мы научились разрабатывая микросервисы?
Чему мы научились разрабатывая микросервисы?Vadim Madison
 
Мониторинг качества работы вашего проекта
Мониторинг качества работы вашего проектаМониторинг качества работы вашего проекта
Мониторинг качества работы вашего проектаNikolay Sivko
 
Эксплуатация container-based-инфраструктур / Николай Сивко (okmeter.io)
Эксплуатация container-based-инфраструктур / Николай Сивко (okmeter.io)Эксплуатация container-based-инфраструктур / Николай Сивко (okmeter.io)
Эксплуатация container-based-инфраструктур / Николай Сивко (okmeter.io)Ontico
 
Разработка high load системы на .NET Core
Разработка high load системы на .NET CoreРазработка high load системы на .NET Core
Разработка high load системы на .NET CoreAndrew Gubskiy
 
Xp days 2019 - Why startups need SRE practices
Xp days 2019 - Why startups need SRE practicesXp days 2019 - Why startups need SRE practices
Xp days 2019 - Why startups need SRE practicesAlexey Andreev
 
Введение в performance management
Введение в performance managementВведение в performance management
Введение в performance managementSQALab
 
Руководство по формату событий для разработчиков
Руководство по формату событий для разработчиковРуководство по формату событий для разработчиков
Руководство по формату событий для разработчиковOlesya Shelestova
 
QA Fest 2015. Александра Волкова. 10 принципов автоматизации, которые я не пр...
QA Fest 2015. Александра Волкова. 10 принципов автоматизации, которые я не пр...QA Fest 2015. Александра Волкова. 10 принципов автоматизации, которые я не пр...
QA Fest 2015. Александра Волкова. 10 принципов автоматизации, которые я не пр...QAFest
 
Доклад Ильи Кудинова на DevConf 2013. "Организация автоматизированного тестир...
Доклад Ильи Кудинова на DevConf 2013. "Организация автоматизированного тестир...Доклад Ильи Кудинова на DevConf 2013. "Организация автоматизированного тестир...
Доклад Ильи Кудинова на DevConf 2013. "Организация автоматизированного тестир...Badoo Development
 

Similar a Как обычно происходит внедрение мониторинга с нуля (20)

SECON'2017, Сивко Николай, Эксплуатация веб-проектов: мониторинг
SECON'2017, Сивко Николай, Эксплуатация веб-проектов: мониторингSECON'2017, Сивко Николай, Эксплуатация веб-проектов: мониторинг
SECON'2017, Сивко Николай, Эксплуатация веб-проектов: мониторинг
 
Доклад "Мониторинг серверных приложений"
Доклад "Мониторинг серверных приложений"Доклад "Мониторинг серверных приложений"
Доклад "Мониторинг серверных приложений"
 
Хорошо поддерживаемое в продакшне приложение / Николай Сивко (okmeter.io)
Хорошо поддерживаемое в продакшне приложение / Николай Сивко (okmeter.io)Хорошо поддерживаемое в продакшне приложение / Николай Сивко (okmeter.io)
Хорошо поддерживаемое в продакшне приложение / Николай Сивко (okmeter.io)
 
Sivko
SivkoSivko
Sivko
 
Allure framework. Пример настройки исчерпывающего репорта на реальном проекте
Allure framework. Пример настройки исчерпывающего репорта на реальном проектеAllure framework. Пример настройки исчерпывающего репорта на реальном проекте
Allure framework. Пример настройки исчерпывающего репорта на реальном проекте
 
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)
Жизнь проекта на production советы по эксплуатации / Николай Сивко (okmeter.io)
 
Жизнь проекта на production
Жизнь проекта на productionЖизнь проекта на production
Жизнь проекта на production
 
Gnevshev мониторинг
Gnevshev   мониторингGnevshev   мониторинг
Gnevshev мониторинг
 
Чему мы научились, разрабатывая микросервисы / Вадим Мадисон (RuTube)
Чему мы научились, разрабатывая микросервисы / Вадим Мадисон (RuTube)Чему мы научились, разрабатывая микросервисы / Вадим Мадисон (RuTube)
Чему мы научились, разрабатывая микросервисы / Вадим Мадисон (RuTube)
 
Чему мы научились разрабатывая микросервисы?
Чему мы научились разрабатывая микросервисы?Чему мы научились разрабатывая микросервисы?
Чему мы научились разрабатывая микросервисы?
 
Автоматизация бизнес-процессов, электронного документооборота и архивного хра...
Автоматизация бизнес-процессов, электронного документооборота и архивного хра...Автоматизация бизнес-процессов, электронного документооборота и архивного хра...
Автоматизация бизнес-процессов, электронного документооборота и архивного хра...
 
Мониторинг качества работы вашего проекта
Мониторинг качества работы вашего проектаМониторинг качества работы вашего проекта
Мониторинг качества работы вашего проекта
 
Эксплуатация container-based-инфраструктур / Николай Сивко (okmeter.io)
Эксплуатация container-based-инфраструктур / Николай Сивко (okmeter.io)Эксплуатация container-based-инфраструктур / Николай Сивко (okmeter.io)
Эксплуатация container-based-инфраструктур / Николай Сивко (okmeter.io)
 
Разработка high load системы на .NET Core
Разработка high load системы на .NET CoreРазработка high load системы на .NET Core
Разработка high load системы на .NET Core
 
Xp days 2019 - Why startups need SRE practices
Xp days 2019 - Why startups need SRE practicesXp days 2019 - Why startups need SRE practices
Xp days 2019 - Why startups need SRE practices
 
Введение в performance management
Введение в performance managementВведение в performance management
Введение в performance management
 
Free RvSIEM. Intro (Rus)
Free RvSIEM. Intro (Rus)Free RvSIEM. Intro (Rus)
Free RvSIEM. Intro (Rus)
 
Руководство по формату событий для разработчиков
Руководство по формату событий для разработчиковРуководство по формату событий для разработчиков
Руководство по формату событий для разработчиков
 
QA Fest 2015. Александра Волкова. 10 принципов автоматизации, которые я не пр...
QA Fest 2015. Александра Волкова. 10 принципов автоматизации, которые я не пр...QA Fest 2015. Александра Волкова. 10 принципов автоматизации, которые я не пр...
QA Fest 2015. Александра Волкова. 10 принципов автоматизации, которые я не пр...
 
Доклад Ильи Кудинова на DevConf 2013. "Организация автоматизированного тестир...
Доклад Ильи Кудинова на DevConf 2013. "Организация автоматизированного тестир...Доклад Ильи Кудинова на DevConf 2013. "Организация автоматизированного тестир...
Доклад Ильи Кудинова на DevConf 2013. "Организация автоматизированного тестир...
 

Más de Uptime community

Евгений Потапов / ITSumma — Менеджмент инцидентов и исследование жизненного ц...
Евгений Потапов / ITSumma — Менеджмент инцидентов и исследование жизненного ц...Евгений Потапов / ITSumma — Менеджмент инцидентов и исследование жизненного ц...
Евгений Потапов / ITSumma — Менеджмент инцидентов и исследование жизненного ц...Uptime community
 
Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...
Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...
Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...Uptime community
 
Как устроен мониторинг в Badoo
Как устроен мониторинг в BadooКак устроен мониторинг в Badoo
Как устроен мониторинг в BadooUptime community
 
Эффективная техподдержка 24х7: инструкция по применению
Эффективная техподдержка 24х7: инструкция по применениюЭффективная техподдержка 24х7: инструкция по применению
Эффективная техподдержка 24х7: инструкция по применениюUptime community
 
Мониторинг, когда не тестируешь
Мониторинг, когда не тестируешьМониторинг, когда не тестируешь
Мониторинг, когда не тестируешьUptime community
 
Стриминг мониторинга
Стриминг мониторингаСтриминг мониторинга
Стриминг мониторингаUptime community
 
Изобретая колесо: как мы писали свой мониторинг
Изобретая колесо: как мы писали свой мониторингИзобретая колесо: как мы писали свой мониторинг
Изобретая колесо: как мы писали свой мониторингUptime community
 

Más de Uptime community (7)

Евгений Потапов / ITSumma — Менеджмент инцидентов и исследование жизненного ц...
Евгений Потапов / ITSumma — Менеджмент инцидентов и исследование жизненного ц...Евгений Потапов / ITSumma — Менеджмент инцидентов и исследование жизненного ц...
Евгений Потапов / ITSumma — Менеджмент инцидентов и исследование жизненного ц...
 
Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...
Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...
Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуаль...
 
Как устроен мониторинг в Badoo
Как устроен мониторинг в BadooКак устроен мониторинг в Badoo
Как устроен мониторинг в Badoo
 
Эффективная техподдержка 24х7: инструкция по применению
Эффективная техподдержка 24х7: инструкция по применениюЭффективная техподдержка 24х7: инструкция по применению
Эффективная техподдержка 24х7: инструкция по применению
 
Мониторинг, когда не тестируешь
Мониторинг, когда не тестируешьМониторинг, когда не тестируешь
Мониторинг, когда не тестируешь
 
Стриминг мониторинга
Стриминг мониторингаСтриминг мониторинга
Стриминг мониторинга
 
Изобретая колесо: как мы писали свой мониторинг
Изобретая колесо: как мы писали свой мониторингИзобретая колесо: как мы писали свой мониторинг
Изобретая колесо: как мы писали свой мониторинг
 

Как обычно происходит внедрение мониторинга с нуля