SlideShare una empresa de Scribd logo
1 de 37
Descargar para leer sin conexión
ZABBIX В СЕРВИСНОЙ
КОМПАНИИ
Нестеров Вадим
…Так кто ж ты, MonOps?
— Я - часть той силы, что вечно
хочет зла и вечно совершает
благо.
• Все само себя 

не замониторит
• Кнопка «сделай мне зашибись» не
случится
• Monitoring Operations (MonOps) -
это РАЗРАБОТКА решения
мониторинга 

под конкретный проект
• Мониторинг - это дорого!
• Постоянный процесс разработки
СПАСИБО, КЭП!
• услуги IT-аутсорсинга
• эксплуатация государственных информационных
систем федерального значения
• облачные услуги OnCloud.ru
• в компании нет разработчиков, только системные
администраторы
КОМПАНИЯ ОНЛАНТА
ZABBIX В ОНЛАНТА
• гос проект с посещаемостью 350 000 в сутки
• OnCloud - облачный хостинг, 600 ВМ enterprise level
ZABBIX В ОНЛАНТА
• гос проект
Мониторинг — непрерывный процесс наблюдения и регистрации
параметров объекта, в сравнении с заданными критериями.
сбор метрик
соответствие

граничным

условиям
информирование
(alerting)
1 2 3
МОНИТОРИНГ
визуализация данных: графики, комплексные экраны



ЭТО АНАЛИТИКА
НЕ МОНИТОРИНГ
ИДЕАЛЬНЫЙ МОНИТОРИНГ
• 1 метрика - 1 адекватный триггер
• если для метрики нет триггера - значит она не 

нужна в системе мониторинга
SysOps
DevOps NOC
Бизнес

SLA
ДС
DBA
Аналитика
MonOps
ЗАКАЗЧИКИ МОНИТОРИНГА
• Эксперты определяют граничные условия, интервал, и необходимость в оповещении
• Zabbix — это всегда +сотрудник ДС, никаких СМС, приятно услышать человека
который знает, что точно случилось в 4 утра :)
• Делайте удобно для ДС: четкая инструкция в описание триггера, что делать.

Если можно починить пусть чинят (если это обходное решение), если нет то пусть
звонят эксперту
• Ссылку на базу знаний
• Меньше графиков, больше толковых триггеров. 

Визуальный мониторинг - быстрый путь к НШС, считайте, что у вас нет мониторинга
• Используйте LLD везде - это унификация и если вы играете в квест с
разработчиками
• 1 сервер
• 2 х 12 -cores Intel Xeon CPU X5675 @ 3.07GHz
• 16 GB RAM
•   СХД
• 1000 - 1200  NVPS
• MariaDB 10 +TokuDB + nginx + php-fpm
• tokudb_row_format = tokudb_lzma (жмет хорошо, но долго читает)
• NO housekeeper + partitioning
• ВМ Zabbix Proxy + ODBC Oracle
АРХИТЕКТУРА REV.1
• oVirt (KVM) кластер из 3 нод (ручной HA - БД не переедет автоматом)
• 1 сервер: 2 x 24 core Intel(R) Xeon(R) CPU E5-2697 v2 @ 2.70GHz, 386 GB RAM
• 2 сервера: 2 х 12 core Intel Xeon CPU X5675 @ 3.07GHz, 16 GB RAM
• VMs: ZDB (64GB), ZABBIX(8 GB), ZMONITOR(8GB)
• СХД
• 2200  NVPS
• history* - 31 день, trends* - 2 года
• размер базы: 170 Гб
• MariaDB 10 +TokuDB + nginx + php-fpm
• tokudb_row_format = tokudb_zlib
• ВМ Zabbix Proxy + ODBC Oracle
АРХИТЕКТУРА REV.2
• MariaDB 10 +TokuDB 7.5
• write optimized
• no locks
• row compression: zlib, lzma (6x < InnoDB)
• no slave lag
• hot backup > 7.5.5 (MariaDB 10.0.20)
• clustering indexes
ZABBIX BACKEND
my.cnf:
datadir=/data/mysql

tokudb_data_dir=/data/tokudb #удобно

tmpdir=/ramtmp #для select distinct 



plugin-load = ha_tokudb

#tokudb_cache_size = # default: 50% RAM

#tokudb_directio = OFF
query_cache_type = 1 # + 5min event: FLUSH QUERY CACHE

query_cache_size = 32M # + 30min event: RESET QUERY CACHE

query_cache_limit=32M #
#обязательно(!) иначе будут очень долгие select’ы

optimizer_switch=index_condition_pushdown=off
ZABBIX BACKEND
net.ipv4.ip_local_port_range = 10000 65535

net.ipv4.tcp_fin_timeout = 5

net.ipv4.tcp_tw_reuse=1



net.netfilter.nf_conntrack_max=1048576



kernel.msgmni = 1024

kernel.sem = 250 256000 32 1024
sysctl.conf
CacheSize= 512M
HistoryCacheSize=512M
TrendCacheSize=512M
HistoryTextCacheSize=512M
ValueCacheSize=512M
zabbix_server.conf
ZABBIX SERVER
php-fpm:

pm = static

pm.max_children = 450
nginx + php-fpm + opcache
// permission check
if ($userType != USER_TYPE_SUPER_ADMIN && !$options['nopermissions']) {
$permission = $options['editable'] ? PERM_READ_WRITE : PERM_READ;
$userGroups = getUserGroupsByUserId($userid);
// check permissions by graph items
/* PATCH: TOO LONG GRAPHS QUERIES
$sqlParts['where'][] = 'NOT EXISTS ('.
'SELECT NULL'.
' FROM graphs_items gi,items i,hosts_groups hgg'.
' LEFT JOIN rights r'.
' ON r.id=hgg.groupid'.
' AND '.dbConditionInt('r.groupid', $userGroups).
' WHERE g.graphid=gi.graphid'.
' AND gi.itemid=i.itemid'.
' AND i.hostid=hgg.hostid'.
' GROUP BY i.hostid'.
' HAVING MAX(permission)<'.zbx_dbstr($permission).
' OR MIN(permission) IS NULL'.
' OR MIN(permission)='.PERM_DENY.
')';
/include/classes/api/services/CGraph.php
php: 

memory_limit = 512M

opcache.enable =1
ZABBIX FRONTEND
• Все в CSV
• схема с процедурами партиционирования: 



$MYSQLDUMP --no-data --events --routines
• все таблицы кроме исторических:



$MYSQLDUMP --opt --compact --no-create-info 

--tab=${DB_TABLE_DIR} $db $tb
• history и trends по партициям:



SELECT * FROM $tb PARTITION (${PART}) INTO OUTFILE '$FILE'

DB BACKUP
1. backup только конфигурации, без истории и трендов
2. создаем базу zabbix_lite из бэкапа на шаге1
3. перенастриваем zabbix_server на zabbix_lite
4. поднимаем zabbix_server новой версии наVM, настраиваем на обновляемую базу
5. проходим по логам процедуру обновления БД, в основном это ALTERTABLE …
ENGINE=«TokuDB» 



+смотрим, что он там делает

src/libs/zbxdbupgrade/dbupgrade.c
6. обновляем основной zabbix_server
7. стартуем на обнолвенной базе
ПРОЦЕСС ОБНОВЛЕНИЯ ZABBIX SERVER
1. пользовательские сценарии по сайту + личный кабинет через wget_gost
2. AIX, Linux,Windows
3. много WebSphere + Zorka.io (heap, GC)
4. Oracle: tablespaces, jobs, replication, бизнес метрики приложения (все на  LLD)
5. работу сервисов: nginx, apache, mongodb, tomcat, …
6. cpu, ram, swap, iostat
7. сертификаты
8. не любим crontab и UserParameter — любим system.run[]
ЧТО МОНИТОРИМ
CASE: ОТЧЕТ О ДОСТУПНОСТИ ВИРТУАЛИЗАЦИИ
…
LUN 1 LUN 2 LUN 3
LUN 1 LUN 2 LUN 3
Задача: сформировать отчет для каждой ВМ заказчика по интегральной метрике
доступности гипервизора, СХД и сети.
boarder router
FAST: pyVmomi — Python SDK for theVMware vSphere API

SLOW: VMware Perl SDK
НОВОЕ LLD ДЛЯ ОБНАРУЖЕНИЯVM
ПРОВЕРКА ДОСТУПНОСТИ СЕТИ
/usr/lib/zabbix/externalscripts/vm.zm.boarder
/tmp/vminfo.file
ПРОВЕРКА ДОСТУПНОСТИ СХД
/usr/lib/zabbix/externalscripts/vm.zm.datastore
/tmp/vminfo.file
ПРОВЕРКА ДОСТУПНОСТИ ГИПЕРВИЗОРА
/usr/lib/zabbix/externalscripts/vm.zm.hyper
ТРИГГЕРЫ ДОСТУПНОСТИ
ОТЧЕТ
ОТЧЕТ
CASE: ODBC LLD
Задача: создать шаблон автоматического обнаружения метрик приложений 

на WebSphere application server
• имеем в наличии 120 серверов приложений
• сервера пишут статистику в Oracle
• получаем значения метрик через db.odbc.select[]
• функционал опроса БД вынесен на Zabbix Proxy
extrenalscripts/odbc.***.publish.discovery
extrenalscripts/odbc.***.publish.discovery
СЛАБЫЕ МЕСТА ODBC
• Нет отдельного процесса под проверки — иногда коннект к базе может быть
долгий, отнимается целый poller
• Одна проверка — одно новое соединение

NO connection pooling — не кэшируют соединения, Ваши DBA будут
счастливы
• Нельзя сделать такое:

SELECT 

PERCENTILE_CONT(0.1) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_10,

PERCENTILE_CONT(0.2) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_20,

PERCENTILE_CONT(0.3) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_30,

PERCENTILE_CONT(0.4) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_40, 

PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_50, 

PERCENTILE_CONT(0.6) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_60, 

PERCENTILE_CONT(0.7) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_70, 

PERCENTILE_CONT(0.8) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_80, 

PERCENTILE_CONT(0.9) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_90
ССЫЛКИ
• Лучший доклад про мониторинг на RootConf 2015

Monitoring-driven эксплуатация.  Николай Сивко hh.ru

http://goo.gl/HDI86X
• Мониторинг базы данных Oracle через ODBC в Zabbix

http://habrahabr.ru/post/226365/
• pyVmomi is the Python SDK for theVMware vSphere API

https://github.com/vmware/pyvmomi
ВОПРОСЫ?

Más contenido relacionado

La actualidad más candente

Инфраструктура распределенных приложений на nodejs / Станислав Гуменюк (Rambl...
Инфраструктура распределенных приложений на nodejs / Станислав Гуменюк (Rambl...Инфраструктура распределенных приложений на nodejs / Станислав Гуменюк (Rambl...
Инфраструктура распределенных приложений на nodejs / Станислав Гуменюк (Rambl...Ontico
 
мониторинг производительности Web приложений на python
мониторинг производительности Web приложений на pythonмониторинг производительности Web приложений на python
мониторинг производительности Web приложений на pythonSlach
 
Мониторинг в высоконагруженных (и не только) проектах: сравнительный анализ с...
Мониторинг в высоконагруженных (и не только) проектах: сравнительный анализ с...Мониторинг в высоконагруженных (и не только) проектах: сравнительный анализ с...
Мониторинг в высоконагруженных (и не только) проектах: сравнительный анализ с...Anton Baranov
 
обзор архитектуры и подсистем деплоя и мониторинга
обзор архитектуры и подсистем деплоя и мониторингаобзор архитектуры и подсистем деплоя и мониторинга
обзор архитектуры и подсистем деплоя и мониторингаКонстантин Никифоров
 
Как не положить тысячи серверов с помощью системы централизованного управлени...
Как не положить тысячи серверов с помощью системы централизованного управлени...Как не положить тысячи серверов с помощью системы централизованного управлени...
Как не положить тысячи серверов с помощью системы централизованного управлени...Ontico
 
мониторинг производительности приложения на PINBA
мониторинг производительности приложения на PINBAмониторинг производительности приложения на PINBA
мониторинг производительности приложения на PINBASlach
 
Переезжаем с Zabbix на Prometheus / Василий Озеров (fevlake)
Переезжаем с Zabbix на Prometheus / Василий Озеров (fevlake)Переезжаем с Zabbix на Prometheus / Василий Озеров (fevlake)
Переезжаем с Zabbix на Prometheus / Василий Озеров (fevlake)Ontico
 
Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015
Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015
Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015Zabbix
 
Автоматизация нагрузочного тестирования в связке JMeter + TeamСity + Grafana ...
Автоматизация нагрузочного тестирования в связке JMeter + TeamСity + Grafana ...Автоматизация нагрузочного тестирования в связке JMeter + TeamСity + Grafana ...
Автоматизация нагрузочного тестирования в связке JMeter + TeamСity + Grafana ...Positive Hack Days
 
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...Ontico
 
Дизайн REST API для высокопроизводительных систем / Александр Лебедев (Новые ...
Дизайн REST API для высокопроизводительных систем / Александр Лебедев (Новые ...Дизайн REST API для высокопроизводительных систем / Александр Лебедев (Новые ...
Дизайн REST API для высокопроизводительных систем / Александр Лебедев (Новые ...Ontico
 
Monitoring driven эксплуатация / Николай Сивко (HeadHunter)
Monitoring driven эксплуатация / Николай Сивко (HeadHunter)Monitoring driven эксплуатация / Николай Сивко (HeadHunter)
Monitoring driven эксплуатация / Николай Сивко (HeadHunter)Ontico
 
Порядок для скорости. Система структурирования фронтендовой части веб-приложе...
Порядок для скорости. Система структурирования фронтендовой части веб-приложе...Порядок для скорости. Система структурирования фронтендовой части веб-приложе...
Порядок для скорости. Система структурирования фронтендовой части веб-приложе...Ontico
 
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...Ontico
 
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...Ontico
 
«Путь от монолита на PHP к микросервисам на Scala» – Денис Иванов, 2ГИС
«Путь от монолита на PHP к микросервисам на Scala» – Денис Иванов, 2ГИС «Путь от монолита на PHP к микросервисам на Scala» – Денис Иванов, 2ГИС
«Путь от монолита на PHP к микросервисам на Scala» – Денис Иванов, 2ГИС 2ГИС Технологии
 
Как devops исчерпывает себя, и что будет дальше / Кирилл Вечера (Jetware)
Как devops исчерпывает себя, и что будет дальше / Кирилл Вечера (Jetware)Как devops исчерпывает себя, и что будет дальше / Кирилл Вечера (Jetware)
Как devops исчерпывает себя, и что будет дальше / Кирилл Вечера (Jetware)Ontico
 
NAS, Predictions, Preloading, Presudo-Isomorphism / Охрименко Алексей (Acronis)
NAS, Predictions, Preloading, Presudo-Isomorphism / Охрименко Алексей (Acronis)NAS, Predictions, Preloading, Presudo-Isomorphism / Охрименко Алексей (Acronis)
NAS, Predictions, Preloading, Presudo-Isomorphism / Охрименко Алексей (Acronis)Ontico
 
Общая концепция системы развёртывания серверного окружения на базе SaltStack ...
Общая концепция системы развёртывания серверного окружения на базе SaltStack ...Общая концепция системы развёртывания серверного окружения на базе SaltStack ...
Общая концепция системы развёртывания серверного окружения на базе SaltStack ...Positive Hack Days
 

La actualidad más candente (20)

Инфраструктура распределенных приложений на nodejs / Станислав Гуменюк (Rambl...
Инфраструктура распределенных приложений на nodejs / Станислав Гуменюк (Rambl...Инфраструктура распределенных приложений на nodejs / Станислав Гуменюк (Rambl...
Инфраструктура распределенных приложений на nodejs / Станислав Гуменюк (Rambl...
 
мониторинг производительности Web приложений на python
мониторинг производительности Web приложений на pythonмониторинг производительности Web приложений на python
мониторинг производительности Web приложений на python
 
Мониторинг в высоконагруженных (и не только) проектах: сравнительный анализ с...
Мониторинг в высоконагруженных (и не только) проектах: сравнительный анализ с...Мониторинг в высоконагруженных (и не только) проектах: сравнительный анализ с...
Мониторинг в высоконагруженных (и не только) проектах: сравнительный анализ с...
 
обзор архитектуры и подсистем деплоя и мониторинга
обзор архитектуры и подсистем деплоя и мониторингаобзор архитектуры и подсистем деплоя и мониторинга
обзор архитектуры и подсистем деплоя и мониторинга
 
Как не положить тысячи серверов с помощью системы централизованного управлени...
Как не положить тысячи серверов с помощью системы централизованного управлени...Как не положить тысячи серверов с помощью системы централизованного управлени...
Как не положить тысячи серверов с помощью системы централизованного управлени...
 
мониторинг производительности приложения на PINBA
мониторинг производительности приложения на PINBAмониторинг производительности приложения на PINBA
мониторинг производительности приложения на PINBA
 
Переезжаем с Zabbix на Prometheus / Василий Озеров (fevlake)
Переезжаем с Zabbix на Prometheus / Василий Озеров (fevlake)Переезжаем с Zabbix на Prometheus / Василий Озеров (fevlake)
Переезжаем с Zabbix на Prometheus / Василий Озеров (fevlake)
 
Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015
Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015
Zabbix и правильное обнаружение проблем - Алексей Владышев @ RootConf 2015
 
Автоматизация нагрузочного тестирования в связке JMeter + TeamСity + Grafana ...
Автоматизация нагрузочного тестирования в связке JMeter + TeamСity + Grafana ...Автоматизация нагрузочного тестирования в связке JMeter + TeamСity + Grafana ...
Автоматизация нагрузочного тестирования в связке JMeter + TeamСity + Grafana ...
 
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...
Мастер-класс "Микросервисы: удобно, надежно, серебрянопульно" / Евгений Павло...
 
Дизайн REST API для высокопроизводительных систем / Александр Лебедев (Новые ...
Дизайн REST API для высокопроизводительных систем / Александр Лебедев (Новые ...Дизайн REST API для высокопроизводительных систем / Александр Лебедев (Новые ...
Дизайн REST API для высокопроизводительных систем / Александр Лебедев (Новые ...
 
RootConf 2015
RootConf 2015RootConf 2015
RootConf 2015
 
Monitoring driven эксплуатация / Николай Сивко (HeadHunter)
Monitoring driven эксплуатация / Николай Сивко (HeadHunter)Monitoring driven эксплуатация / Николай Сивко (HeadHunter)
Monitoring driven эксплуатация / Николай Сивко (HeadHunter)
 
Порядок для скорости. Система структурирования фронтендовой части веб-приложе...
Порядок для скорости. Система структурирования фронтендовой части веб-приложе...Порядок для скорости. Система структурирования фронтендовой части веб-приложе...
Порядок для скорости. Система структурирования фронтендовой части веб-приложе...
 
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
 
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
 
«Путь от монолита на PHP к микросервисам на Scala» – Денис Иванов, 2ГИС
«Путь от монолита на PHP к микросервисам на Scala» – Денис Иванов, 2ГИС «Путь от монолита на PHP к микросервисам на Scala» – Денис Иванов, 2ГИС
«Путь от монолита на PHP к микросервисам на Scala» – Денис Иванов, 2ГИС
 
Как devops исчерпывает себя, и что будет дальше / Кирилл Вечера (Jetware)
Как devops исчерпывает себя, и что будет дальше / Кирилл Вечера (Jetware)Как devops исчерпывает себя, и что будет дальше / Кирилл Вечера (Jetware)
Как devops исчерпывает себя, и что будет дальше / Кирилл Вечера (Jetware)
 
NAS, Predictions, Preloading, Presudo-Isomorphism / Охрименко Алексей (Acronis)
NAS, Predictions, Preloading, Presudo-Isomorphism / Охрименко Алексей (Acronis)NAS, Predictions, Preloading, Presudo-Isomorphism / Охрименко Алексей (Acronis)
NAS, Predictions, Preloading, Presudo-Isomorphism / Охрименко Алексей (Acronis)
 
Общая концепция системы развёртывания серверного окружения на базе SaltStack ...
Общая концепция системы развёртывания серверного окружения на базе SaltStack ...Общая концепция системы развёртывания серверного окружения на базе SaltStack ...
Общая концепция системы развёртывания серверного окружения на базе SaltStack ...
 

Destacado

Автоматизация мониторинга распределенной сети подразделений
Автоматизация мониторинга распределенной сети подразделенийАвтоматизация мониторинга распределенной сети подразделений
Автоматизация мониторинга распределенной сети подразделенийBadoo Development
 
С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).
С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo). С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).
С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo). Badoo Development
 
Реалтайм статистика скорости работы нативных и веб-приложений у реальных поль...
Реалтайм статистика скорости работы нативных и веб-приложений у реальных поль...Реалтайм статистика скорости работы нативных и веб-приложений у реальных поль...
Реалтайм статистика скорости работы нативных и веб-приложений у реальных поль...Badoo Development
 
Zabbix Rootconf2009
Zabbix Rootconf2009Zabbix Rootconf2009
Zabbix Rootconf2009Liudmila Li
 
Zabbix 3.0 что дальше
Zabbix 3.0 что дальше Zabbix 3.0 что дальше
Zabbix 3.0 что дальше Badoo Development
 
Zabbix в badoo, от lld к super discovery
Zabbix в badoo, от lld к super discoveryZabbix в badoo, от lld к super discovery
Zabbix в badoo, от lld к super discoveryBadoo Development
 
Pavel Amosov - Zabbix 3.0: эволюция интерфейса
Pavel Amosov - Zabbix 3.0: эволюция интерфейсаPavel Amosov - Zabbix 3.0: эволюция интерфейса
Pavel Amosov - Zabbix 3.0: эволюция интерфейсаZabbix
 
Ложка дёгтя – Александр Лэйн, QIWI, Zabbix Moscow Meetup 2016
Ложка дёгтя – Александр Лэйн, QIWI, Zabbix Moscow Meetup 2016Ложка дёгтя – Александр Лэйн, QIWI, Zabbix Moscow Meetup 2016
Ложка дёгтя – Александр Лэйн, QIWI, Zabbix Moscow Meetup 2016Alexander Leyn
 
Introduction to Zabbix - Company, Product, Services and Use Cases
Introduction to Zabbix - Company, Product, Services and Use CasesIntroduction to Zabbix - Company, Product, Services and Use Cases
Introduction to Zabbix - Company, Product, Services and Use CasesZabbix
 
Continuous deployment Smartling event
Continuous deployment Smartling eventContinuous deployment Smartling event
Continuous deployment Smartling eventViktoriya Pridatko
 
Continuous Deployment (in Russian)
Continuous Deployment  (in Russian)Continuous Deployment  (in Russian)
Continuous Deployment (in Russian)Smartling
 
Пётр Зайцев, Percona
Пётр Зайцев, PerconaПётр Зайцев, Percona
Пётр Зайцев, PerconaOntico
 
Визуальная аналитика на страже информационной безопасности
Визуальная аналитика на страже информационной безопасностиВизуальная аналитика на страже информационной безопасности
Визуальная аналитика на страже информационной безопасностиPositive Hack Days
 
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft Azure
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft AzureJelastic PaaS for DevOps: Hybrid Cloud based on Microsoft Azure
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft AzureDmitry Lazarenko
 
Zabbix 3.2 - мониторинг качественно нового уровня / Алексей Владышев (Zabbix)
Zabbix 3.2 - мониторинг качественно нового уровня / Алексей Владышев (Zabbix)Zabbix 3.2 - мониторинг качественно нового уровня / Алексей Владышев (Zabbix)
Zabbix 3.2 - мониторинг качественно нового уровня / Алексей Владышев (Zabbix)Ontico
 
Путь мониторинга: модульность, гибкость, devops / Всеволод Поляков (Grammarly)
Путь мониторинга: модульность, гибкость, devops / Всеволод Поляков (Grammarly)Путь мониторинга: модульность, гибкость, devops / Всеволод Поляков (Grammarly)
Путь мониторинга: модульность, гибкость, devops / Всеволод Поляков (Grammarly)Ontico
 
Zabbix Performance Tuning
Zabbix Performance TuningZabbix Performance Tuning
Zabbix Performance TuningRicardo Santos
 
Внедрение Docker в процесс разработки демонов. Доклад Константина Карпова на ...
Внедрение Docker в процесс разработки демонов. Доклад Константина Карпова на ...Внедрение Docker в процесс разработки демонов. Доклад Константина Карпова на ...
Внедрение Docker в процесс разработки демонов. Доклад Константина Карпова на ...Badoo Development
 
QaAPI. Взгляд на тестирование с другой стороны баррикад. Доклад Дмитрия Марущ...
QaAPI. Взгляд на тестирование с другой стороны баррикад. Доклад Дмитрия Марущ...QaAPI. Взгляд на тестирование с другой стороны баррикад. Доклад Дмитрия Марущ...
QaAPI. Взгляд на тестирование с другой стороны баррикад. Доклад Дмитрия Марущ...Badoo Development
 

Destacado (20)

Grafana zabbix
Grafana zabbixGrafana zabbix
Grafana zabbix
 
Автоматизация мониторинга распределенной сети подразделений
Автоматизация мониторинга распределенной сети подразделенийАвтоматизация мониторинга распределенной сети подразделений
Автоматизация мониторинга распределенной сети подразделений
 
С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).
С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo). С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).
С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).
 
Реалтайм статистика скорости работы нативных и веб-приложений у реальных поль...
Реалтайм статистика скорости работы нативных и веб-приложений у реальных поль...Реалтайм статистика скорости работы нативных и веб-приложений у реальных поль...
Реалтайм статистика скорости работы нативных и веб-приложений у реальных поль...
 
Zabbix Rootconf2009
Zabbix Rootconf2009Zabbix Rootconf2009
Zabbix Rootconf2009
 
Zabbix 3.0 что дальше
Zabbix 3.0 что дальше Zabbix 3.0 что дальше
Zabbix 3.0 что дальше
 
Zabbix в badoo, от lld к super discovery
Zabbix в badoo, от lld к super discoveryZabbix в badoo, от lld к super discovery
Zabbix в badoo, от lld к super discovery
 
Pavel Amosov - Zabbix 3.0: эволюция интерфейса
Pavel Amosov - Zabbix 3.0: эволюция интерфейсаPavel Amosov - Zabbix 3.0: эволюция интерфейса
Pavel Amosov - Zabbix 3.0: эволюция интерфейса
 
Ложка дёгтя – Александр Лэйн, QIWI, Zabbix Moscow Meetup 2016
Ложка дёгтя – Александр Лэйн, QIWI, Zabbix Moscow Meetup 2016Ложка дёгтя – Александр Лэйн, QIWI, Zabbix Moscow Meetup 2016
Ложка дёгтя – Александр Лэйн, QIWI, Zabbix Moscow Meetup 2016
 
Introduction to Zabbix - Company, Product, Services and Use Cases
Introduction to Zabbix - Company, Product, Services and Use CasesIntroduction to Zabbix - Company, Product, Services and Use Cases
Introduction to Zabbix - Company, Product, Services and Use Cases
 
Continuous deployment Smartling event
Continuous deployment Smartling eventContinuous deployment Smartling event
Continuous deployment Smartling event
 
Continuous Deployment (in Russian)
Continuous Deployment  (in Russian)Continuous Deployment  (in Russian)
Continuous Deployment (in Russian)
 
Пётр Зайцев, Percona
Пётр Зайцев, PerconaПётр Зайцев, Percona
Пётр Зайцев, Percona
 
Визуальная аналитика на страже информационной безопасности
Визуальная аналитика на страже информационной безопасностиВизуальная аналитика на страже информационной безопасности
Визуальная аналитика на страже информационной безопасности
 
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft Azure
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft AzureJelastic PaaS for DevOps: Hybrid Cloud based on Microsoft Azure
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft Azure
 
Zabbix 3.2 - мониторинг качественно нового уровня / Алексей Владышев (Zabbix)
Zabbix 3.2 - мониторинг качественно нового уровня / Алексей Владышев (Zabbix)Zabbix 3.2 - мониторинг качественно нового уровня / Алексей Владышев (Zabbix)
Zabbix 3.2 - мониторинг качественно нового уровня / Алексей Владышев (Zabbix)
 
Путь мониторинга: модульность, гибкость, devops / Всеволод Поляков (Grammarly)
Путь мониторинга: модульность, гибкость, devops / Всеволод Поляков (Grammarly)Путь мониторинга: модульность, гибкость, devops / Всеволод Поляков (Grammarly)
Путь мониторинга: модульность, гибкость, devops / Всеволод Поляков (Grammarly)
 
Zabbix Performance Tuning
Zabbix Performance TuningZabbix Performance Tuning
Zabbix Performance Tuning
 
Внедрение Docker в процесс разработки демонов. Доклад Константина Карпова на ...
Внедрение Docker в процесс разработки демонов. Доклад Константина Карпова на ...Внедрение Docker в процесс разработки демонов. Доклад Константина Карпова на ...
Внедрение Docker в процесс разработки демонов. Доклад Константина Карпова на ...
 
QaAPI. Взгляд на тестирование с другой стороны баррикад. Доклад Дмитрия Марущ...
QaAPI. Взгляд на тестирование с другой стороны баррикад. Доклад Дмитрия Марущ...QaAPI. Взгляд на тестирование с другой стороны баррикад. Доклад Дмитрия Марущ...
QaAPI. Взгляд на тестирование с другой стороны баррикад. Доклад Дмитрия Марущ...
 

Similar a Zabbix в сервисной компании  ОНЛАНТА - Zabbix Meetup Moscow

Building the Enterprise infrastructure with PostgreSQL as the basis for stori...
Building the Enterprise infrastructure with PostgreSQL as the basis for stori...Building the Enterprise infrastructure with PostgreSQL as the basis for stori...
Building the Enterprise infrastructure with PostgreSQL as the basis for stori...PavelKonotopov
 
Юрий Буянов «Архитектура Goozy»
Юрий Буянов «Архитектура Goozy»Юрий Буянов «Архитектура Goozy»
Юрий Буянов «Архитектура Goozy»e-Legion
 
YuryByyanov (e-legion) @ CodeCamp2011
YuryByyanov (e-legion) @ CodeCamp2011YuryByyanov (e-legion) @ CodeCamp2011
YuryByyanov (e-legion) @ CodeCamp2011CodeCamp
 
Проектирование высоконагруженного масштабируемого веб-сервиса в облаке на при...
Проектирование высоконагруженного масштабируемого веб-сервиса в облаке на при...Проектирование высоконагруженного масштабируемого веб-сервиса в облаке на при...
Проектирование высоконагруженного масштабируемого веб-сервиса в облаке на при...Ontico
 
Андрей Федоренчик- «Высоконагруженная система с аналитикой на InfoBright»
Андрей Федоренчик- «Высоконагруженная система с аналитикой на InfoBright»Андрей Федоренчик- «Высоконагруженная система с аналитикой на InfoBright»
Андрей Федоренчик- «Высоконагруженная система с аналитикой на InfoBright»Tanya Denisyuk
 
ObjectManager, или как работать с большим количеством объектов на карте, Мари...
ObjectManager, или как работать с большим количеством объектов на карте, Мари...ObjectManager, или как работать с большим количеством объектов на карте, Мари...
ObjectManager, или как работать с большим количеством объектов на карте, Мари...Ontico
 
Истинный DevOps. Секрет 42.
Истинный DevOps. Секрет 42.Истинный DevOps. Секрет 42.
Истинный DevOps. Секрет 42.Nikita Borzykh
 
Построение аналитического хранилища на 100 петабайт
Построение аналитического хранилища на 100 петабайтПостроение аналитического хранилища на 100 петабайт
Построение аналитического хранилища на 100 петабайтAlexander Mazurov
 
Building deployment pipeline - DevOps way
Building deployment pipeline - DevOps wayBuilding deployment pipeline - DevOps way
Building deployment pipeline - DevOps wayAndrey Rebrov
 
GRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network InitiativeGRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network InitiativeARCCN
 
ECP и API управления процессами. InterSystems Meetup Sankt-Peterburg 2014
ECP и API управления процессами. InterSystems Meetup Sankt-Peterburg 2014ECP и API управления процессами. InterSystems Meetup Sankt-Peterburg 2014
ECP и API управления процессами. InterSystems Meetup Sankt-Peterburg 2014InterSystems
 
Service Discovery. More that it seems
Service Discovery. More that it seemsService Discovery. More that it seems
Service Discovery. More that it seemsAleksandr Tarasov
 
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)Ontico
 
Микросервисы: опыт использования в нагруженном проекте / Вадим Мадисон (М-Тех)
Микросервисы: опыт использования в нагруженном проекте / Вадим Мадисон (М-Тех)Микросервисы: опыт использования в нагруженном проекте / Вадим Мадисон (М-Тех)
Микросервисы: опыт использования в нагруженном проекте / Вадим Мадисон (М-Тех)Ontico
 
Node.js введение в технологию, КПИ #ITmeetingKPI
Node.js введение в технологию, КПИ  #ITmeetingKPINode.js введение в технологию, КПИ  #ITmeetingKPI
Node.js введение в технологию, КПИ #ITmeetingKPITimur Shemsedinov
 
IT-инфраструктура. FAQ для разработчика
IT-инфраструктура. FAQ для разработчикаIT-инфраструктура. FAQ для разработчика
IT-инфраструктура. FAQ для разработчикаMikhail Chinkov
 
Introduction in Node.js (in russian)
Introduction in Node.js (in russian)Introduction in Node.js (in russian)
Introduction in Node.js (in russian)Mikhail Davydov
 
Подходы и технологии, используемые в разработке iOS-клиента Viber, Кирилл Лаш...
Подходы и технологии, используемые в разработке iOS-клиента Viber, Кирилл Лаш...Подходы и технологии, используемые в разработке iOS-клиента Viber, Кирилл Лаш...
Подходы и технологии, используемые в разработке iOS-клиента Viber, Кирилл Лаш...Yandex
 
Другая виртуализация
Другая виртуализацияДругая виртуализация
Другая виртуализацияYandex
 
Как превратить приложение в платформу
Как превратить приложение в платформуКак превратить приложение в платформу
Как превратить приложение в платформуVadim Kruchkov
 

Similar a Zabbix в сервисной компании  ОНЛАНТА - Zabbix Meetup Moscow (20)

Building the Enterprise infrastructure with PostgreSQL as the basis for stori...
Building the Enterprise infrastructure with PostgreSQL as the basis for stori...Building the Enterprise infrastructure with PostgreSQL as the basis for stori...
Building the Enterprise infrastructure with PostgreSQL as the basis for stori...
 
Юрий Буянов «Архитектура Goozy»
Юрий Буянов «Архитектура Goozy»Юрий Буянов «Архитектура Goozy»
Юрий Буянов «Архитектура Goozy»
 
YuryByyanov (e-legion) @ CodeCamp2011
YuryByyanov (e-legion) @ CodeCamp2011YuryByyanov (e-legion) @ CodeCamp2011
YuryByyanov (e-legion) @ CodeCamp2011
 
Проектирование высоконагруженного масштабируемого веб-сервиса в облаке на при...
Проектирование высоконагруженного масштабируемого веб-сервиса в облаке на при...Проектирование высоконагруженного масштабируемого веб-сервиса в облаке на при...
Проектирование высоконагруженного масштабируемого веб-сервиса в облаке на при...
 
Андрей Федоренчик- «Высоконагруженная система с аналитикой на InfoBright»
Андрей Федоренчик- «Высоконагруженная система с аналитикой на InfoBright»Андрей Федоренчик- «Высоконагруженная система с аналитикой на InfoBright»
Андрей Федоренчик- «Высоконагруженная система с аналитикой на InfoBright»
 
ObjectManager, или как работать с большим количеством объектов на карте, Мари...
ObjectManager, или как работать с большим количеством объектов на карте, Мари...ObjectManager, или как работать с большим количеством объектов на карте, Мари...
ObjectManager, или как работать с большим количеством объектов на карте, Мари...
 
Истинный DevOps. Секрет 42.
Истинный DevOps. Секрет 42.Истинный DevOps. Секрет 42.
Истинный DevOps. Секрет 42.
 
Построение аналитического хранилища на 100 петабайт
Построение аналитического хранилища на 100 петабайтПостроение аналитического хранилища на 100 петабайт
Построение аналитического хранилища на 100 петабайт
 
Building deployment pipeline - DevOps way
Building deployment pipeline - DevOps wayBuilding deployment pipeline - DevOps way
Building deployment pipeline - DevOps way
 
GRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network InitiativeGRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network Initiative
 
ECP и API управления процессами. InterSystems Meetup Sankt-Peterburg 2014
ECP и API управления процессами. InterSystems Meetup Sankt-Peterburg 2014ECP и API управления процессами. InterSystems Meetup Sankt-Peterburg 2014
ECP и API управления процессами. InterSystems Meetup Sankt-Peterburg 2014
 
Service Discovery. More that it seems
Service Discovery. More that it seemsService Discovery. More that it seems
Service Discovery. More that it seems
 
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
 
Микросервисы: опыт использования в нагруженном проекте / Вадим Мадисон (М-Тех)
Микросервисы: опыт использования в нагруженном проекте / Вадим Мадисон (М-Тех)Микросервисы: опыт использования в нагруженном проекте / Вадим Мадисон (М-Тех)
Микросервисы: опыт использования в нагруженном проекте / Вадим Мадисон (М-Тех)
 
Node.js введение в технологию, КПИ #ITmeetingKPI
Node.js введение в технологию, КПИ  #ITmeetingKPINode.js введение в технологию, КПИ  #ITmeetingKPI
Node.js введение в технологию, КПИ #ITmeetingKPI
 
IT-инфраструктура. FAQ для разработчика
IT-инфраструктура. FAQ для разработчикаIT-инфраструктура. FAQ для разработчика
IT-инфраструктура. FAQ для разработчика
 
Introduction in Node.js (in russian)
Introduction in Node.js (in russian)Introduction in Node.js (in russian)
Introduction in Node.js (in russian)
 
Подходы и технологии, используемые в разработке iOS-клиента Viber, Кирилл Лаш...
Подходы и технологии, используемые в разработке iOS-клиента Viber, Кирилл Лаш...Подходы и технологии, используемые в разработке iOS-клиента Viber, Кирилл Лаш...
Подходы и технологии, используемые в разработке iOS-клиента Viber, Кирилл Лаш...
 
Другая виртуализация
Другая виртуализацияДругая виртуализация
Другая виртуализация
 
Как превратить приложение в платформу
Как превратить приложение в платформуКак превратить приложение в платформу
Как превратить приложение в платформу
 

Zabbix в сервисной компании  ОНЛАНТА - Zabbix Meetup Moscow

  • 2. …Так кто ж ты, MonOps? — Я - часть той силы, что вечно хочет зла и вечно совершает благо.
  • 3.
  • 4. • Все само себя 
 не замониторит • Кнопка «сделай мне зашибись» не случится • Monitoring Operations (MonOps) - это РАЗРАБОТКА решения мониторинга 
 под конкретный проект • Мониторинг - это дорого! • Постоянный процесс разработки СПАСИБО, КЭП!
  • 5. • услуги IT-аутсорсинга • эксплуатация государственных информационных систем федерального значения • облачные услуги OnCloud.ru • в компании нет разработчиков, только системные администраторы КОМПАНИЯ ОНЛАНТА
  • 6. ZABBIX В ОНЛАНТА • гос проект с посещаемостью 350 000 в сутки • OnCloud - облачный хостинг, 600 ВМ enterprise level
  • 7. ZABBIX В ОНЛАНТА • гос проект
  • 8. Мониторинг — непрерывный процесс наблюдения и регистрации параметров объекта, в сравнении с заданными критериями. сбор метрик соответствие
 граничным
 условиям информирование (alerting) 1 2 3 МОНИТОРИНГ
  • 9. визуализация данных: графики, комплексные экраны
 
 ЭТО АНАЛИТИКА НЕ МОНИТОРИНГ
  • 10. ИДЕАЛЬНЫЙ МОНИТОРИНГ • 1 метрика - 1 адекватный триггер • если для метрики нет триггера - значит она не 
 нужна в системе мониторинга
  • 12. • Эксперты определяют граничные условия, интервал, и необходимость в оповещении • Zabbix — это всегда +сотрудник ДС, никаких СМС, приятно услышать человека который знает, что точно случилось в 4 утра :) • Делайте удобно для ДС: четкая инструкция в описание триггера, что делать.
 Если можно починить пусть чинят (если это обходное решение), если нет то пусть звонят эксперту • Ссылку на базу знаний • Меньше графиков, больше толковых триггеров. 
 Визуальный мониторинг - быстрый путь к НШС, считайте, что у вас нет мониторинга • Используйте LLD везде - это унификация и если вы играете в квест с разработчиками
  • 13. • 1 сервер • 2 х 12 -cores Intel Xeon CPU X5675 @ 3.07GHz • 16 GB RAM •   СХД • 1000 - 1200  NVPS • MariaDB 10 +TokuDB + nginx + php-fpm • tokudb_row_format = tokudb_lzma (жмет хорошо, но долго читает) • NO housekeeper + partitioning • ВМ Zabbix Proxy + ODBC Oracle АРХИТЕКТУРА REV.1
  • 14. • oVirt (KVM) кластер из 3 нод (ручной HA - БД не переедет автоматом) • 1 сервер: 2 x 24 core Intel(R) Xeon(R) CPU E5-2697 v2 @ 2.70GHz, 386 GB RAM • 2 сервера: 2 х 12 core Intel Xeon CPU X5675 @ 3.07GHz, 16 GB RAM • VMs: ZDB (64GB), ZABBIX(8 GB), ZMONITOR(8GB) • СХД • 2200  NVPS • history* - 31 день, trends* - 2 года • размер базы: 170 Гб • MariaDB 10 +TokuDB + nginx + php-fpm • tokudb_row_format = tokudb_zlib • ВМ Zabbix Proxy + ODBC Oracle АРХИТЕКТУРА REV.2
  • 15. • MariaDB 10 +TokuDB 7.5 • write optimized • no locks • row compression: zlib, lzma (6x < InnoDB) • no slave lag • hot backup > 7.5.5 (MariaDB 10.0.20) • clustering indexes ZABBIX BACKEND
  • 16. my.cnf: datadir=/data/mysql
 tokudb_data_dir=/data/tokudb #удобно
 tmpdir=/ramtmp #для select distinct 
 
 plugin-load = ha_tokudb
 #tokudb_cache_size = # default: 50% RAM
 #tokudb_directio = OFF query_cache_type = 1 # + 5min event: FLUSH QUERY CACHE
 query_cache_size = 32M # + 30min event: RESET QUERY CACHE
 query_cache_limit=32M # #обязательно(!) иначе будут очень долгие select’ы
 optimizer_switch=index_condition_pushdown=off ZABBIX BACKEND
  • 17. net.ipv4.ip_local_port_range = 10000 65535
 net.ipv4.tcp_fin_timeout = 5
 net.ipv4.tcp_tw_reuse=1
 
 net.netfilter.nf_conntrack_max=1048576
 
 kernel.msgmni = 1024
 kernel.sem = 250 256000 32 1024 sysctl.conf CacheSize= 512M HistoryCacheSize=512M TrendCacheSize=512M HistoryTextCacheSize=512M ValueCacheSize=512M zabbix_server.conf ZABBIX SERVER
  • 18. php-fpm:
 pm = static
 pm.max_children = 450 nginx + php-fpm + opcache // permission check if ($userType != USER_TYPE_SUPER_ADMIN && !$options['nopermissions']) { $permission = $options['editable'] ? PERM_READ_WRITE : PERM_READ; $userGroups = getUserGroupsByUserId($userid); // check permissions by graph items /* PATCH: TOO LONG GRAPHS QUERIES $sqlParts['where'][] = 'NOT EXISTS ('. 'SELECT NULL'. ' FROM graphs_items gi,items i,hosts_groups hgg'. ' LEFT JOIN rights r'. ' ON r.id=hgg.groupid'. ' AND '.dbConditionInt('r.groupid', $userGroups). ' WHERE g.graphid=gi.graphid'. ' AND gi.itemid=i.itemid'. ' AND i.hostid=hgg.hostid'. ' GROUP BY i.hostid'. ' HAVING MAX(permission)<'.zbx_dbstr($permission). ' OR MIN(permission) IS NULL'. ' OR MIN(permission)='.PERM_DENY. ')'; /include/classes/api/services/CGraph.php php: 
 memory_limit = 512M
 opcache.enable =1 ZABBIX FRONTEND
  • 19. • Все в CSV • схема с процедурами партиционирования: 
 
 $MYSQLDUMP --no-data --events --routines • все таблицы кроме исторических:
 
 $MYSQLDUMP --opt --compact --no-create-info 
 --tab=${DB_TABLE_DIR} $db $tb • history и trends по партициям:
 
 SELECT * FROM $tb PARTITION (${PART}) INTO OUTFILE '$FILE'
 DB BACKUP
  • 20. 1. backup только конфигурации, без истории и трендов 2. создаем базу zabbix_lite из бэкапа на шаге1 3. перенастриваем zabbix_server на zabbix_lite 4. поднимаем zabbix_server новой версии наVM, настраиваем на обновляемую базу 5. проходим по логам процедуру обновления БД, в основном это ALTERTABLE … ENGINE=«TokuDB» 
 
 +смотрим, что он там делает
 src/libs/zbxdbupgrade/dbupgrade.c 6. обновляем основной zabbix_server 7. стартуем на обнолвенной базе ПРОЦЕСС ОБНОВЛЕНИЯ ZABBIX SERVER
  • 21. 1. пользовательские сценарии по сайту + личный кабинет через wget_gost 2. AIX, Linux,Windows 3. много WebSphere + Zorka.io (heap, GC) 4. Oracle: tablespaces, jobs, replication, бизнес метрики приложения (все на  LLD) 5. работу сервисов: nginx, apache, mongodb, tomcat, … 6. cpu, ram, swap, iostat 7. сертификаты 8. не любим crontab и UserParameter — любим system.run[] ЧТО МОНИТОРИМ
  • 22. CASE: ОТЧЕТ О ДОСТУПНОСТИ ВИРТУАЛИЗАЦИИ … LUN 1 LUN 2 LUN 3 LUN 1 LUN 2 LUN 3 Задача: сформировать отчет для каждой ВМ заказчика по интегральной метрике доступности гипервизора, СХД и сети. boarder router
  • 23. FAST: pyVmomi — Python SDK for theVMware vSphere API
 SLOW: VMware Perl SDK НОВОЕ LLD ДЛЯ ОБНАРУЖЕНИЯVM
  • 30. CASE: ODBC LLD Задача: создать шаблон автоматического обнаружения метрик приложений 
 на WebSphere application server • имеем в наличии 120 серверов приложений • сервера пишут статистику в Oracle • получаем значения метрик через db.odbc.select[] • функционал опроса БД вынесен на Zabbix Proxy
  • 31.
  • 34.
  • 35. СЛАБЫЕ МЕСТА ODBC • Нет отдельного процесса под проверки — иногда коннект к базе может быть долгий, отнимается целый poller • Одна проверка — одно новое соединение
 NO connection pooling — не кэшируют соединения, Ваши DBA будут счастливы • Нельзя сделать такое:
 SELECT 
 PERCENTILE_CONT(0.1) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_10,
 PERCENTILE_CONT(0.2) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_20,
 PERCENTILE_CONT(0.3) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_30,
 PERCENTILE_CONT(0.4) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_40, 
 PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_50, 
 PERCENTILE_CONT(0.6) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_60, 
 PERCENTILE_CONT(0.7) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_70, 
 PERCENTILE_CONT(0.8) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_80, 
 PERCENTILE_CONT(0.9) WITHIN GROUP (ORDER BY one_query_time_ms ) as p_90
  • 36. ССЫЛКИ • Лучший доклад про мониторинг на RootConf 2015
 Monitoring-driven эксплуатация.  Николай Сивко hh.ru
 http://goo.gl/HDI86X • Мониторинг базы данных Oracle через ODBC в Zabbix
 http://habrahabr.ru/post/226365/ • pyVmomi is the Python SDK for theVMware vSphere API
 https://github.com/vmware/pyvmomi