Вы посетили: » alerts
Датчики слежения
В этом разделе находятся датчики тревоги вашего сервера. При возникновении алерта вы получаете письмо с предупреждением. Таким образом вы можете непрерывно следить за массой разнообразных параметров работы сервера: загрузкой, трафиком, заполнением диска, работой http-сервера etc.
Каждый алерт использует определенную функцию и список параметров к ней.
Доступные функции:
- http функция предназначена для слежения за работой сайтов. Принимает параметры:
- uri - полный адрес страницы (пример: http://domain.com/mytestpage.html);
- ok_codes - разделенный пробелами или запятыми список кодов ответа http-сервера, которые НЕ являются ошибочными (пример: 200, 302, 304). Если поле не заполнено – то использоваться не будет.
- ok_content: строчка, которая ДОЛЖНА содержаться в теле страницы. Если поле не заполнено – то использоваться не будет.
С помощью этой функции Вы можете проверять, работает ли Ваш сайт (выдает ли нужную страницу и т.п.). Также с помощью этой функции очень просто создавать собственные алерты: Вы пишете небольшой скрипт, который проверяет необходимое Вам условие (например, работает ли mysql-сервер), и в случае успеха выдает на страницу SUCCESS. Вы прописываете SUCCESS в ok_content, и в случае отсутствия этого слова Вам высылается на email алерт.
- snmp_statistics - функция работает с источниками данных и предназначена для слежения за изменением состояния счетчиков. Принимает параметры:
- use_samples - сколько последних значений счетчиков принимать за среднее.
- curr_samples - сколько последних значений счетчиков принимать за текущее.
- stat_name - какой счетчик использовать (Name в источниках данных).
- condition - условие возникновения алерта. Возможны варианты:
- <NN - текущее (curr_samples) значение меньше NN.
- >NN - текущее (curr_samples) значение больше NN.
- <*NN - curr_samples меньше use_samples в NN раз (падение счетчика в NN раз).
- >*NN - curr_samples больше use_samples в NN раз (возрастание счетчика в NN раз).
С помощью этой функции Вы можете настраивать алерты на такие вещи, как падение/возрастание траффика, скачки загрузки, уменьшение дискового пространства и многое другое.
- watch_ports - эта простая функция следит за открытыми портами. Принимает параметры:
- ip_ports - разделенный пробелами список портов или адресов с портами в виде ip_address:port. Если ip_address не указан, то используется system_ipaddr.
- timeout - время ожидания соединения в секундах. Обычно достаточно 5 секунд.
- retries - количество попыток запроса.
С помощью этой функции Вы можете следить, работают ли сервисы машины, такие как apache (порт 80), прием почты (порт 25) и другие.Возможно следить не только за своим сервером, IP адрес можно указывать любой.
- ping_trace - функция для мониторинга доступности других серверов.
- ip_addr - адрес для проверки.
- timeout - время ожидания соединения в секундах. Обычно достаточно 5 секунд.
- retries - количество попыток запроса.
ДОСТУПНЫЕ ДЕЙСТВИЯ:
Добавить датчик – существует 3 типа датчиков, принципы работы описаны выше.
Изменить – изменить датчик.
Удалить – удалить датчик.
- http:
- Имя – название датчика.
- Комментарий – произвольный комментарий. Предназначен для описания работы датчика.
- Уровень – поле предназначено для возможности фильтрации почтового сообщения по уровню опасности. Будет находиться только в Теме (Subject) письма.
- uri – полный адрес страницы, запрос к которой необходимо осуществить .
- ok_codes – код ответов http-сервера, который будут считаться правильными. Их может быть несколько, в таком случае они должны разделяться запятыми.
- ok_content – слово или строка, которые должны содержаться запрашиваемой в странице.
- retries – количество повторения запроса в случае неудачи.
- snmp_statistics:
- Имя - название датчика.
- Комментарий - произвольный комментарий. Предназначен для описания работы датчика.
- Уровень - поле предназначено для возможности фильтрации почтового сообщения по уровню опасности. Будет находиться только в Теме (Subject) письма.
- condition – условие, при котором сработает алерт.
- stat_name – название счетчика из раздела Источники данных.
- use_samples - сколько последних значений счетчиков принимать за среднее.
- curr_samples - сколько последних значений счетчиков принимать за текущее.
- watch_ports:
- Имя - название датчика.
- Комментарий - произвольный комментарий. Предназначен для описания работы датчика.
- Уровень - поле предназначено для возможности фильтрации почтового сообщения по уровню опасности. Будет находиться только в Теме (Subject) письма.
- ip_ports - разделенный пробелами список портов или адресов с портами в виде ip_address:port. Если ip_address не указан, используется system_ipaddr.
- timeout - время ожидания соединения в секундах. Обычно достаточно 5 секунд.
- retries - количество повторения запроса в случае неудачи.
- ping_trace - функция для мониторинга доступности других серверов.
- Комментарий - произвольный комментарий. Предназначен для описания работы датчика.
- Уровень - поле предназначено для возможности фильтрации почтового сообщения по уровню опасности. Будет находиться только в Теме (Subject) письма.
- ipaddr - адрес для проверки.
- timeout - время ожидания соединения в секундах. Обычно достаточно 5 секунд.
- retries - количество попыток запроса.
ПОЛЯ:
Имя – название датчика.
Активен – индикатор состояния датчика. Может быть активным и неактивным.
Задачи – задание по условию, привязанное к алерту.
Функция – используемая функция. Может быть snmp_statistics, http, watch_ports.
Уровень – информирует о том, какой текст будет содержаться в Subject почтового сообщения. Может принимать значения NOTICE, WARN, ERROR, EMERG. Это сделано для удобства фильтрации почтовых сообщений.
Параметры – полный текст выполняемого условия, генерируется автоматически на основе введенных данных при создании датчика.