Язык отображения:   ru  en

Это старая версия документа!


Alerts

In this section there are alert sensors of our server.Having alert you get a notification. So you can constantly monitor many different server parameters: loading, bandwidth, disk usage, work of http-server etc.

Every alert uses one option and a list of parameters to it.
Available options:

  • http - is the option of sites monitoring. Its parameters are:
    • uri - is the full address of the site (for example: http://domain.com/mytestpage.html);
    • ok_codes - is the separated with spaces and commas list of codes of http-serveranswer, which ARE NOT mistaken (for example: 200, 302, 304). If the field is not filled - it won’t be used.
    • ok_content: is the line that MUST be in the body site. If the field isn’t filled - it won’t be used.

With the help of this option you may check if your site works (if it shows the necessary site, etc.). It’s also very easy to create your own alerts with this option. You may write a little script which checks the necessary for you condition (for example, if your mysql-сервер works), and if it succeeds, shows SUCCESS on the site. You write SUCCESS in ok_content and if it’s absent you’ll be sent an alert to your email.

  • snmp_statistics - this option works with snmp sources and it is used for monitoring of the counters. Its parameters:
    • use_samples - how many latest counter values must be taken as an average.
    • curr_samples - how many counter values must be taken as a current.
    • stat_name - which counter to use (Name in snmp sources).
    • condition - the condition of having alert. Possible variants:
      • <NN - current (curr_samples) less value NN.
      • >NN - current (curr_samples) greater value NN.
      • <*NN - curr_samples less use_samples in NN times ( counter downtime in NN times).
      • >*NN - curr_samples greater use_samples in NN times (counter uptime in NN times).

With the help of this option you may set up alerts on upping/downing of bandwidth, , loading average, decreasing of disk space and so on.

  • watch_ports - this easy option watches the open ports. Its parameters:
    • ip_ports - the separated with spaces list of ports or addresses with ports in form of ip_address:port. If ip_address isn’t specified, system_ipaddr is used.
    • timeout - the time of waiting in seconds. 5 seconds are usually enough.
    • retries - the amount of query attempts.

With the help of this option you may monitor if the services such as apache (port 80), receiving mail (port 25) and so on work. You may monitor not only your own server but you may indicate any other IP address.

  • ping_trace - is the option for monitoring of other servers availability.
    • ip_addr - is the address for checking.
    • timeout - is the time of waiting for the connection in seconds. 5 seconds are usually enough.
    • retries - is the amount of query attempts.

AVAILABLE ACTIONS:
Add sensor – there are 3 types of sensors, how they work is wruitten above.
Change – to change the sensor.
Delete – to delete the sensor.

  • http:
    • Name – is the name of the sensor.
    • Comments – optional comments. It’s used for the description of sensor job.
    • Level – the field is used for the possibility of filtering of mail messages according to the alert level. Будет находиться только в Теме (Subject) письма.
    • uri – полный адрес страницы, запрос к которой необходимо осуществить .
    • ok_codes – код ответов http-сервера, который будут считаться правильными. Их может быть несколько, в таком случае они должны разделяться запятыми.
    • ok_content – слово или строка, которые должны содержаться запрашиваемой в странице.
    • retries – количество повторения запроса в случае неудачи.
  • snmp_statistics:
    • Имя - название датчика.
    • Комментарий - произвольный комментарий. Предназначен для описания работы датчика.
    • Уровень - поле предназначено для возможности фильтрации почтового сообщения по уровню опасности. Будет находиться только в Теме (Subject) письма.
    • condition – условие, при котором сработает алерт.
    • stat_name – название счетчика из раздела Источники данных.
    • use_samples - сколько последних значений счетчиков принимать за среднее.
    • curr_samples - сколько последних значений счетчиков принимать за текущее.
  • watch_ports:
    • Имя - название датчика.
    • Комментарий - произвольный комментарий. Предназначен для описания работы датчика.
    • Уровень - поле предназначено для возможности фильтрации почтового сообщения по уровню опасности. Будет находиться только в Теме (Subject) письма.
    • ip_ports - разделенный пробелами список портов или адресов с портами в виде ip_address:port. Если ip_address не указан, используется system_ipaddr.
    • timeout - время ожидания соединения в секундах. Обычно достаточно 5 секунд.
    • retries - количество повторения запроса в случае неудачи.
  • ping_trace - функция для мониторинга доступности других серверов.
    • Комментарий - произвольный комментарий. Предназначен для описания работы датчика.
    • Уровень - поле предназначено для возможности фильтрации почтового сообщения по уровню опасности. Будет находиться только в Теме (Subject) письма.
    • ipaddr - адрес для проверки.
    • timeout - время ожидания соединения в секундах. Обычно достаточно 5 секунд.
    • retries - количество попыток запроса.

ПОЛЯ:
Имя – название датчика.
Активен – индикатор состояния датчика. Может быть активным и неактивным.
Задачи – задание по условию, привязанное к алерту.
Функция – используемая функция. Может быть snmp_statistics, http, watch_ports.
Уровень – информирует о том, какой текст будет содержаться в Subject почтового сообщения. Может принимать значения NOTICE, WARN, ERROR, EMERG. Это сделано для удобства фильтрации почтовых сообщений.
Параметры – полный текст выполняемого условия, генерируется автоматически на основе введенных данных при создании датчика.


Personal Tools