Что такое WebSphere Health Management?

Опубликовано: 2015-02-14

Узнайте об управлении работоспособностью в IBM WebSphere Application Server и о том, как создавать политики работоспособности.

Что такое управление здоровьем?

Health Management является частью среды WebSphere Virtual Enterprise , интегрированной в WebSphere Application Server 8.5.

WebSphere 8.5 интегрирован с операционными политиками , которые используют политики работоспособности.

Управление работоспособностью — это основанный на политике подход к мониторингу использования сервера корпоративных приложений WebSphere и способный реагировать на проблемные области до того, как произойдет сбой.

Управление здоровьем состоит из двух элементов:

контроллер здоровья
политика здравоохранения

Что такое режим реакции?

Политики работоспособности включают состояние работоспособности, которое вы хотите отслеживать в своей среде. Он реагирует, когда ваши определенные требования не выполняются.

Есть два режима реакции.

Автоматический режим: система примет меры при обнаружении нарушения политики работоспособности.

Например, если вы настроили мониторинг использования памяти и хотели бы перезапустить JVM, когда использование сообщений составляет 85%, то система перезапустит целевую JVM, когда размер кучи JVM достигнет 85%.

Контролируемый режим: система создаст задачу выполнения при обнаружении нарушения политики работоспособности. Это требует ручного вмешательства администратора WebSphere, чтобы одобрить или отклонить действие задачи во время выполнения.

Что такое состояние здоровья?

Состояние работоспособности — это объект или показатели, которые вы хотите отслеживать в своей среде.

В WebSphere 8.5 доступно восемь предопределенных условий работоспособности . У вас есть возможность создать собственное состояние здоровья.

Условие на основе возраста — это условие будет отслеживать определенную JVM и предпринимать действия при достижении настроенного возрастного порога.

Бывший:

Вы можете настроить это условие для перезапуска JVM, если она работает в течение 15 дней. Приемлемое значение для этой ситуации в днях или часах, как показано ниже.

возрастное состояние

Условие чрезмерного тайм-аута запроса — это условие сработает, когда процент тайм-аута запроса превысит заданное значение. Допустимое значение указано в процентах, как показано ниже.

чрезмерное время ожидания запроса

Условие чрезмерного времени ответа — это будет отслеживать время, необходимое для выполнения запроса, и предпринимать действия, если время превышает определенный порог.

Бывший:

Вы можете настроить это условие для получения дампа потока, когда время ответа на запрос составляет одну минуту. Допустимое значение указывается в миллисекундах, секундах и минутах, как показано ниже.

чрезмерное время отклика

Состояние памяти: чрезмерное использование памяти — отслеживает использование памяти JVM и принимает меры, если оно превышает пороговое значение.

Бывший:

Вы можете настроить это условие для создания дампа кучи JVM и перезапуска JVM, когда использование памяти превышает пороговое значение. Приемлемое значение размера кучи JVM указывается в процентах, а период нарушения — в секундах и минутах, как показано ниже.

использование состояния памяти

Состояние памяти: утечка памяти — это будет искать утечки памяти в JVM и принимать меры.

утечка памяти

Это получило три уровня обнаружения.

Быстро (ложные срабатывания)
Стандарт (некоторые ложные срабатывания)
Медленно (меньше ложных срабатываний)

Состояние штормовой утечки — отслеживайте значительное снижение среднего времени отклика и принимайте меры, такие как создание дампа потока и перезапуск JVM.

шторм политики здоровья

Это получило два уровня обнаружения.

Стандарт (некоторые ложные срабатывания)
Медленно (меньше ложных срабатываний)

Состояние рабочей нагрузки — это условие будет обнаружено после того, как JVM обслужит настроенное количество запросов.

Бывший:

Вы можете настроить перезапуск JVM после того, как она обслужит 20000000 запросов.

здоровье-состояние-нагрузка

Условие процента сбора мусора — это отслеживание процента времени, затраченного на сборку мусора в течение определенного периода, и принятие мер после превышения порогового значения. Приемлемым значением является процент и период выборки, как показано ниже.

здоровье-состояние-gc

Что такое действия в области здравоохранения?

Health Action — это действие политики работоспособности, которое должно выполняться после превышения настроенного порога.

В WebSphere 8.5 доступно семь предопределенных действий по обеспечению работоспособности .

здоровье-действие

Restart Server — для перезапуска JVM.
Взять дампы потоков — для получения дампов потоков JVM.
Возьмите дампы кучи JVM — чтобы получить дампы кучи JVM
Создать ловушку SNMP — создать ловушку SNMP для устранения неполадок.
Переведите сервер в режим обслуживания — остановите новые клиентские запросы и обслуживайте только активный сеанс.
Переведите сервер в режим обслуживания и прервите сходство — остановите новый и существующий сеанс действия.
Место выведено из режима обслуживания — готово принимать новые запросы

У вас есть возможность создать собственное действие для здоровья.

Как создать политику здравоохранения?

Политики здоровья можно создать за четыре простых шага.

Определить общие свойства политики работоспособности — здесь можно указать имя политики и выбрать состояние работоспособности.
Определите свойства состояния работоспособности политики работоспособности — здесь можно указать пороговое значение выбранного состояния работоспособности и настроить необходимые действия, которые необходимо предпринять при нарушении состояния работоспособности.
Укажите элементы для мониторинга — выберите JVM, кластеры, динамические кластеры, маршрутизаторы по запросу или ячейку в качестве цели политик работоспособности.
Подтвердите создание политики работоспособности — просмотрите конфигурацию политик работоспособности и подтвердите создание

Давайте создадим одну политику здоровья следующим образом.

Войдите в консоль WebSphere 8.5 ND DMGR.
Щелкните Операционные политики >> Политики работоспособности.
Нажмите «Создать».
Укажите имя — Test_Policy
Выберите состояние работоспособности в качестве условия рабочей нагрузки (мы можем быстро проверить это условие)
Нажмите "Далее
Введите общее количество запросов как 1000 для целей тестирования.
Выберите режим реакции как автоматический
Добавить сервер Action Restart и сделать дампы потоков

рабочая нагрузка политики здравоохранения

Нажмите "Далее
Выберите «Фильтровать по серверам/узлам».
Добавить server1 в качестве целевого члена
Нажмите Далее
Проверьте конфигурацию и нажмите «Готово».

политика здоровья

Теперь давайте проверим доступ к приложению, работающему на целевой JVM (server1).

Как только JVM обслужит 1000 запросов, она должна сделать дамп потока и перезапуститься. Вы можете использовать JMeter для загрузки, чтобы можно было быстро выполнить тестирование.

Что такое контроллер здоровья?

Контроллер работоспособности управляет политиками работоспособности и отслеживает систему. Мониторинг работоспособности должен быть включен в контроллере работоспособности для мониторинга политик.

Сам контроллер работоспособности имеет настраиваемые свойства, например, как часто он должен запускаться, а иногда и перезапускать сервер.

Это позволяет ограничить перезагрузку сервера в часы пик.

Что такое цель политики здравоохранения?

Целью политики работоспособности или действия могут быть JVM, кластеры, динамические кластеры, маршрутизаторы по требованию или ячейки.

Надеюсь, это поможет лучше понять. Если вы заинтересованы в изучении DevOps, ознакомьтесь с этим фундаментальным курсом.