ЦП сервера приложений достигает> 80 и зависает почти через 24 часа, одна и та же проблема повторяется каждый день

У меня сервер IBM WebSphere Application 8.5 работает с Db2 11.1 работает от 2х лет. С тех пор, как через месяц сервер приложений зависает, процессор дБ становится равным 0, а процессор сервера приложений ->80, и зависает почти через 24 часа, одна и та же проблема повторяется каждый день. с логами на сервере приложений

DB2DIAG Ошибка сегодня 2020-12-09-10.03.24.732486+120 I1234525159E610 Уровень: ошибка PID: 5737 TID: 139739072030464 PROC: DB2SYSC 0 Экземпляр: DB2INST1 NODE: 000 DB: WPJCR: 0-. 42258.201209075007UOWID : 199 ACTID: 1AUTHID : DB2INST1 HOSTNAME: ERTUWCMDB1AzEDUID : 1760 EDUNAME: db2agent (WPJCR) 0FUNCTION: DB2 UDB, common communication, sqlcctest, probe:50MESSAGE : sqlcctest RCDATA #1 : Hexdump, 2 bytes0x00007F1789BFCDE0 : 3600 6.

2020-12-09-10.03.24.7326661+120 I1234525770E601 Уровень: ошибка PID: 5737 TID: 139739072030464 PROC: DB2SYSC 0 Экземпляр: DB2INST1 NODE: 000 DB: WPJCRAPPHDL: 0-38161611616161616161616161616161616161616161616: 199 ACTID: 1AUTHID: DB2INST1 HOSTNAME: ERTUWCMDB1AzEDUID: 1760 EDUNAME: db2agent (WPJCR) 0 ФУНКЦИЯ: DB2 UDB, базовые системные утилиты, sqeAgent::AgentBreathingPoint, probe:10 ВЫЗЫВАЕТСЯ: DB2 UDB, общая связь, sqlcctestRETCODE: ZRC=0x00000036=54

[11/3/20 6:42:13:596 EET] 000006ad XATransaction E J2CA0027E: возникла исключительная ситуация при вызове отката на адаптере ресурсов XA из источника данных jdbc/wpjcrdbDS, внутри транзакции с идентификатором {XidImpl:formatId(57415344), gtrid_length(36), bqual_length(54),

data(000001758c648aa7000000082a775800f8c220c5f6bdab92156eae0be31e28ea7605ade8000001758c648aa7000000082a775800f8c220c5f6bdab92156eae0be31e28ea7605ade8000000010000000000000000000000000001)}: com.ibm.db2.jcc.am.XaException: [jcc][t4][2041][12326][4.25.13]Error executing XAResource.rollback(). Сервер вернул XAER_NOTA. КОД ОШИБКИ=-4203, SQLSTATE=нуль

Через некоторое время ЦП дБ становится равным 0, а ЦП сервера приложений ->80 и зависает почти через 24 часа, та же проблема повторяется.

это тупик или время ожидания блокировки из-за повреждения данных??

1 ответ

Не видя никаких других журналов сервера приложений, комбинация того, что вы отмечаете, что

  1. "почти 24 часа проблема повторяется"
  2. ошибка sqeAgent::AgentBreathingPoint (дополнительную информацию см. в технической заметке IBM https://www.ibm.com/support/pages/what-does-agentbreathingpoint-error-mean-db2 )
  3. "работает от 2-х лет. Уже месяц виснет Сервер приложений"

заставит меня искать изменение в вашей сети, где недавно был установлен тайм-аут соединения, закрывающий соединения через 24 часа. Это может быть вызвано заменой маршрутизатора или обновлением прошивки, где настройки отличаются. Происходит ли это примерно в одно и то же время каждый день, и если да, то когда приложение переходит из тихого состояния (например, ночью) в активное состояние (например, начало рабочего дня)? Основываясь на вашем ответе, похоже, что весь пул соединений становится «устаревшим» за одну ночь, что означает, что соединения не используются, а тайм-аут сети приводит к их отключению от сервера базы данных. Вы можете попробовать изменить настройки источника данных WAS для «Минимального количества подключений» на 0 и «Неиспользованный тайм-аут», возможно, до 12 часов. Это позволит пулу соединений опустошиться за ночь, когда трафик сервера приостановится. Поскольку загрузка приложения начнется утром, будут получены новые соединения, что позволит избежать ошибок. Если ваши настройки «Максимальное количество подключений» очень велики, вы можете столкнуться с некоторой медлительностью при заполнении пула подключений.

Другие вопросы по тегам