Что означает "Получил неизвестное событие 17 ... продолжение..." с MPI
Я запускаю работу MPI и получаю это предупреждение:
[comet-05-08.sdsc.edu:mpi_rank_10][async_thread] Got unknown event 17 ... continuing ...
Я компилирую с ICC (ICC) 15.0.2 20150121 с использованием MVAPICH 2.1.
Что означает сообщение? Это вредно?
1 ответ
Из этого списка рассылки:
это сообщение об ошибке печатается потоком асинхронного выполнения из-за получения события IBV_EVENT_CLIENT_REREGISTER (событие № 17).
Рекомендуется обновить до последней версии. Письмо, на которое я ссылался, предлагало MVAPICH2 1.4 (который новее вашего), несмотря на тот факт, что письмо пришло с 2009 года.
Код, который, вероятно, генерирует это:
switch (event.event_type) {
...
break;
default:
NEM_IB_ERR("Got unknown event %d ... continuing ...",
event.event_type);
}
где вы можете найти полный код здесь.
Как указано в разделе комментариев:
IBV_EVENT_CLIENT_REREGISTER
SM запрашивает, чтобы клиент перерегистрировал все подписки, ранее запрошенные с этого порта, например (но не ограничиваясь ими), присоединиться к многоадресной группе. Это событие может быть сгенерировано, когда SM пострадал от сбоя, который привел к потере его записей, или когда в подсети появился новый SM.
Это событие будет сгенерировано устройством, только если бит, указывающий, что перерегистрация клиента поддерживается, установлен в
port_attr.port_cap_flags
,
Я не был бы доволен этим событием, поэтому на вашем месте я бы обновил информацию. Если проблема не устранена, я бы связался с людьми из MVAPICH2.