Что означает "Получил неизвестное событие 17 ... продолжение..." с MPI

Я запускаю работу MPI и получаю это предупреждение:

[comet-05-08.sdsc.edu:mpi_rank_10][async_thread] Got unknown event 17 ... continuing ...

Я компилирую с ICC (ICC) 15.0.2 20150121 с использованием MVAPICH 2.1.

Что означает сообщение? Это вредно?

1 ответ

Из этого списка рассылки:

это сообщение об ошибке печатается потоком асинхронного выполнения из-за получения события IBV_EVENT_CLIENT_REREGISTER (событие № 17).

Рекомендуется обновить до последней версии. Письмо, на которое я ссылался, предлагало MVAPICH2 1.4 (который новее вашего), несмотря на тот факт, что письмо пришло с 2009 года.


Код, который, вероятно, генерирует это:

switch (event.event_type) {
        ...

        break; 
    default:
        NEM_IB_ERR("Got unknown event %d ... continuing ...",
                event.event_type);
}

где вы можете найти полный код здесь.


Как указано в разделе комментариев:

IBV_EVENT_CLIENT_REREGISTER

SM запрашивает, чтобы клиент перерегистрировал все подписки, ранее запрошенные с этого порта, например (но не ограничиваясь ими), присоединиться к многоадресной группе. Это событие может быть сгенерировано, когда SM пострадал от сбоя, который привел к потере его записей, или когда в подсети появился новый SM.

Это событие будет сгенерировано устройством, только если бит, указывающий, что перерегистрация клиента поддерживается, установлен в port_attr.port_cap_flags,

Источник


Я не был бы доволен этим событием, поэтому на вашем месте я бы обновил информацию. Если проблема не устранена, я бы связался с людьми из MVAPICH2.

Другие вопросы по тегам