SocketRocket RunLoop внезапная авария

Так что наше приложение некоторое время испытывает сбои в SocketRocket. Мы получаем около 20 сбоев в день со следующей трассировкой стека:

Crashed: com.apple.root.default-overcommit-priority
EXC_BAD_ACCESS KERN_INVALID_ADDRESS at 0x0000000c 

Thread : Crashed: com.apple.root.default-overcommit-priority
0  libsystem_platform.dylib       0x3b8ff816 spin_lock$VARIANT$mp + 1
1  CoreFoundation                 0x30e2d593 CFSocketEnableCallBacks + 54
2  CFNetwork                      0x30a926f9 SocketStream::securityBufferedRead_NoLock() + 212
3  CFNetwork                      0x30a925f5 SocketStream::socketCallbackReadLocked(SocketStreamSignalHolder*) + 76
4  CFNetwork                      0x30a90d8f SocketStream::socketCallback(__CFSocket*, unsigned long, __CFData const*, void const*) + 102
5  CFNetwork                      0x30a90cf3 SocketStream::_SocketCallBack_stream(__CFSocket*, unsigned long, __CFData const*, void const*, void*) + 58
6  CoreFoundation                 0x30e6a337 __CFSocketPerformV0 + 578
7  CoreFoundation                 0x30e68183 __CFRUNLOOP_IS_CALLING_OUT_TO_A_SOURCE0_PERFORM_FUNCTION__ + 14
8  CoreFoundation                 0x30e67653 __CFRunLoopDoSources0 + 206
9  CoreFoundation                 0x30e65e47 __CFRunLoopRun + 622
10 CoreFoundation                 0x30dd0c27 CFRunLoopRunSpecific + 522
11 CoreFoundation                 0x30dd0a0b CFRunLoopRunInMode + 106
12 Foundation                     0x317be3db -[NSRunLoop(NSRunLoop) runMode:beforeDate:] + 254
13 Piazza                         0x00110b7b -[_SRRunLoopThread main]
14 Foundation                     0x31880c87 __NSThread__main__ + 1062
15 libsystem_pthread.dylib        0x3b904c1d _pthread_body + 140
16 libsystem_pthread.dylib        0x3b904b8f _pthread_start + 102

Я пытался зафиксировать это более 20 часов. Это довольно спорадично - лучший способ воспроизвести это - выйти из системы, чтобы все соединения перестали работать, а затем попытались вызвать некоторые соединения и / или подождать несколько минут. Работает примерно в 1/4 времени, через несколько минут. Тем не менее, есть журналы людей, испытывающих этот сбой, хотя все еще вошли в систему.

Что касается кода, я не могу сказать, что является причиной EXC_BAD_ACCESS, так как все записи выше 13 не имеют доступного источника, и просмотр кода ассемблера не очень меня просветил - все, что я обнаружил, это то, что ecx в процессе работы устанавливается значение 0xc, а затем spin_lock$VARIANT$mp пытается поменять некоторые регистры на вещи, расположенные в ($ecx), и происходит сбой. [_SRRunLoopThread main]единственная часть трассировки стека, для которой у меня есть источник, выглядит следующим образом:

- (void)main;
{
    @autoreleasepool {
        _runLoop = [NSRunLoop currentRunLoop];
        dispatch_group_leave(_waitGroup);

        NSTimer *timer = [[NSTimer alloc] initWithFireDate:[NSDate distantFuture] interval:0.0 target:nil selector:nil userInfo:nil repeats:NO];
        [_runLoop addTimer:timer forMode:NSDefaultRunLoopMode];

        int i = 0;

        while ([_runLoop runMode:NSDefaultRunLoopMode beforeDate:[NSDate distantFuture]]) {
        }
        assert(NO);
    }
}

Он падает на while линия. Я подозреваю, что что-то где-то освобождается до того, как должно, но я не уверен, что это SRWebSocket или как-то блок, который был добавлен в цикл выполнения или что. Я не совсем знаком с циклами бега.

У меня заканчиваются продуктивные вещи, чтобы понять это, и я едва достиг прогресса. Любая помощь приветствуется.

2 ответа

У меня была похожая проблема. Вероятно, потому, что объект освобожден до того, как произойдет обратный вызов.

Поэтому было бы неплохо закрыть поток в методе dealloc.

Я вижу ту же проблему в MixPanel, которая, похоже, основана на этом источнике. Предполагая, что я правильно понимаю ABI, значение CFSocketRef, которое передается в CFSocketEnableCallbacks, равно NULL, поэтому включение его для обратных вызовов read (1) завершается неудачно. Я не могу сказать вам, почему CFSocketEnableCallbacks вызывается с NULL-сокетом, но похоже, что это происходит. Может быть, это где-то нулевая слабая ссылка. Я обновлю это, когда узнаю больше.

Другие вопросы по тегам