Python связывается и subprocess.popen зависает при чтении стандартного ввода, когда стандартный ввод по умолчанию отсутствует
У меня есть процесс демона Python. Этот процесс демона порождает поток для обслуживания вызова моего демона каждый раз, когда вызывается команда. Внутри потока я использую подпроцесс Python popen для выполнения таких команд оболочки, как
def __executeCommand(self, cmd):
try:
self.__assertEmptyCommand(cmd)
logger.debug('Executing command : '+str(cmd))
#kept for use after analysis
#cmd = cmd.split(' ')
#proc = subprocess.Popen(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE, shell=False)
proc = subprocess.Popen(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE, shell=True)
(output, error) = proc.communicate()
returnCode = proc.returncode
logger.debug('Command execution finished: Cmd:'+ str(cmd) + "\nReturn code:" \
+ str(returnCode) + "\nOutput:" + str(output) + "\nError:" + str(error))
if output is '':
output = []
returnOutput = output
if(output != [] and output[-1] == '\n'):
returnOutput = output[:-1]
return (returnCode, str(returnOutput), str(error))
Во время выполнения некоторых команд proc.communicate() никогда не возвращается. Когда я проверял strace родительского демона, под которым выполнялся поток, следующий вывод strace
### Looking at strace for PID -> 14879 -> Main Daemon process ###
[root@mymach ~]# strace -p 14879
Process 14879 attached - interrupt to quit
select(0, NULL, NULL, NULL, {1, 122000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {2, 0}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {2, 0}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {2, 0}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {2, 0}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {2, 0}) = 0 (Timeout)
Смотря на полосу дочернего PID, который выполнял оболочку под popen.
### Looking at strace for PID -> 24294 -> Child Process process ###
[root@mymach ~]# strace -p 24294
Process 24294 attached - interrupt to quit
restart_syscall(<... resuming interrupted call ...>) = 0
nanosleep({0, 2000001}, NULL) = 0
nanosleep({0, 2000001}, NULL) = 0
nanosleep({0, 2000001}, NULL) = 0
nanosleep({0, 2000001}, NULL) = 0
nanosleep({0, 2000001}, NULL) = 0
nanosleep({0, 2000001}, NULL) = 0
Я подключил gdb к запущенному процессу демона и увидел следующую трассировку стека потока, выполняющего открытый код
### attaching GDB to main Daemon Process ###
[root@mymach ~]# gdb attach 14879
GNU gdb (GDB) Red Hat Enterprise Linux (7.0.1-42.el5.HYDRA)
Copyright (C) 2009 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law. Type "show copying"
--snip--
(gdb) info thread
11 Thread 0x406c4940 (LWP 15072) 0x00000035ee00e291 in nanosleep () from /lib64/libpthread.so.0
10 Thread 0x410c5940 (LWP 15073) 0x00000035ee00b1c0 in pthread_cond_timedwait@@GLIBC_2.3.2 ()
from /lib64/libpthread.so.0
9 Thread 0x41ac6940 (LWP 15075) 0x00000035ee00b1c0 in pthread_cond_timedwait@@GLIBC_2.3.2 ()
from /lib64/libpthread.so.0
8 Thread 0x424c7940 (LWP 15078) 0x00000035ee00e291 in nanosleep () from /lib64/libpthread.so.0
7 Thread 0x42ec8940 (LWP 15081) 0x00000035ee00b1c0 in pthread_cond_timedwait@@GLIBC_2.3.2 ()
from /lib64/libpthread.so.0
6 Thread 0x438c9940 (LWP 15084) 0x00000035ee00cd91 in sem_wait () from /lib64/libpthread.so.0
5 Thread 0x442ca940 (LWP 15085) 0x00000035ed4cc3f2 in select () from /lib64/libc.so.6
4 Thread 0x44ccb940 (LWP 15088) 0x00000035ee00dc0b in accept () from /lib64/libpthread.so.0
3 Thread 0x49cd3940 (LWP 24090) 0x00000035ee00cd91 in sem_wait () from /lib64/libpthread.so.0
2 Thread 0x47ed0940 (LWP 24281) 0x00000035ee00d9eb in read () from /lib64/libpthread.so.0 -----------------> Thread common for PID -> 24294
* 1 Thread 0x2b34ca2d7610 (LWP 14879) 0x00000035ed4cc3f2 in select () from /lib64/libc.so.6
(gdb) thread 2
[Switching to thread 2 (Thread 0x47ed0940 (LWP 24281))]#0 0x00000035ee00d9eb in read ()
from /lib64/libpthread.so.0
(gdb) bt
#0 0x00000035ee00d9eb in read () from /lib64/libpthread.so.0
#1 0x00000035ee8bfc41 in read (self=<value optimized out>, args=<value optimized out>)
from /usr/lib64/libpython2.4.so.1.0
--snip--
#20 0x00000035ee895ad8 in call_function (f=0x2c00013339e0) at Python/ceval.c:3656
#21 PyEval_EvalFrame (f=0x2c00013339e0) at Python/ceval.c:2163
#22 0x00000035ee895c8b in call_function (f=0x2c0002bb9a20) at Python/ceval.c:3645
#23 PyEval_EvalFrame (f=0x2c0002bb9a20) at Python/ceval.c:2163
#24 0x00000035ee895c8b in call_function (f=0x2c0002136020) at Python/ceval.c:3645
---Type <return> to continue, or q <return> to quit---q
Прикрепление GDB к дочернему процессу, который был создан таким образом, выполняет обратную трассировку следующим образом
[root@mymach ~]# gdb attach 24294
GNU gdb (GDB) Red Hat Enterprise Linux (7.0.1-42.el5.HYDRA)
Copyright (C) 2009 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law. Type "show copying"
--snip--
(gdb) bt
#0 0x00000035ee00e291 in nanosleep () from /lib64/libpthread.so.0
#1 0x00002b34ca068258 in SpinLock::SlowLock (this=0x2b34ca298440)
at src/allocator/base/spinlock.cc:104
#2 0x00002b34ca061526 in Lock (this=0x2b34ca298440, start=0x47ecd330, end=0x47ecd328,
N=<value optimized out>) at src/allocator/base/spinlock.h:90
#3 tcmalloc::CentralFreeList::RemoveRange (this=0x2b34ca298440, start=0x47ecd330, end=0x47ecd328,
N=<value optimized out>) at src/allocator/central_freelist.cc:219
#4 0x00002b34ca059ffe in tcmalloc::ThreadCache<false>::FetchFromCentralCache (
this=0x2c00000305c0, cl=<value optimized out>, byte_size=48)
at src/allocator/thread_cache.cc:159
#5 0x00002b34ca05e420 in Allocate (this=0x2c0000030580, size=<value optimized out>)
at src/allocator/thread_cache.h:331
#6 allocateWithSizeUpdate (this=0x2c0000030580, size=<value optimized out>)
at src/allocator/tcmalloc_heap.h:110
#7 allocate (this=0x2c0000030580, size=<value optimized out>) at src/allocator/stats_heap.h:77
#8 tcmalloc::Heapifier<tcmalloc::StatsHeap<false> >::allocate (this=0x2c0000030580,
size=<value optimized out>) at src/allocator/heap.h:107
#9 0x00002b34ca0794f2 in unlimited_cpp_alloc (old_ptr=0x0, new_size=<value optimized out>)
at src/allocator/tcmalloc.cc:850
--snip--
Я не уверен, почему дочерний процесс ожидает SpinLock на FD 0 (stdin), а также основной демон, ожидающий ответа read() на FD 0 (stdin). Вышеупомянутое не приходит во все времена, но приходит в определенные моменты и другие моменты, это просто прекрасно!
Любая помощь по этому вопросу высоко ценится.
1 ответ
Проблема заключалась в том, что мы использовали собственный распределитель, который блокировался из-за выделения памяти в subprocess.popen.
Вопрос нужно игнорировать.