Как воспроизвести тупик, на который намекает документация процесса Boost?
Согласно документации Boost (раздел "Почему канал не закрывается?"), Следующий код приведет к взаимоблокировке:
#include <boost/process.hpp>
#include <iostream>
namespace bp = ::boost::process;
int main(void)
{
bp::ipstream is;
bp::child c("ls", bp::std_out > is);
std::string line;
while (std::getline(is, line))
{
std::cout << line << "\n";
}
return 0;
}
В документации сказано:
Это также приведет к взаимоблокировке, поскольку канал не закрывается при выходе из подпроцесса. Таким образом, ipstream по-прежнему будет искать данные, даже если процесс завершен.
Однако я не могу воспроизвести тупик (под Linux). Кроме того, я не понимаю, почему тупик возник в первую очередь. Как только дочерний процесс завершается, он закрывает конец записи канала. Конец чтения канала все еще будет доступен для чтения родительским процессом, и std::getline()
потерпит неудачу, как только в буфере канала больше не будет данных, и конец записи будет закрыт, правильно? В случае, если буфер канала заполняется во время выполнения дочернего процесса, дочерний процесс блокирует ожидание, пока родительский процесс прочитает достаточно данных из канала, чтобы продолжить.
Таким образом, если вышеприведенный код может зайти в тупик, есть ли простой способ воспроизвести сценарий тупика?
Обновить:
Действительно, следующий фрагмент кода блокируется с помощью процесса Boost:
#include <boost/process.hpp>
#include <iostream>
namespace bp = ::boost::process;
int main()
{
bp::ipstream is;
bp::child c("/bin/bash", bp::args({"-c", "ls >&40"}), bp::posix::fd.bind(40, is.rdbuf()->pipe().native_sink()));
std::string line;
while (std::getline(is, line))
{
std::cout << line << "\n";
}
c.wait();
return 0;
}
Интересно, действительно ли это какое-то неизбежное свойство процесса, порождаемого в Linux? Воспроизведение приведенного выше примера с использованием подпроцесса из библиотеки Facebook Folly, по крайней мере, не блокирует:
#include <folly/Subprocess.h>
#include <iostream>
int main()
{
std::vector<std::string> arguments = {"/bin/bash", "-c", "ls >&40"};
folly::Subprocess::Options options;
options.fd(40, STDOUT_FILENO);
folly::Subprocess p(arguments, options);
std::cout << p.communicate().first;
p.wait();
return 0;
}
1 ответ
Как только дочерний процесс завершается, он закрывает конец записи канала.
Кажется, это предположение. Какая программа закрывает какой канал?
Если /bin/ls
делает то, что происходит для
bp::child c("/bin/bash", bp::args({"-c", "ls; ls"}));
Если ls
действительно закрывает это, тогда это должно быть закрыто дважды.
Возможно, bash дублирует ручки под капотом, поэтому подпроцессы закрывают разные копии одной и той же трубы. Я не уверен в надежности этой семантики
Таким образом, очевидно, stdout хорошо обслуживается. Однако я могу воспроизвести тупик при использовании нестандартного дескриптора файла для вывода в linux:
#include <boost/process.hpp>
#include <iostream>
namespace bp = ::boost::process;
int main() {
bp::ipstream is;
bp::child c("/bin/bash", bp::args({"-c", "exec >&40; ls"}), bp::posix::fd.bind(40, is.rdbuf()->pipe().native_sink()));
std::string line;
while (std::getline(is, line)) {
std::cout << line << "\n";
}
}
Я не уверен, почему поведение "закрытия стандартного вывода" подпроцессов в bash должно вести себя по-другому, когда оно было перенаправлено на fd, но вы идете.
Еще один хороший способ продемонстрировать связанный тупик:
{
bp::child c("/bin/bash", bp::args({"-c", "ls -R /"}), bp::std_out > is);
c.wait();
return c.exit_code();
}
Этот ответ не является окончательным, но он соблюдает некоторые моменты и демонстрирует их в Linux:
- не все файловые дескрипторы покрыты так же, как стандартный вывод
- Взаимные блокировки могут возникать во многих случаях, когда подпроцессы обрабатывают свои операции ввода-вывода асинхронно, но вызывающий процесс обрабатывает их синхронно.
Я думаю, что последний был пункт в документации.
¹ действительно, документация явно предполагает, что разница в этих семантиках является проблемой в Win32:
Невозможно использовать автоматическое закрытие канала в этой библиотеке, потому что канал может быть дескриптором файла (как для асинхронных каналов в Windows)