Как автоматически генерировать трассировку стека при сбое моей программы
Я работаю над Linux с компилятором GCC. Когда моя программа на C++ падает, я бы хотел, чтобы она автоматически генерировала трассировку стека.
Моя программа запускается многими разными пользователями, а также работает на Linux, Windows и Macintosh (все версии скомпилированы с использованием gcc
).
Я хотел бы, чтобы моя программа могла генерировать трассировку стека при сбое, и в следующий раз, когда пользователь запустит ее, она спросит, можно ли отправить мне трассировку стека, чтобы я мог отследить проблему. Я могу обработать отправку информации мне, но я не знаю, как генерировать строку трассировки. Есть идеи?
33 ответа
Для Linux, и я считаю, что Mac OS X, если вы используете gcc или любой компилятор, который использует glibc, вы можете использовать функции backtrace() в execinfo.h
распечатать трассировку стека и корректно завершить работу, когда вы получите ошибку сегментации. Документация может быть найдена в руководстве по libc.
Вот пример программы, которая устанавливает SIGSEGV
обработчик и печатает трассировку стека в stderr
когда это segfaults. baz()
Функция здесь вызывает segfault, который запускает обработчик:
#include <stdio.h>
#include <execinfo.h>
#include <signal.h>
#include <stdlib.h>
#include <unistd.h>
void handler(int sig) {
void *array[10];
size_t size;
// get void*'s for all entries on the stack
size = backtrace(array, 10);
// print out all the frames to stderr
fprintf(stderr, "Error: signal %d:\n", sig);
backtrace_symbols_fd(array, size, STDERR_FILENO);
exit(1);
}
void baz() {
int *foo = (int*)-1; // make a bad pointer
printf("%d\n", *foo); // causes segfault
}
void bar() { baz(); }
void foo() { bar(); }
int main(int argc, char **argv) {
signal(SIGSEGV, handler); // install our handler
foo(); // this will call foo, bar, and baz. baz segfaults.
}
Компилирование с -g -rdynamic
получает информацию о вашем символе в вашем выводе, которую glibc может использовать для создания хорошей трассировки стека:
$ gcc -g -rdynamic ./test.c -o test
Выполнение этого дает вам такой вывод:
$ ./test
Error: signal 11:
./test(handler+0x19)[0x400911]
/lib64/tls/libc.so.6[0x3a9b92e380]
./test(baz+0x14)[0x400962]
./test(bar+0xe)[0x400983]
./test(foo+0xe)[0x400993]
./test(main+0x28)[0x4009bd]
/lib64/tls/libc.so.6(__libc_start_main+0xdb)[0x3a9b91c4bb]
./test[0x40086a]
Здесь показаны модуль загрузки, смещение и функция, из которой получен каждый кадр в стеке. Здесь вы можете увидеть обработчик сигнала на вершине стека, а функции libc перед main
в дополнение к main
, foo
, bar
, а также baz
,
Это даже проще, чем "man backtrace", есть немного документированная библиотека (специфичная для GNU), распространяемая с glibc как libSegFault.so, которая, как я считаю, была написана Ульрихом Дреппером для поддержки программы catchsegv (см. "Man catchsegv").
Это дает нам 3 возможности. Вместо запуска "программа -o хай":
Запустить в catchsegv:
$ catchsegv program -o hai
Ссылка с libSegFault во время выполнения:
$ LD_PRELOAD=/lib/libSegFault.so program -o hai
Ссылка с libSegFault во время компиляции:
$ gcc -g1 -lSegFault -o program program.cc $ program -o hai
Во всех трех случаях вы получите более четкие трассировки с меньшим количеством символов оптимизации (gcc -O0 или -O1) и отладки (gcc -g). В противном случае вы можете просто получить кучу адресов памяти.
Вы также можете поймать больше сигналов для трассировки стека что-то вроде:
$ export SEGFAULT_SIGNALS="all" # "all" signals
$ export SEGFAULT_SIGNALS="bus abrt" # SIGBUS and SIGABRT
Вывод будет выглядеть примерно так (обратите внимание на обратный след внизу):
*** Segmentation fault Register dump:
EAX: 0000000c EBX: 00000080 ECX:
00000000 EDX: 0000000c ESI:
bfdbf080 EDI: 080497e0 EBP:
bfdbee38 ESP: bfdbee20
EIP: 0805640f EFLAGS: 00010282
CS: 0073 DS: 007b ES: 007b FS:
0000 GS: 0033 SS: 007b
Trap: 0000000e Error: 00000004
OldMask: 00000000 ESP/signal:
bfdbee20 CR2: 00000024
FPUCW: ffff037f FPUSW: ffff0000
TAG: ffffffff IPOFF: 00000000
CSSEL: 0000 DATAOFF: 00000000
DATASEL: 0000
ST(0) 0000 0000000000000000 ST(1)
0000 0000000000000000 ST(2) 0000
0000000000000000 ST(3) 0000
0000000000000000 ST(4) 0000
0000000000000000 ST(5) 0000
0000000000000000 ST(6) 0000
0000000000000000 ST(7) 0000
0000000000000000
Backtrace:
/lib/libSegFault.so[0xb7f9e100]
??:0(??)[0xb7fa3400]
/usr/include/c++/4.3/bits/stl_queue.h:226(_ZNSt5queueISsSt5dequeISsSaISsEEE4pushERKSs)[0x805647a]
/home/dbingham/src/middle-earth-mud/alpha6/src/engine/player.cpp:73(_ZN6Player5inputESs)[0x805377c]
/home/dbingham/src/middle-earth-mud/alpha6/src/engine/socket.cpp:159(_ZN6Socket4ReadEv)[0x8050698]
/home/dbingham/src/middle-earth-mud/alpha6/src/engine/socket.cpp:413(_ZN12ServerSocket4ReadEv)[0x80507ad]
/home/dbingham/src/middle-earth-mud/alpha6/src/engine/socket.cpp:300(_ZN12ServerSocket4pollEv)[0x8050b44]
/home/dbingham/src/middle-earth-mud/alpha6/src/engine/main.cpp:34(main)[0x8049a72]
/lib/tls/i686/cmov/libc.so.6(__libc_start_main+0xe5)[0xb7d1b775]
/build/buildd/glibc-2.9/csu/../sysdeps/i386/elf/start.S:122(_start)[0x8049801]
Если вы хотите узнать подробности, лучшим источником, к сожалению, является источник: см. http://sourceware.org/git/?p=glibc.git;a=blob;f=debug/segfault.c и его родительский каталог. http://sourceware.org/git/?p=glibc.git;a=tree;f=debug
Linux
Хотя использование функций backtrace() в execinfo.h для печати трассировки стека и корректного выхода при возникновении ошибки сегментации уже было предложено, я не вижу упоминаний о тонкостях, необходимых для обеспечения того, чтобы результирующая обратная трассировка указывала на фактическое расположение ошибка (по крайней мере, для некоторых архитектур - x86 и ARM).
Первые две записи в цепочке кадров стека, когда вы попадаете в обработчик сигнала, содержат адрес возврата внутри обработчика сигнала и один внутри sigaction() в libc. Кадр стека последней функции, вызванной до того, как сигнал (который является местоположением ошибки) теряется.
Код
#ifndef _GNU_SOURCE
#define _GNU_SOURCE
#endif
#ifndef __USE_GNU
#define __USE_GNU
#endif
#include <execinfo.h>
#include <signal.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <ucontext.h>
#include <unistd.h>
/* This structure mirrors the one found in /usr/include/asm/ucontext.h */
typedef struct _sig_ucontext {
unsigned long uc_flags;
struct ucontext *uc_link;
stack_t uc_stack;
struct sigcontext uc_mcontext;
sigset_t uc_sigmask;
} sig_ucontext_t;
void crit_err_hdlr(int sig_num, siginfo_t * info, void * ucontext)
{
void * array[50];
void * caller_address;
char ** messages;
int size, i;
sig_ucontext_t * uc;
uc = (sig_ucontext_t *)ucontext;
/* Get the address at the time the signal was raised */
#if defined(__i386__) // gcc specific
caller_address = (void *) uc->uc_mcontext.eip; // EIP: x86 specific
#elif defined(__x86_64__) // gcc specific
caller_address = (void *) uc->uc_mcontext.rip; // RIP: x86_64 specific
#else
#error Unsupported architecture. // TODO: Add support for other arch.
#endif
fprintf(stderr, "signal %d (%s), address is %p from %p\n",
sig_num, strsignal(sig_num), info->si_addr,
(void *)caller_address);
size = backtrace(array, 50);
/* overwrite sigaction with caller's address */
array[1] = caller_address;
messages = backtrace_symbols(array, size);
/* skip first stack frame (points here) */
for (i = 1; i < size && messages != NULL; ++i)
{
fprintf(stderr, "[bt]: (%d) %s\n", i, messages[i]);
}
free(messages);
exit(EXIT_FAILURE);
}
int crash()
{
char * p = NULL;
*p = 0;
return 0;
}
int foo4()
{
crash();
return 0;
}
int foo3()
{
foo4();
return 0;
}
int foo2()
{
foo3();
return 0;
}
int foo1()
{
foo2();
return 0;
}
int main(int argc, char ** argv)
{
struct sigaction sigact;
sigact.sa_sigaction = crit_err_hdlr;
sigact.sa_flags = SA_RESTART | SA_SIGINFO;
if (sigaction(SIGSEGV, &sigact, (struct sigaction *)NULL) != 0)
{
fprintf(stderr, "error setting signal handler for %d (%s)\n",
SIGSEGV, strsignal(SIGSEGV));
exit(EXIT_FAILURE);
}
foo1();
exit(EXIT_SUCCESS);
}
Выход
signal 11 (Segmentation fault), address is (nil) from 0x8c50
[bt]: (1) ./test(crash+0x24) [0x8c50]
[bt]: (2) ./test(foo4+0x10) [0x8c70]
[bt]: (3) ./test(foo3+0x10) [0x8c8c]
[bt]: (4) ./test(foo2+0x10) [0x8ca8]
[bt]: (5) ./test(foo1+0x10) [0x8cc4]
[bt]: (6) ./test(main+0x74) [0x8d44]
[bt]: (7) /lib/libc.so.6(__libc_start_main+0xa8) [0x40032e44]
Все опасности вызова функций backtrace() в обработчике сигналов все еще существуют, и их не следует упускать из виду, но я нахожу описанную здесь функциональность весьма полезной при отладке сбоев.
Важно отметить, что приведенный мной пример разработан / протестирован на Linux для x86. Я также успешно реализовал это на ARM с помощью uc_mcontext.arm_pc
вместо uc_mcontext.eip
,
Вот ссылка на статью, где я узнал подробности этой реализации: http://www.linuxjournal.com/article/6391
Несмотря на то, что был предоставлен правильный ответ, который описывает, как использовать GNU libc backtrace()
Функция 1, и я предоставил свой собственный ответ, который описывает, как гарантировать, что обратная трассировка от обработчика сигнала указывает на фактическое местонахождение ошибки 2, я не вижу никаких упоминаний о разборке символов C++, выводимых из обратной трассировки.
При получении следов от программы на C++ вывод можно выполнить через c++filt
1, чтобы разобрать символы или с помощью abi::__cxa_demangle
1 напрямую.
- 1 Linux & OS X Обратите внимание, что
c++filt
а также__cxa_demangle
являются специфическими для GCC - 2 Linux
В следующем примере C++ Linux используется тот же обработчик сигнала, что и в моем другом ответе, и показано, как c++filt
может быть использован для разборки символов.
Код:
class foo
{
public:
foo() { foo1(); }
private:
void foo1() { foo2(); }
void foo2() { foo3(); }
void foo3() { foo4(); }
void foo4() { crash(); }
void crash() { char * p = NULL; *p = 0; }
};
int main(int argc, char ** argv)
{
// Setup signal handler for SIGSEGV
...
foo * f = new foo();
return 0;
}
Выход (./test
):
signal 11 (Segmentation fault), address is (nil) from 0x8048e07
[bt]: (1) ./test(crash__3foo+0x13) [0x8048e07]
[bt]: (2) ./test(foo4__3foo+0x12) [0x8048dee]
[bt]: (3) ./test(foo3__3foo+0x12) [0x8048dd6]
[bt]: (4) ./test(foo2__3foo+0x12) [0x8048dbe]
[bt]: (5) ./test(foo1__3foo+0x12) [0x8048da6]
[bt]: (6) ./test(__3foo+0x12) [0x8048d8e]
[bt]: (7) ./test(main+0xe0) [0x8048d18]
[bt]: (8) ./test(__libc_start_main+0x95) [0x42017589]
[bt]: (9) ./test(__register_frame_info+0x3d) [0x8048981]
Demangled Output (./test 2>&1 | c++filt
):
signal 11 (Segmentation fault), address is (nil) from 0x8048e07
[bt]: (1) ./test(foo::crash(void)+0x13) [0x8048e07]
[bt]: (2) ./test(foo::foo4(void)+0x12) [0x8048dee]
[bt]: (3) ./test(foo::foo3(void)+0x12) [0x8048dd6]
[bt]: (4) ./test(foo::foo2(void)+0x12) [0x8048dbe]
[bt]: (5) ./test(foo::foo1(void)+0x12) [0x8048da6]
[bt]: (6) ./test(foo::foo(void)+0x12) [0x8048d8e]
[bt]: (7) ./test(main+0xe0) [0x8048d18]
[bt]: (8) ./test(__libc_start_main+0x95) [0x42017589]
[bt]: (9) ./test(__register_frame_info+0x3d) [0x8048981]
Следующее основано на обработчике сигнала из моего исходного ответа и может заменить обработчик сигнала в приведенном выше примере, чтобы продемонстрировать, как abi::__cxa_demangle
может быть использован для разборки символов. Этот обработчик сигнала выдает тот же выходной сигнал, что и вышеприведенный пример.
Код:
void crit_err_hdlr(int sig_num, siginfo_t * info, void * ucontext)
{
sig_ucontext_t * uc = (sig_ucontext_t *)ucontext;
void * caller_address = (void *) uc->uc_mcontext.eip; // x86 specific
std::cerr << "signal " << sig_num
<< " (" << strsignal(sig_num) << "), address is "
<< info->si_addr << " from " << caller_address
<< std::endl << std::endl;
void * array[50];
int size = backtrace(array, 50);
array[1] = caller_address;
char ** messages = backtrace_symbols(array, size);
// skip first stack frame (points here)
for (int i = 1; i < size && messages != NULL; ++i)
{
char *mangled_name = 0, *offset_begin = 0, *offset_end = 0;
// find parantheses and +address offset surrounding mangled name
for (char *p = messages[i]; *p; ++p)
{
if (*p == '(')
{
mangled_name = p;
}
else if (*p == '+')
{
offset_begin = p;
}
else if (*p == ')')
{
offset_end = p;
break;
}
}
// if the line could be processed, attempt to demangle the symbol
if (mangled_name && offset_begin && offset_end &&
mangled_name < offset_begin)
{
*mangled_name++ = '\0';
*offset_begin++ = '\0';
*offset_end++ = '\0';
int status;
char * real_name = abi::__cxa_demangle(mangled_name, 0, 0, &status);
// if demangling is successful, output the demangled function name
if (status == 0)
{
std::cerr << "[bt]: (" << i << ") " << messages[i] << " : "
<< real_name << "+" << offset_begin << offset_end
<< std::endl;
}
// otherwise, output the mangled function name
else
{
std::cerr << "[bt]: (" << i << ") " << messages[i] << " : "
<< mangled_name << "+" << offset_begin << offset_end
<< std::endl;
}
free(real_name);
}
// otherwise, print the whole line
else
{
std::cerr << "[bt]: (" << i << ") " << messages[i] << std::endl;
}
}
std::cerr << std::endl;
free(messages);
exit(EXIT_FAILURE);
}
Возможно, стоит взглянуть на Google Breakpad, кроссплатформенный генератор аварийных дампов и инструменты для обработки дампов.
Вы не указали свою операционную систему, поэтому трудно ответить. Если вы используете систему, основанную на gnu libc, вы можете использовать функцию libc backtrace()
,
GCC также имеет две встроенные функции, которые могут помочь вам, но которые могут быть или не быть полностью реализованы в вашей архитектуре, и они __builtin_frame_address
а также __builtin_return_address
, Оба из них хотят немедленного целочисленного уровня (под непосредственным я имею в виду, что он не может быть переменной). Если __builtin_frame_address
поскольку заданный уровень не равен нулю, должно быть безопасно получить адрес возврата того же уровня.
Спасибо энтузиасту за то, что обратили мое внимание на утилиту addr2line.
Я написал быстрый и грязный скрипт для обработки вывода ответа, приведенного здесь: (большое спасибо jschmier!) С помощью утилиты addr2line.
Сценарий принимает один аргумент: имя файла, содержащего вывод утилиты jschmier.
Вывод должен напечатать что-то вроде следующего для каждого уровня трассировки:
BACKTRACE: testExe 0x8A5db6b
FILE: pathToFile/testExe.C:110
FUNCTION: testFunction(int)
107
108
109 int* i = 0x0;
*110 *i = 5;
111
112 }
113 return i;
Код:
#!/bin/bash
LOGFILE=$1
NUM_SRC_CONTEXT_LINES=3
old_IFS=$IFS # save the field separator
IFS=$'\n' # new field separator, the end of line
for bt in `cat $LOGFILE | grep '\[bt\]'`; do
IFS=$old_IFS # restore default field separator
printf '\n'
EXEC=`echo $bt | cut -d' ' -f3 | cut -d'(' -f1`
ADDR=`echo $bt | cut -d'[' -f3 | cut -d']' -f1`
echo "BACKTRACE: $EXEC $ADDR"
A2L=`addr2line -a $ADDR -e $EXEC -pfC`
#echo "A2L: $A2L"
FUNCTION=`echo $A2L | sed 's/\<at\>.*//' | cut -d' ' -f2-99`
FILE_AND_LINE=`echo $A2L | sed 's/.* at //'`
echo "FILE: $FILE_AND_LINE"
echo "FUNCTION: $FUNCTION"
# print offending source code
SRCFILE=`echo $FILE_AND_LINE | cut -d':' -f1`
LINENUM=`echo $FILE_AND_LINE | cut -d':' -f2`
if ([ -f $SRCFILE ]); then
cat -n $SRCFILE | grep -C $NUM_SRC_CONTEXT_LINES "^ *$LINENUM\>" | sed "s/ $LINENUM/*$LINENUM/"
else
echo "File not found: $SRCFILE"
fi
IFS=$'\n' # new field separator, the end of line
done
IFS=$old_IFS # restore default field separator
ulimit -c <value>
устанавливает ограничение размера основного файла в Unix. По умолчанию ограничение размера основного файла равно 0. Вы можете увидеть ulimit
значения с ulimit -a
,
Кроме того, если вы запустите вашу программу из GDB, она остановит вашу программу из-за "нарушений сегментации" (SIGSEGV
как правило, когда вы обращаетесь к части памяти, которую вы не распределили), или вы можете установить точки останова.
DDD и Nemiver являются интерфейсом для GDB, что делает работу с ним намного проще для новичка.
Похоже, что в одной из последних появившихся библиотек C++ boost появилась возможность обеспечить именно то, что Вы хотите, возможно, код будет мультиплатформенным Это boost:: stacktrace, который вы можете использовать как в примере boost:
#include <filesystem>
#include <sstream>
#include <fstream>
#include <signal.h> // ::signal, ::raise
#include <boost/stacktrace.hpp>
const char* backtraceFileName = "./backtraceFile.dump";
void signalHandler(int)
{
::signal(SIGSEGV, SIG_DFL);
::signal(SIGABRT, SIG_DFL);
boost::stacktrace::safe_dump_to(backtraceFileName);
::raise(SIGABRT);
}
void sendReport()
{
if (std::filesystem::exists(backtraceFileName))
{
std::ifstream file(backtraceFileName);
auto st = boost::stacktrace::stacktrace::from_dump(file);
std::ostringstream backtraceStream;
backtraceStream << st << std::endl;
// sending the code from st
file.close();
std::filesystem::remove(backtraceFileName);
}
}
int main()
{
::signal(SIGSEGV, signalHandler);
::signal(SIGABRT, signalHandler);
sendReport();
// ... rest of code
}
В Linux Вы компилируете код выше:
g++ --std=c++17 file.cpp -lstdc++fs -lboost_stacktrace_backtrace -ldl -lbacktrace
Пример обратного следа, скопированного из документации повышения:
0# bar(int) at /path/to/source/file.cpp:70
1# bar(int) at /path/to/source/file.cpp:70
2# bar(int) at /path/to/source/file.cpp:70
3# bar(int) at /path/to/source/file.cpp:70
4# main at /path/to/main.cpp:93
5# __libc_start_main in /lib/x86_64-linux-gnu/libc.so.6
6# _start
Важно отметить, что после того, как вы сгенерируете файл ядра, вам нужно использовать инструмент gdb, чтобы посмотреть на него. Чтобы gdb имел смысл вашего основного файла, вы должны указать gcc, чтобы он обрабатывал двоичный файл символами отладки: для этого вы компилируете с флагом -g:
$ g++ -g prog.cpp -o prog
Затем вы можете либо установить "ulimit -c unlimited", чтобы он выгружал ядро, либо просто запустить вашу программу внутри gdb. Мне больше нравится второй подход:
$ gdb ./prog
... gdb startup output ...
(gdb) run
... program runs and crashes ...
(gdb) where
... gdb outputs your stack trace ...
Надеюсь, это поможет.
Новый король в городе прибыл https://github.com/bombela/backward-cpp
1 заголовок для размещения в вашем коде и 1 библиотека для установки.
Лично я называю это с помощью этой функции
#include "backward.hpp"
void stacker() {
using namespace backward;
StackTrace st;
st.load_here(99); //Limit the number of trace depth to 99
st.skip_n_firsts(3);//This will skip some backward internal function from the trace
Printer p;
p.snippet = true;
p.object = true;
p.color = true;
p.address = true;
p.print(st, stderr);
}
Я смотрю на эту проблему некоторое время.
И похоронен глубоко в инструментах Google Performance README
http://code.google.com/p/google-perftools/source/browse/trunk/README
говорит о либунвинде
http://www.nongnu.org/libunwind/
Хотелось бы услышать мнения этой библиотеки.
Проблема с -rdynamic заключается в том, что в некоторых случаях он может значительно увеличить размер двоичного файла.
Забудьте об изменении ваших источников и сделайте несколько хаков с помощью функции backtrace() или макросов - это просто плохие решения.
Как правильно работающее решение, я бы посоветовал:
- Скомпилируйте вашу программу с флагом "-g" для встраивания отладочных символов в двоичный файл (не беспокойтесь, это не повлияет на вашу производительность).
- В Linux выполните следующую команду: "ulimit -c unlimited" - чтобы система могла создавать большие аварийные дампы.
- Когда ваша программа рухнула, в рабочем каталоге вы увидите файл "core".
- Запустите следующую команду, чтобы напечатать backtrace в stdout: gdb -batch -ex "backtrace" ./your_program_exe ./core
Это напечатает правильную читаемую трассировку вашей программы в удобочитаемом виде (с именами исходных файлов и номерами строк). Более того, этот подход даст вам свободу в автоматизации вашей системы: создайте короткий сценарий, который проверяет, создал ли процесс дамп ядра, а затем отправьте обратные следы разработчикам по электронной почте или войдите в какую-либо систему регистрации.
Вы можете использовать DeathHandler - небольшой класс C++, который делает все для вас, надежно.
Некоторые версии libc содержат функции, которые имеют дело со следами стека; Вы можете использовать их:
http://www.gnu.org/software/libc/manual/html_node/Backtraces.html
Я помню, как давно использовал libunwind для получения трассировки стека, но он может не поддерживаться на вашей платформе.
ulimit -c unlimited
системная переменная, которая позволит создать дамп ядра после сбоя вашего приложения. В этом случае неограниченное количество. Ищите файл с именем core в том же каталоге. Убедитесь, что вы скомпилировали свой код с включенной отладочной информацией!
С уважением
Победа: как насчет StackWalk64 http://msdn.microsoft.com/en-us/library/ms680650.aspx
Как решение только для Windows, вы можете получить эквивалент трассировки стека (с гораздо большей информацией), используя отчеты об ошибках Windows. С помощью всего лишь нескольких записей реестра его можно настроить для сбора дампов пользовательского режима:
Начиная с Windows Server 2008 и Windows Vista с пакетом обновления 1 (SP1), отчеты об ошибках Windows (WER) можно настроить так, чтобы полные дампы пользовательского режима собирались и сохранялись локально после сбоя приложения пользовательского режима. [...]
Эта функция не включена по умолчанию. Включение этой функции требует прав администратора. Чтобы включить и настроить эту функцию, используйте следующие параметры реестра в разделе HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\ Отчеты об ошибках Windows \LocalDumps.
Вы можете установить записи реестра из вашего установщика, который имеет необходимые привилегии.
Создание дампа в режиме пользователя имеет следующие преимущества по сравнению с генерацией трассировки стека на клиенте:
- Это уже реализовано в системе. Вы можете использовать WER, как описано выше, или вызывать MiniDumpWriteDump самостоятельно, если вам нужен более детальный контроль над объемом информации, которую нужно выгрузить. (Обязательно вызовите его из другого процесса.)
- Путь более полный, чем трассировка стека. Среди прочего он может содержать локальные переменные, аргументы функций, стеки для других потоков, загруженные модули и так далее. Объем данных (и, следовательно, размер) очень настраиваемый.
- Нет необходимости отправлять отладочные символы. Это существенно уменьшает размер вашего развертывания, а также усложняет обратную разработку приложения.
- Во многом не зависит от используемого вами компилятора. Использование WER даже не требует никакого кода. В любом случае, возможность получить базу данных символов (PDB) очень полезна для автономного анализа. Я считаю, что GCC может либо генерировать PDB, либо существуют инструменты для преобразования базы данных символов в формат PDB.
Обратите внимание, что WER может быть вызван только сбоем приложения (т. Е. Системой, завершающей процесс из-за необработанного исключения). MiniDumpWriteDump
можно вызвать в любое время. Это может быть полезно, если вам нужно вывести текущее состояние для диагностики других проблем, кроме сбоя.
Обязательное чтение, если вы хотите оценить применимость мини-дампов:
Смотреть на:
Man 3 Backtrace
А также:
#include <exeinfo.h>
int backtrace(void **buffer, int size);
Это расширения GNU.
См. Средство Stack Trace в ACE (ADAPTIVE Communication Environment). Он уже написан для всех основных платформ (и не только). Библиотека лицензирована в стиле BSD, поэтому вы можете даже скопировать / вставить код, если не хотите использовать ACE.
Я могу помочь с версией для Linux: можно использовать функции backtrace, backtrace_symbols и backtrace_symbols_fd. Смотрите соответствующие страницы руководства.
Я видел много ответов здесь, выполняющих обработчик сигнала и затем выходящих. Это путь, но помните очень важный факт: если вы хотите получить дамп ядра для сгенерированной ошибки, вы не можете вызвать exit(status)
, Вызов abort()
вместо!
Я обнаружил, что решение @tgamblin не является полным. Он не может справиться с помощью stackru. Я думаю, потому что по умолчанию обработчик сигнала вызывается с тем же стеком, а SIGSEGV выбрасывается дважды. Для защиты вам нужно зарегистрировать независимый стек для обработчика сигналов.
Вы можете проверить это с помощью кода ниже. По умолчанию обработчик не выполняется. С определенным макросом STACK_OVERFLOW все в порядке.
#include <iostream>
#include <execinfo.h>
#include <signal.h>
#include <stdlib.h>
#include <unistd.h>
#include <string>
#include <cassert>
using namespace std;
//#define STACK_OVERFLOW
#ifdef STACK_OVERFLOW
static char stack_body[64*1024];
static stack_t sigseg_stack;
#endif
static struct sigaction sigseg_handler;
void handler(int sig) {
cerr << "sig seg fault handler" << endl;
const int asize = 10;
void *array[asize];
size_t size;
// get void*'s for all entries on the stack
size = backtrace(array, asize);
// print out all the frames to stderr
cerr << "stack trace: " << endl;
backtrace_symbols_fd(array, size, STDERR_FILENO);
cerr << "resend SIGSEGV to get core dump" << endl;
signal(sig, SIG_DFL);
kill(getpid(), sig);
}
void foo() {
foo();
}
int main(int argc, char **argv) {
#ifdef STACK_OVERFLOW
sigseg_stack.ss_sp = stack_body;
sigseg_stack.ss_flags = SS_ONSTACK;
sigseg_stack.ss_size = sizeof(stack_body);
assert(!sigaltstack(&sigseg_stack, nullptr));
sigseg_handler.sa_flags = SA_ONSTACK;
#else
sigseg_handler.sa_flags = SA_RESTART;
#endif
sigseg_handler.sa_handler = &handler;
assert(!sigaction(SIGSEGV, &sigseg_handler, nullptr));
cout << "sig action set" << endl;
foo();
return 0;
}
*nix: вы можете перехватить SIGSEGV (обычно этот сигнал перед сбоем) и сохранить информацию в файле. (помимо основного файла, который вы можете использовать для отладки, например, с помощью gdb).
win: проверьте это из msdn.
Вы также можете посмотреть на хромовый код Google, чтобы увидеть, как он обрабатывает сбои. У этого есть хороший механизм обработки исключений.
Я бы использовал код, который генерирует трассировку стека для утечки памяти в Visual Leak Detector. Это работает только на Win32, хотя.
Если вы все еще хотите пойти в одиночку, как я, вы можете связать против bfd
и избегать использования addr2line
как я сделал здесь:
https://github.com/gnif/LookingGlass/blob/master/common/src/crash.linux.c
Это производит вывод:
[E] crash.linux.c:170 | crit_err_hdlr | ==== FATAL CRASH (a12-151-g28b12c85f4+1) ====
[E] crash.linux.c:171 | crit_err_hdlr | signal 11 (Segmentation fault), address is (nil)
[E] crash.linux.c:194 | crit_err_hdlr | [trace]: (0) /home/geoff/Projects/LookingGlass/client/src/main.c:936 (register_key_binds)
[E] crash.linux.c:194 | crit_err_hdlr | [trace]: (1) /home/geoff/Projects/LookingGlass/client/src/main.c:1069 (run)
[E] crash.linux.c:194 | crit_err_hdlr | [trace]: (2) /home/geoff/Projects/LookingGlass/client/src/main.c:1314 (main)
[E] crash.linux.c:199 | crit_err_hdlr | [trace]: (3) /lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xeb) [0x7f8aa65f809b]
[E] crash.linux.c:199 | crit_err_hdlr | [trace]: (4) ./looking-glass-client(_start+0x2a) [0x55c70fc4aeca]
В дополнение к приведенным выше ответам, здесь вы узнаете, как заставить ОС Debian Linux генерировать дамп ядра
- Создайте папку "coredumps" в домашней папке пользователя
- Перейдите в /etc/security/limits.conf. Под строкой "" введите "soft core unlimited" и "root soft core unlimited", если разрешены дампы ядра для root, чтобы обеспечить неограниченное пространство для дампов ядра.
- ПРИМЕЧАНИЕ: "* soft core unlimited" не распространяется на root, поэтому root должен быть указан в отдельной строке.
- Чтобы проверить эти значения, выйдите из системы, войдите снова и введите "ulimit -a". "Основной размер файла" должен быть неограниченным.
- Проверьте файлы.bashrc (пользователь и root, если применимо), чтобы убедиться, что там не установлен ulimit. В противном случае указанное выше значение будет перезаписано при запуске.
- Откройте /etc/sysctl.conf. Введите следующее внизу: "kernel.core_pattern = /home//coredumps/%e_%t.dump". (%e будет именем процесса, а% t будет системным временем)
- Выйдите и введите "sysctl -p", чтобы загрузить новую конфигурацию. Проверьте / proc / sys / kernel/core_pattern и убедитесь, что это соответствует тому, что вы только что набрали.
- Дамп ядра можно проверить, запустив процесс в командной строке ("&"), а затем убив его командой "kill -11". Если дамп ядра успешен, вы увидите "(дамп ядра)" после индикации ошибки сегментации.
В Linux/unix/MacOSX используйте основные файлы (вы можете включить их с помощью ulimit или совместимого системного вызова). В Windows используйте отчеты об ошибках Microsoft (вы можете стать партнером и получить доступ к данным о сбое вашего приложения).
Я забыл о технологии GNOME "apport", но я не очень разбираюсь в ее использовании. Он используется для генерации трассировки стека и другой диагностики для обработки и может автоматически регистрировать ошибки. Это, безусловно, стоит проверить в.