Ошибки valgrind при сборке с встраиванием, сделанные g++5 - ошибка в valgrind или g++5?
Точные версии g++ и valgrind:
g++-5 (Ubuntu 5.2.1-23ubuntu1~12.04) 5.2.1 20151031
valgrind-3.7.0
Я не стал вдаваться в то, какой именно флаг делает это (finline-small-functions/findirect-inlining/finline-functions/finline-functions-вызвано-единожды / опасно-врезать), потому что я тестирую это удаленно на travis, и я уже раздражен от ожидания, поэтому я просто использовал -fno-inline
(У меня нет работающей Linux на моей машине).
На самом деле я понятия не имел, что это из-за встраивания, и хотел, чтобы valgrind сообщил о реальной функции, которая вызвала ошибку, поэтому отключил встраивание... и вуаля!
Обратите внимание, что это происходит только с g++5 - я тестировал g++ 4.4/4.5/4.7/4.8/4.9 (4.6 не тестировался), а также clang++ 3.4/3.5/3.6/3.7/3.8 (а также все эти компиляторы под OSX тоже)
Вот ошибка:
==3063== 1 errors in context 1 of 1:
==3063== Invalid read of size 4
==3063== at 0x40092E: regTest(char const*, char const*) (a.cpp:17)
Это мой код:
// required includes
#include <cstdio> // printf and friends
#include <cstdlib> // malloc, free, qsort
#include <cstring> // strlen, strcpy, strtok
#include <new> // placement new
struct String
{
char* m_str;
void copy(const String& other) {
if(m_str)
free(m_str);
m_str = 0;
if(other.m_str) {
m_str = static_cast<char*>(malloc(strlen(other.m_str) + 1));
strcpy(m_str, other.m_str);
}
}
String(const char* in = 0)
: m_str(0) {
if(in == 0)
return;
m_str = static_cast<char*>(malloc(strlen(in) + 1));
strcpy(m_str, in);
}
String(const String& other)
: m_str(0) {
copy(other);
}
~String() {
if(m_str)
free(m_str);
}
String& operator=(const String& other) {
if(this != &other)
copy(other);
return *this;
}
};
template <class T>
class Vector
{
unsigned m_size;
unsigned m_capacity;
T* m_buffer;
public:
Vector()
: m_size(0)
, m_capacity(0)
, m_buffer(0) {}
Vector(const Vector& other)
: m_size(other.m_size)
, m_capacity(other.m_capacity)
, m_buffer(static_cast<T*>(malloc(sizeof(T) * m_capacity))) {
for(unsigned i = 0; i < m_size; ++i)
new(m_buffer + i) T(other.m_buffer[i]);
}
~Vector() {
for(unsigned i = 0; i < m_size; ++i)
(*(m_buffer + i)).~T();
free(m_buffer);
}
Vector& operator=(const Vector& other) {
if(this != &other) {
for(size_t i = 0; i < m_size; ++i)
(*(m_buffer + i)).~T();
free(m_buffer);
m_size = other.m_size;
m_capacity = other.m_capacity;
m_buffer = static_cast<T*>(malloc(sizeof(T) * m_capacity));
for(unsigned i = 0; i < m_size; ++i)
new(m_buffer + i) T(other.m_buffer[i]);
}
return *this;
}
unsigned size() const { return m_size; }
void push_back(const T& item) {
if(m_size < m_capacity) {
new(m_buffer + m_size++) T(item);
} else {
if(m_capacity == 0)
m_capacity = 5; // initial capacity
else
m_capacity *= 2; // capacity growth factor
T* temp = static_cast<T*>(malloc(sizeof(T) * m_capacity));
for(unsigned i = 0; i < m_size; ++i) {
new(temp + i) T(m_buffer[i]);
(*(m_buffer + i)).~T();
}
new(temp + m_size++) T(item);
free(m_buffer);
m_buffer = temp;
}
}
};
struct FunctionData
{
String m_suite;
String m_name;
const char* m_file;
FunctionData(const char* suite, const char* name, const char* file)
: m_suite(suite)
, m_name(name)
, m_file(file) {}
FunctionData(const FunctionData& other)
: m_suite(other.m_suite)
, m_name(other.m_name)
, m_file(other.m_file) {}
};
const char*& getCurrentTestSuite() {
static const char* data = 0;
return data;
}
int setTestSuiteName(const char* name) {
getCurrentTestSuite() = name;
return 0;
}
int regTest(const char* file, const char* name) {
Vector<FunctionData> temp;
temp.push_back(FunctionData(getCurrentTestSuite(), name, file));
// main() is empty and we dont want this optimized away
printf("hello! %d\n", temp.size());
return 0;
}
__attribute__((unused)) static int a1 = setTestSuiteName("current testsuite");
__attribute__((unused)) static int a2 = regTest("a.cpp", "zzz");
int main(int, char**) { return 0; }
Вот как я запускаю это:
g++-5 a.cpp -Wall -Wextra -pedantic -std=c++98 -g -O3 -fno-inline
valgrind --leak-check=full --track-origins=yes -v ./a.out
g++-5 a.cpp -Wall -Wextra -pedantic -std=c++98 -g -O3
valgrind --leak-check=full --track-origins=yes -v ./a.out
Второй запуск приводит к ошибке valgrind.
Удаление любого из членов FunctionData прекращает воспроизведение проблемы. Вырезание вектора из картинки также не приводит к ошибкам.
вот хранилище и вот журнал travis.
Я потратил больше нескольких часов на минимизацию этого, поэтому я закончил с минимизацией кода воспроизведения.
Так кто же не прав - g++5 или valgrind? или я? Что я должен делать дальше? почему это может происходить?
РЕДАКТИРОВАТЬ:
лол! только что заметил (a.cpp:17)
на ошибку, поэтому проблемная строка m_str = static_cast<char*>(malloc(strlen(other.m_str) + 1));
- но почему?!?!?! Даже если все встраивается в regTest()
- Я не думаю, что в этом простом коде есть настоящая ошибка
РЕДАКТИРОВАТЬ 2:
Только что попробовал с Ubuntu 14.04 локально с g++ (Ubuntu 5.3.0-3ubuntu1~14.04) 5.3.0 20151204
а также valgrind-3.10.1
и случай тот же - при компиляции с встраиванием возникает ошибка.
Также пробовал локально с g++-4.8 (Ubuntu 4.8.5-2ubuntu1~14.04.1) 4.8.5
и OMG! также глючит как г ++-5! возможно патч вошел в g++ 4.8.5, которого не было в 4.8.x и 4.9.x, которые использовались в travis
РЕДАКТИРОВАТЬ 3:
добавление __attribute__((noinline))
в конструктор (любой - обычный и копировать - работает с обоими) из String
класс решил проблему. Так это ошибка? что делать дальше?
РЕДАКТИРОВАТЬ 4:
Я играл немного больше, изменил код на этот (удалил класс Vector) и сумел вызвать ошибку из valgrind при компиляции с
g++ a.cpp -O3 -fno-elide-constructors
и без ошибок при компиляции с просто
g++ a.cpp -O3
(оба случая с включенным включением)
Что-то здесь не так с этими оптимизациями. Извините за многочисленные правки и длинный пост - я сейчас заткнусь.
РЕДАКТИРОВАТЬ 5:
друг сказал мне добавить -ggdb
при компиляции и теперь ошибка от valgrind для исходного кода такова:
==2150== Invalid read of size 4
==2150== at 0x40095E: copy (a.cpp:17)
==2150== by 0x40095E: String (a.cpp:33)
==2150== by 0x40095E: FunctionData (a.cpp:128)
==2150== by 0x40095E: push_back (a.cpp:106)
==2150== by 0x40095E: regTest(char const*, char const*) (a.cpp:144)
==2150== by 0x400B2C: __libc_csu_init (in /home/onqtam/a.out)
==2150== by 0x537CE54: (below main) (libc-start.c:246)
==2150== Address 0x5a37c90 is 16 bytes inside a block of size 18 alloc'd
==2150== at 0x4C2AB80: malloc (in /usr/lib/valgrind/vgpreload_memcheck-amd64-linux.so)
==2150== by 0x4008DF: String (a.cpp:27)
==2150== by 0x4008DF: FunctionData (a.cpp:123)
==2150== by 0x4008DF: regTest(char const*, char const*) (a.cpp:144)
==2150== by 0x400B2C: __libc_csu_init (in /home/onqtam/a.out)
==2150== by 0x537CE54: (below main) (libc-start.c:246)
1 ответ
Это связано с тем, что gcc оптимизирует strcpy для работы с 4-байтовыми блоками, что всегда безопасно, поскольку вы не можете выделить блок памяти, кратный 4 байтам (по крайней мере для x86 и x64). Таким образом, с точки зрения gcc, чтение определенно безопасно, но с точки зрения valgrind вы читаете после того, что, как вы сказали, вы выделите. Обычно valgrind может обнаружить, что вы делаете memcpy / memmove / strcpy / etc. и знает, как подавить ошибку, но когда вызов встроен, его обнаружение не удается, и вы получаете сообщение об ошибке.
Возможно, вы захотите заключить strcpy в вызов, чтобы предупредить Valgrind о том, что следующий доступ к памяти является безопасным, т. Е. См. http://valgrind.org/docs/manual/mc-manual.html, если вы очень хочется отлаживать с включенным агрессивным встраиванием.