Что означает "разыменование" указателя?
Пожалуйста, включите пример с объяснением.
6 ответов
Обзор основной терминологии
Обычно достаточно - если вы не программируете сборку - предусмотреть указатель, содержащий числовой адрес памяти, где 1 ссылается на второй байт в памяти процесса, 2 - третий, 3 - четвертый и т. Д.
- Что случилось с 0 и первым байтом? Что ж, мы вернемся к этому позже - см. Нулевые указатели ниже.
- Для более точного определения того, что хранят указатели и как соотносятся память и адреса, см. "Подробнее об адресах памяти и почему вам, вероятно, не нужно знать".
Если вы хотите получить доступ к данным / значению в памяти, на которые указывает указатель - к содержанию адреса с этим числовым индексом - тогда вы разыменовываете указатель.
Различные компьютерные языки имеют разные нотации, чтобы сообщить компилятору или интерпретатору, что вы сейчас заинтересованы в указанном значении - ниже я остановлюсь на C и C++.
Сценарий указателя
Рассмотрим в C, учитывая указатель, такой как p
ниже...
const char* p = "abc";
... четыре байта с числовыми значениями, используемыми для кодирования букв "a", "b", "c" и 0 байтов для обозначения конца текстовых данных, хранятся где-то в памяти, а числовой адрес этого данные хранятся в p
,
Например, если строковый литерал оказался по адресу 0x1000 и p
32-разрядный указатель на 0x2000, содержимое памяти будет:
Memory Address (hex) Variable name Contents
1000 'a' == 97 (ASCII)
1001 'b' == 98
1002 'c' == 99
1003 0
...
2000-2003 p 1000 hex
Обратите внимание, что для адреса 0x1000 нет имени / идентификатора переменной, но мы можем косвенно ссылаться на строковый литерал, используя указатель, хранящий его адрес: p
,
Разыменование указателя
Ссылаться на персонажей p
указывает на разыменование p
используя одно из этих обозначений (опять же, для C):
assert(*p == 'a'); // The first character at address p will be 'a'
assert(p[1] == 'b'); // p[1] actually dereferences a pointer created by adding
// p and 1 times the size of the things to which p points:
// In this case they're char which are 1 byte in C...
assert(*(p + 1) == 'b'); // Another notation for p[1]
Вы также можете перемещать указатели по указанным данным, разыменовывая их по мере продвижения:
++p; // Increment p so it's now 0x1001
assert(*p == 'b'); // p == 0x1001 which is where the 'b' is...
Если у вас есть данные, в которые можно записать данные, вы можете сделать что-то вроде этого:
int x = 2;
int* p_x = &x; // Put the address of the x variable into the pointer p_x
*p_x = 4; // Change the memory at the address in p_x to be 4
assert(x == 4); // Check x is now 4
Выше вы должны были знать во время компиляции, что вам понадобится переменная x
и код просит компилятор указать, где он должен быть сохранен, гарантируя, что адрес будет доступен через &x
,
Разыменование и доступ к элементу данных структуры
В C, если у вас есть переменная, которая является указателем на структуру с элементами данных, вы можете получить доступ к этим элементам, используя ->
оператор разыменования:
typedef struct X { int i_; double d_; } X;
X x;
X* p = &x;
p->d_ = 3.14159; // Dereference and access data member x.d_
(*p).d_ *= -1; // Another equivalent notation for accessing x.d_
Многобайтовые типы данных
Чтобы использовать указатель, компьютерной программе также необходимо получить представление о типе данных, на которые он указывает - если для этого типа данных требуется более одного байта, то указатель обычно указывает на байт с наименьшим номером в данных.
Итак, рассмотрим чуть более сложный пример:
double sizes[] = { 10.3, 13.4, 11.2, 19.4 };
double* p = sizes;
assert(p[0] == 10.3); // Knows to look at all the bytes in the first double value
assert(p[1] == 13.4); // Actually looks at bytes from address p + 1 * sizeof(double)
// (sizeof(double) is almost always eight bytes)
assert(++p); // Advance p by sizeof(double)
assert(*p == 13.4); // The double at memory beginning at address p has value 13.4
*(p + 2) = 29.8; // Change sizes[3] from 19.4 to 29.8
// Note: earlier ++p and + 2 here => sizes[3]
Указатели на динамически выделяемую память
Иногда вы не знаете, сколько памяти вам понадобится, пока ваша программа не запустится и не увидит, какие данные выбрасываются в нее... тогда вы можете динамически распределять память, используя malloc
, Это обычная практика хранить адрес в указателе...
int* p = malloc(sizeof(int)); // Get some memory somewhere...
*p = 10; // Dereference the pointer to the memory, then write a value in
fn(*p); // Call a function, passing it the value at address p
(*p) += 3; // Change the value, adding 3 to it
free(p); // Release the memory back to the heap allocation library
В C++ выделение памяти обычно выполняется с помощью new
оператор и освобождение от delete
:
int* p = new int(10); // Memory for one int with initial value 10
delete p;
p = new int[10]; // Memory for ten ints with unspecified initial value
delete[] p;
p = new int[10](); // Memory for ten ints that are value initialised (to 0)
delete[] p;
См. Также умные указатели C++ ниже.
Потеря и утечка адресов
Часто указатель может быть единственным указанием того, где некоторые данные или буфер существуют в памяти. Если требуется постоянное использование этих данных / буфера или возможность вызова free()
или же delete
чтобы не допустить утечки памяти, программист должен работать с копией указателя...
const char* p = asprintf("name: %s", name); // Common but non-Standard printf-on-heap
// Replace non-printable characters with underscores....
for (const char* q = p; *q; ++q)
if (!isprint(*q))
*q = '_';
printf("%s\n", p); // Only q was modified
free(p);
... или тщательно организовать аннулирование любых изменений...
const size_t n = ...;
p += n;
...
p -= n; // Restore earlier value...
C++ умные указатели
В C++ рекомендуется использовать объекты интеллектуальных указателей для хранения и управления указателями, автоматически освобождая их при запуске деструкторов интеллектуальных указателей. Начиная с C++11 стандартная библиотека предоставляет два, unique_ptr
когда есть единственный владелец для выделенного объекта...
{
std::unique_ptr<T> p{new T(42, "meaning")};
call_a_function(p);
// The function above might throw, so delete here is unreliable, but...
} // p's destructor's guaranteed to run "here", calling delete
...а также shared_ptr
для владения акциями (с использованием подсчета ссылок)...
{
std::shared_ptr<T> p(new T(3.14, "pi"));
number_storage.may_add(p); // Might copy p into its container
} // p's destructor will only delete the T if number_storage didn't copy
Нулевые указатели
В С, NULL
а также 0
- и дополнительно в C++ nullptr
- может использоваться, чтобы указать, что указатель в настоящее время не содержит адрес памяти переменной, и не должен разыменовываться или использоваться в арифметике указателя. Например:
const char* p_filename = NULL; // Or "= 0", or "= nullptr" in C++
char c;
while ((c = getopt(argc, argv, "f:")) != EOF)
switch (c) {
case f: p_filename = optarg; break;
}
if (p_filename) // Only NULL converts to false
... // Only get here if -f flag specified
В C и C++, так же как встроенные числовые типы не обязательно по умолчанию 0
ни bools
в false
указатели не всегда установлены на NULL
, Все они установлены в 0/false/NULL, когда они static
переменные или (только C++) прямые или косвенные переменные-члены статических объектов или их баз или инициализация нулевой инициализации (например, new T();
а также new T(x, y, z);
выполнить нулевую инициализацию для членов T, включая указатели, тогда как new T;
не).
Далее, когда вы назначаете 0
, NULL
а также nullptr
для указателя биты в указателе не обязательно сбрасываются: указатель может не содержать "0" на аппаратном уровне или ссылаться на адрес 0 в вашем виртуальном адресном пространстве. Компилятору разрешено хранить что-то еще, если у него есть для этого причина, но что бы он ни делал - если вы придете и сравните указатель с 0
, NULL
, nullptr
или другой указатель, которому был назначен любой из них, сравнение должно работать как положено. Итак, ниже исходного кода на уровне компилятора "NULL" потенциально немного "волшебен" в языках C и C++...
Подробнее об адресах памяти и почему вам, вероятно, не нужно знать
Более строго, инициализированные указатели хранят битовый шаблон, идентифицирующий либо NULL
или (часто виртуальный) адрес памяти.
В простом случае это числовое смещение во всем виртуальном адресном пространстве процесса; в более сложных случаях указатель может относиться к некоторой конкретной области памяти, которую ЦП может выбирать на основе регистров "сегмента" ЦП или некоторого вида идентификатора сегмента, закодированного в битовой структуре, и / или просматривая в разных местах в зависимости от инструкции машинного кода с использованием адреса.
Например, int*
правильно инициализирован, чтобы указать на int
переменная сила - после приведения к float*
- получить доступ к значению в памяти "GPU", совершенно отличному от int
переменная, а затем приведенная к указателю функции может относиться к отдельной памяти, содержащей машинные коды операции для функции.
Языки программирования 3GL, такие как C и C++, как правило, скрывают эту сложность, так что:
Если компилятор дает вам указатель на переменную или функцию, вы можете свободно разыменовывать его (если переменная не уничтожена / не удалена в это время), и проблема компилятора заключается в том, нужно ли, например, предварительно восстанавливать конкретный регистр ЦП, либо инструкция машинного кода используется
Если вы получите указатель на элемент в массиве, вы можете использовать арифметику указателей для перемещения в другое место в массиве или даже для формирования адреса один за другим в конце массива, что допустимо для сравнения с другими указателями на элементы в массиве (или которые были аналогично перемещены с помощью арифметики указателей к тому же значению "один за другим"); снова в C и C++, это зависит от компилятора, чтобы убедиться, что это "просто работает"
Определенные функции ОС, например отображение общей памяти, могут дать вам указатели, и они будут "просто работать" в пределах диапазона адресов, который имеет для них смысл
Попытки переместить законные указатели за эти границы, или привести произвольные числа к указателям, или использовать указатели, приведенные к несвязанным типам, обычно имеют неопределенное поведение, поэтому их следует избегать в библиотеках и приложениях более высокого уровня, но код для ОС, драйверы устройств и т. Д. Возможно, потребуется полагаться на поведение, оставленное неопределенным в C или C++, что, тем не менее, хорошо определяется их конкретным оборудованием.
Разыменование указателя означает получение значения, которое хранится в ячейке памяти, указанной указателем. Оператор * используется для этого и называется оператором разыменования.
int a = 10;
int* ptr = &a;
printf("%d", *ptr); // With *ptr I'm dereferencing the pointer.
// Which means, I am asking the value pointed at by the pointer.
// ptr is pointing to the location in memory of the variable a.
// In a's location, we have 10. So, dereferencing gives this value.
// Since we have indirect control over a's location, we can modify its content using the pointer. This is an indirect way to access a.
*ptr = 20; // Now a's content is no longer 10, and has been modified to 20.
Проще говоря, разыменование означает доступ к значению из определенной области памяти, на которую указывает этот указатель.
Указатель - это "ссылка" на значение... так же, как номер вызова библиотеки - это ссылка на книгу. "Разыменование" номера вызова физически проходит и извлекает эту книгу.
int a=4 ;
int *pA = &a ;
printf( "The REFERENCE/call number for the variable `a` is %p\n", pA ) ;
// The * causes pA to DEREFERENCE... `a` via "callnumber" `pA`.
printf( "%d\n", *pA ) ; // prints 4..
Если книги нет, библиотекарь начинает кричать, закрывает библиотеку, и пара людей собирается выяснить причину, по которой человек найдет книгу, которой там нет.
Код и объяснение из Основы указателя:
Операция разыменования начинается с указателя и следует за его стрелкой, чтобы получить доступ к указателю. Цель может состоять в том, чтобы посмотреть на состояние pointee или изменить состояние pointee. Операция разыменования для указателя работает, только если указатель имеет указатель - указатель должен быть выделен, и указатель должен быть установлен, чтобы указывать на него. Самая распространенная ошибка в коде указателя - забывание установить pointee. Самым распространенным падением во время выполнения из-за этой ошибки в коде является неудачная операция разыменования. В Java некорректная разыменование будет вежливо помечено системой времени выполнения. В скомпилированных языках, таких как C, C++ и Pascal, неправильное разыменование иногда приводит к сбою, а иногда к повреждению памяти каким-то тонким, случайным образом. По этой причине может быть трудно отследить ошибки указателя в скомпилированных языках.
void main() {
int* x; // Allocate the pointer x
x = malloc(sizeof(int)); // Allocate an int pointee,
// and set x to point to it
*x = 42; // Dereference x to store 42 in its pointee
}
Я думаю, что все предыдущие ответы неверны, поскольку они утверждают, что разыменование означает доступ к фактическому значению. Вместо этого Википедия дает правильное определение: https://en.wikipedia.org/wiki/Dereference_operator
Он работает с переменной указателя и возвращает значение l, эквивалентное значению по адресу указателя. Это называется разыменованием указателя.
Тем не менее, мы можем разыменовать указатель, не обращаясь к значению, на которое он указывает. Например:
char *p = NULL;
*p;
Мы разыменовали указатель NULL без доступа к его значению. Или мы могли бы сделать:
p1 = &(*p);
sz = sizeof(*p);
Опять же, разыменование, но никогда не доступ к значению. Такой код НЕ вылетит: сбой происходит, когда вы действительно получаете доступ к данным по недействительному указателю. Однако, к сожалению, согласно стандарту, разыменование недействительного указателя является неопределенным поведением (за некоторыми исключениями), даже если вы не пытаетесь прикоснуться к фактическим данным.
Короче говоря: разыменование указателя означает применение к нему оператора разыменования. Этот оператор просто возвращает l-значение для вашего будущего использования.