LevelDB C итератор

Мне нужно перебрать базу данных leveldb на языке c - https://github.com/google/leveldb/blob/master/include/leveldb/c.h. Все работает, кроме итерации. Результат идет с некоторыми двоичными данными шума:

key: value1
key: value2
key#&^$&*# value
one1(*@(# value1
two2%*@( value2

С символами $&*# и т. Д. Я показал двоичный вывод, stackru не позволяет поместить сюда двоичный вывод.

Код:

#include <leveldb/c.h>
#include <stdio.h>

int main() {
    leveldb_t *db;
    leveldb_options_t *options;
    leveldb_readoptions_t *roptions;
    leveldb_writeoptions_t *woptions;
    char *err = NULL;
    char *read;
    size_t read_len;

    /******************************************/
    /* OPEN */

    options = leveldb_options_create();
    leveldb_options_set_create_if_missing(options, 1);
    db = leveldb_open(options, "testdb", &err);

    if (err != NULL) {
      fprintf(stderr, "Open fail.\n");
      return(1);
    }

    /* reset error var */
    leveldb_free(err); err = NULL;

    /******************************************/
    /* WRITE */

    woptions = leveldb_writeoptions_create();
    leveldb_put(db, woptions, "one", 3, "value1", 6, &err);

    if (err != NULL) {
      fprintf(stderr, "Write fail.\n");
      return(1);
    }

    leveldb_free(err); err = NULL;

    /******************************************/
    /* WRITE 2 */

    woptions = leveldb_writeoptions_create();
    leveldb_put(db, woptions, "two", 3, "value2", 6, &err);

    if (err != NULL) {
      fprintf(stderr, "Write fail.\n");
      return(1);
    }

    leveldb_free(err); err = NULL;

    /******************************************/
    /* READ */

    roptions = leveldb_readoptions_create();
    read = leveldb_get(db, roptions, "one", 3, &read_len, &err);

    if (err != NULL) {
      fprintf(stderr, "Read fail.\n");
      return(1);
    }

    printf("key: %s\n", read);

    leveldb_free(err); err = NULL;

    /******************************************/
    /* READ 2 */

    roptions = leveldb_readoptions_create();
    read = leveldb_get(db, roptions, "two", 3, &read_len, &err);

    if (err != NULL) {
      fprintf(stderr, "Read fail.\n");
      return(1);
    }

    printf("key: %s\n", read);

    leveldb_free(err); err = NULL;

    /******************************************/
    /* ITERATE */

    roptions = leveldb_readoptions_create();
    leveldb_iterator_t *iter = leveldb_create_iterator(db, roptions);

    for (leveldb_iter_seek_to_first(iter); leveldb_iter_valid(iter); leveldb_iter_next(iter))
    {
        size_t key_len, value_len;
        const char *key_ptr = leveldb_iter_key(iter, &key_len);
        const char *value_ptr = leveldb_iter_value(iter, &value_len);

        /* Prints some binary noise with the data */
        printf("%s %s\n", key_ptr, value_ptr);
    }
    leveldb_iter_destroy(iter);
    leveldb_free(err); err = NULL;

    /******************************************/
    /* CLOSE */

    leveldb_close(db);

    return(0);
}

Как правильно перебрать LevelDB в C?

2 ответа

Решение

Кажется, что значения возвращаются leveldb_iter_key а также leveldb_iter_value неправильные строки с нулевым символом в конце.

Таким образом, грязное решение будет использовать

printf("%.*s %.*s\n", (int) key_len, key_ptr, (int) value_len, value_ptr);

вместо

printf("%s %s\n", key_ptr, value_ptr);

Тем не менее, IMO лучше скопировать эти значения в соответствии с их длиной, а затем использовать их.

Как вы можете видеть в https://github.com/google/leveldb/blob/master/db/c.cc#L197 leveldb_get создает срез соответствующей длины (Slice(key, keylen) на L205) и возвращает копию ключа (CopyString на L208).

Дополнительно:

Я проверил ваш код с помощью valgrind, и есть некоторые утечки памяти с опциями. Вы должны вручную освободить их (например, leveldb_writeoptions_destroy за woptions). leveldb_get Результаты (read) также должен быть освобожден.

Пример кода:

// allocate new strings
char * key = (char *) malloc(key_len + 1);
char * value = (char *) malloc(value_len + 1);

// copy string content and ensure that string is null-terminated
memcpy(key, key_ptr, key_len);
key[key_len] = 0;
memcpy(value, value_ptr, value_len);
value[value_len] = 0;

// print
printf("%s %s\n", key, value);

// free
free(key);
free(value);

LevelDB не использует строки C(++) для ключей и значений, он использует массивы байтов, которые могут содержать NUL и не заканчиваются NUL. Это задокументировано здесь: 1.

Было бы неправильно использовать любую строково-ориентированную функцию C для манипулирования этими массивами. Вы не можете использовать printf безопасно отображать возвращаемые значения.

Другие вопросы по тегам