Не можете изменить тип базы данных Berkeley DB в Java Edition?

Я искал изменение типа базы данных Java Edition 4.1.7 BDB с BTree на Hash. Базовая версия имела DatabaseType.HASH, DatabaseType.RECNO и DatabaseType.Queue- не поддерживаются ли они в Java Edition. Если так, то есть ли причина для того, чтобы отбросить их?

2 ответа

Дэвид Сигло, директор по управлению продуктами для Berkeley DB здесь. Как правило, мы рекомендуем, чтобы люди задавали вопросы на форумах Berkeley DB. Там вы найдете большое сообщество активных разработчиков приложений Berkeley DB.

Да, Berkeley DB (оригинальный продукт на C) имеет методы доступа B-Tree, Hash, Queue и Recno. Berkeley DB Java Edition поддерживает только B-Tree. Основная причина этого заключается в том, что около 99% наших пользователей используют B-Tree для хранения, а Hash используется только небольшим набором приложений.

Несколько полезных технических моментов вокруг этой темы:

  1. Хэш особенно полезен для людей, которые имеют огромный набор данных и очень маленький объем доступной кэш-памяти. В этом конкретном сценарии B-Tree может потребоваться несколько операций ввода-вывода, чтобы извлечь страницы внутреннего индекса (которые не помещаются в кэш), а затем извлечь запись. Хэш обычно может получить доступ к записи данных с помощью одного ввода / вывода.
  2. Хеш, как правило, бесполезен, если вы хотите получить последовательный доступ к вашим данным или разрешить дублирование, поскольку в индексе хеша нет подразумеваемого упорядочения.
  3. Большинство приложений имеют достаточно доступной кэш-памяти для хранения внутренних узлов B-дерева, а также наиболее часто используемых записей данных. В этом гораздо более распространенном сценарии B-дерево и Hash будут иметь практически одинаковую производительность.
  4. В течение последнего года команда Berkeley DB Java Edition очень тесно сотрудничала с заказчиками и разработчиками приложений, используя очень большие наборы данных (в диапазоне 250 ГБ - низкий ТБ). В частности, они сосредоточились на том, как максимизировать эффективность кэша, улучшить алгоритмы удаления кэша и минимизировать влияние сборки мусора Java. Мы обнаружили, что BDB JE 4.1 работает намного лучше с точки зрения управления кэшем и его эффективности, особенно для наборов данных, которые превышают доступный кэш. Для получения дополнительной информации об этом изменении см. Журнал изменений BDB JE 4.1.7 на странице загрузки Berkeley DB.
  5. Для получения дополнительной информации о методах доступа Hash vs B-Tree в Berkeley DB см. Главу 2 Справочного руководства BDB (Выбор метода доступа).

Я надеюсь, что это было полезно.

С Уважением,

Дейв

Я тоже пытался понять то же самое. Я также был бы признателен за возможность использования Hash в berkeley db je, поскольку я работаю в сценарии (1), поэтому с определенным соотношением между объемом памяти и размером набора данных.

Есть ли варианты по этому поводу? Вы планируете вернуть это в будущем? Сайт berkeley db je на oracle.com сообщает, что время доступа постоянно независимо от размера набора данных. Если вы используете BTrees, это утверждение неверно.

Другие вопросы по тегам