Описание тега data-partitioning

Разделение данных имеет дело с разделением набора данных на более мелкие коллекции данных с целью более быстрой обработки, более легкого сбора статистики и меньшего объема памяти / постоянства.
1 ответ

Kafka Streams: Частичная переработка по ключу

Сценарий: В сценарии веб- сеанса KafkaStreams с неограниченным (или многолетним) хранением, с интерактивными запросами (это может быть просмотрено при необходимости), со многими клиентами, каждый из которых имеет много пользователей (каждый пользова…
2 ответа

Используя jq, как я могу разбить очень большой файл JSON на несколько файлов, каждый из которых содержит определенное количество объектов?

У меня есть большой файл JSON с 4 миллионами объектов. Каждый верхний уровень имеет несколько уровней, вложенных внутрь. Я хочу разделить это на несколько файлов по 10000 объектов верхнего уровня каждый (сохранив структуру внутри каждого). JQ должен…
13 апр '18 в 02:52
0 ответов

Как фильтровать разделы на основе диапазона дат

У меня есть таблица улья, которая разделена на y, m, d, h, min(у =2018/ м =06/ д =05/ ч =10/ мин =00) в UTC. Я собираюсь запросить эту таблицу на основе диапазона дат в IST. Например, если я хочу запросить диапазон дат с 12-04-2018 по 16-06-2018 в I…
05 июн '18 в 12:13
1 ответ

Можно ли использовать имя раздела таблицы базы данных как часть предложения WHERE для оператора IBM DB2 9.7 SELECT?

Я пытаюсь выбрать все данные из одного и того же конкретного табличного раздела для более 100 таблиц с помощью утилиты DB2 EXPORT. Имя раздела является постоянным во всех моих многораздельных таблицах, что делает этот метод более выгодным, чем испол…
16 фев '16 в 18:12
1 ответ

Разделить большой JSON-файл с хэш-структурой на несколько небольших файлов

Я работаю с очень большим файлом JSON, который имеет хеш-подобную структуру: { "1893": { "foo": { "2600": { ...[snip]... }, "3520": { ...[snip]... } } "id": "foobar" }, "123": { "bar": { "4989": { ...[snip]... }, "0098": { ...[snip]... } } "id": "fo…
1 ответ

Алгоритм C для проблем с разделами

Дан набор целых чисел S: Как можно разделить множество на k частей так, чтобы сумма каждой части была минимальной? Пожалуйста, дайте также C реализация. Пример: S = {1, 2, 3, 4, 5, 6} and k = 3 Раздел S1 = {1, 6} S2 = {2, 5} S3 = {3, 4} обладает сво…
21 мар '11 в 21:55
1 ответ

Запросы диапазона дат в хранилище таблиц Azure

Здравствуйте, ответ на мой вопрос: время ожидания доступа к таблице Windows Azure. Ключи разделов и ключи строк указывают на способ организации данных в моей учетной записи хранения Azure. У меня есть схема хранения таблиц, предназначенная для хране…
1 ответ

MySQL Partitioning: повышение производительности для многораздельных таблиц. Зачем?

Я реализовал тест, который проверяет постоянство операций чтения и записи в 10 различных таблицах. У меня есть 10 потоков Java, каждый выполняет запросы только к своей таблице: Потоки 1 выполняют операции с таблицей 1, Потоки 2 выполняют операции с …
1 ответ

Задержка доступа к таблице Windows Azure Ключи разделов и ключи строк

У нас есть система хранения таблиц Windows Azure, в которой у нас есть различные типы объектов, которые сообщают значения в течение дня, поэтому у нас есть следующий сценарий раздела и ключа строки: Есть около 4000 - 5000 субъектов. Существует 6 тип…
1 ответ

Скорость алгоритма разделения пространства

Я разрабатываю 3D Game Engine как проект. Я хотел бы использовать алгоритмы разделения пространства для каждого треугольника / многоугольника в моей сцене, чтобы эффективно обнаруживать столкновения. Я просто хочу знать (перед тем как приступить к п…
31 июл '12 в 07:10
0 ответов

Обработка дубликатов ключей в быстрой сортировке

Наивная быстрая сортировка потребует O(n^2) времени для сортировки массива, не содержащего уникальных ключей, потому что все ключи будут разделены либо до, либо после значения pivot. Существуют способы обработки дублированных ключей (например, описа…
01 авг '11 в 19:03
4 ответа

Самый хороший и эффективный способ получить набор результатов последовательности элементов, выполняющих и не выполняющих условие

(Это профессиональная практика / интерес, а не домашняя работа) INPUT: любая неупорядоченная последовательность или элементы генератора, функция myfilter(item) возвращает True, если условие фильтра выполнено ВЫХОД: (filter_true, filter_false) кортеж…
06 сен '10 в 09:18
0 ответов

PL/SQL - каковы параметры для DBMS_MVIEW.REFRESH(), чтобы принудительно обновить раздел MV?

У меня есть MV с теми же разделами / подразделами, что и исходная таблица. Когда я делаю обмен разделами на исходной таблице, моя система знает, какие разделы были обменены и какие должны быть обновлены в MV. Я бы предпочел не помещать запись матери…
1 ответ

Невозможно создать абсолютно равные разделы данных с помощью createDataPartition в R- получать 1396 и 1398 наблюдений каждый, но нужно 1397

Я хорошо знаком с R, но никогда не имел этого требования, когда мне нужно было создать абсолютно одинаковый раздел данных случайным образом, используя createDataPartition в R. index = createDataPartition(final_ts$SAR,p=0.5, list = F) final_test_data…
04 янв '19 в 10:31
3 ответа

Проблема с пользовательским разделом

У меня есть следующая проблема: Учитывая набор из N целых чисел, разделите их на два почти равных разбиения таким образом, чтобы сумма большего разбиения была минимальной. Это звучит почти как классическая проблема разбиения с одним исключением: чет…
07 апр '11 в 18:21
1 ответ

Определите окно и используйте его в нескольких аналитических столбцах

У меня есть оракульный запрос, в котором мне нужно использовать несколько аналитических функций в одном окне. Как я могу определить окно один раз, а затем использовать его для каждого из этих вызовов? Т.е. я хочу написать это как в PostGRESql: SELEC…
17 май '17 в 07:25
4 ответа

Как разбить массив целых чисел на четные и нечетные?

Я хочу разделить массив (например, [1,2,3,4,5,6,7,8]) первый раздел должен содержать четные значения, второй нечетные значения (пример результата: [2,4,6,8,1,3,5,7]). Мне удалось решить эту проблему дважды с помощью встроенного Array.prototype метод…
14 июл '17 в 23:39
0 ответов

Разбиение массива на 3 столбца с помощью JS

Учитывая неизвестный массив целых чисел неизвестной длины, значения которых также неизвестны, как я могу организовать их в три столбца, чтобы сумма самой левой группы была наибольшей, средняя - второй по величине, а третья - наименьшей группы как мо…
14 мар '14 в 18:57
3 ответа

Честное разбиение множества S на k разбиений

Существует множество S, содержащее N целых чисел, каждое со значением 1<=X<=10^6. Проблема состоит в том, чтобы разбить множество S на k разделов. Значение раздела - это сумма элементов, присутствующих в нем. Разделение должно быть выполнено таким о…
0 ответов

Как разбить большой CSV-файл, обработать его на нескольких ядрах и объединить результат в один, используя nodeJs

У меня очень большой CSV-файл (370 ГБ). У меня достаточно оперативной памяти (64 ГБ) под управлением Windows 10. Я думаю, что следующее - лучший способ обработки данных в моей системе, но я не уверен, как это сделать. Я хочу разбить его на 4 разных …
21 июн '16 в 12:32