Описание тега external-sorting

Внешняя сортировка описывает класс алгоритмов сортировки, которые могут обрабатывать большие объемы данных. Это требуется, когда сортируемые данные не помещаются в основную память вычислительного устройства (обычно ОЗУ), а вместо этого они должны находиться в более медленной внешней памяти (обычно на жестком диске).
2 ответа

Почему эта сортировка лучше всего подходит для внешней сортировки?

При изучении алгоритмов сортировки это называется сортировкой кучи, используемой для внешней сортировки. Я не могу понять, чем она отличается с точки зрения методов сортировки, когда мы имеем дело с внешним хранилищем? Или что это за то, что сортиро…
05 янв '18 в 16:01
1 ответ

Многократное слияние против двухстороннего слияния

Когда мы внешне объединяем сортировку большого файла, мы разделяем его на маленькие, сортируем и затем объединяем обратно в большой отсортированный файл. При слиянии мы можем сделать много проходов двухстороннего слияния или одно многократное слияни…
04 авг '12 в 06:22
1 ответ

StackruError при выполнении внешней сортировки

Я пытаюсь сделать внешний вид слияния. Метод: открыть все файлы в папке "output", получить 1-ю строку и отсортировать ее, записать в "final" файл, а затем получить 2-ю строку этого файла и повторить. Я получаю StackruError. Здесь мой размер файла бо…
1 ответ

Как рассчитать время внешней сортировки слиянием?

Исходная проблема такова:Вы должны отсортировать целые числа размером 1ПБ в диапазоне от -2^31 ~ 2^31 - 1 (int), у вас есть 1024 машины, каждая из которых имеет 1 ТБ дискового пространства и 16 ГБ памяти. Предположим, что скорость диска составляет 1…
27 фев '13 в 01:08
4 ответа

Несколько дочерних процессов + чтение из потока

Ссылаясь на мой последний вопрос (" Множественный дочерний процесс"), я сейчас пытаюсь сделать реализацию внешней сортировки с использованием нескольких дочерних процессов. ... fp = fopen(pathname, "r"); // open inputfile in r mode fgets(trash, 10, …
18 май '09 в 16:07
4 ответа

Эффективно читать очень большой текстовый файл в C++

У меня очень большой текстовый файл (45 ГБ). Каждая строка текстового файла содержит два 64-разрядных целых числа без знака, разделенных пробелами, как показано ниже. 4624996948753406865 10214715013130414417 4305027007407867230 4569406367070518418 1…
04 ноя '14 в 13:47
2 ответа

Несколько ifstreams против ifstream + постоянный поиск

Я пишу внешний вид слияния. Это работает так: чтение k блоков из большого файла, сортировка их в памяти, выполнение k-way merge, готово. Поэтому мне нужно последовательно читать из разных частей файла во время фазы слияния k-way. Какой лучший способ…
20 апр '10 в 13:04
1 ответ

Алгоритм внешнего поиска

Если у меня очень большой отсортированный список хранится во внешнем хранилище. Предполагая, что этот список не может быть перенесен во внутреннюю память, какой будет хороший алгоритм поиска, который ищет ключ в этом списке в псевдокоде? какова буде…
06 май '16 в 03:12
2 ответа

Внешняя сортировка с k-way merging против быстрой сортировки

Какой из них лучше? Скажем, 1 ГБ памяти и 100 ГБ файла для сортировки. Один случай потребности в 10-полосном объединении: - 100 загрузок по 1 ГБ с последующими 10*10 + 10*100 нагрузками по 100 МБ (для 10-полосных операций с последующим 10-полосным о…
16 сен '10 в 19:42
1 ответ

stxxl сортировка очень большого файла (Ubuntu)

Я пытаюсь отсортировать большой файл с около миллиарда записей (каждая из которых содержит четыре целых числа). Размер файла будет превышать 50 ГБ. Я тестирую свой код с 400 миллионами записей (около 6 ГБ файла). Моя конфигурация диска выглядит так:…
14 янв '15 в 04:05
1 ответ

java.io.FileNotFoundException: доступ запрещен, хотя я поставил разрешения в AndroidManifest

Мне снова нужна ваша помощь, пожалуйста! У меня есть приложение для Android, которое пишет / читает файлы в / из внешней памяти. Я написал все требуемые разрешения в AndroidManifest, но по-прежнему получаю сообщение об ошибке при отказе в доступе. H…
1 ответ

Как я могу сделать каталог на Java?

Я пытаюсь создать новый каталог с файлами, но функция mkdir() не работает, ни mkdirs(), Вот мой код: ... while (leitor.hasNext()){ String [] plv = LerPalavras(tamMem, leitor); Arrays.sort(plv); String nomeTemp = "/temp/temp" + contador + ".txt"; // …
17 май '18 в 02:10
1 ответ

Как мне реализовать этот внешний алгоритм сортировки слиянием в C?

Мне нужно смоделировать алгоритм внешней сортировки, учитывая, что на машине доступно только 96 байт памяти. Я использую 32-байтовые структуры, которые выглядят так: typedef struct { char usedmemory[31]; char key; }Register32; Я уже собираюсь разбит…
06 июн '17 в 16:06
1 ответ

Разработка алгоритма сортировки внешней памяти

Если у меня есть очень большой список, хранящийся во внешней памяти, который должен быть отсортирован. Поскольку этот список слишком велик для внутренней памяти, какие основные факторы следует учитывать при разработке алгоритма внешней сортировки?
06 май '16 в 00:27
2 ответа

Как я могу читать символы до определенного в Java?

Я хочу прочитать несколько слов из файла. Я не нашел никакого способа сделать это, поэтому я решил читать символ за символом, но мне нужно остановиться на пробелах, чтобы сохранить прочитанное слово в моем массиве и перейти к следующему. Я делаю при…
16 май '18 в 19:02
9 ответов

Есть ли простой способ сортировки массива символов *? C++

У меня есть массив char* в файле. Компания, в которой я работаю, хранит данные в виде простых файлов. Иногда данные сортируются, а иногда нет. Я хотел бы отсортировать данные в файлах. Теперь я мог бы написать код для этого с нуля. Есть ли более про…
24 ноя '08 в 15:33
0 ответов

Как эффективно выполнить запрос на равенство для данных значения ключа с разрешенными дублирующимися ключами?

У меня следующая ситуация: Данные = около 400 миллионов (строка1, строка2, оценка) кортежей Размер данных ~ 20 ГБ, не помещается в памяти. Данные хранятся в файле в формате csv и не сортируются ни по одному полю. Мне нужно эффективно получить все ко…
4 ответа

Внешняя сортировка с кучей?

У меня есть файл с большим объемом данных, и я хочу отсортировать его, храня только часть данных в памяти в любой момент времени. Я заметил, что сортировка слиянием популярна для внешней сортировки, но мне интересно, если это можно сделать с кучей (…
16 май '13 в 19:36
2 ответа

Внешняя сортировка между двумя файлами

Я пытаюсь разобраться с внешним видом для удовлетворения требований, которые у меня есть - и я не могу. Требуется внешняя сортировка файла произвольного размера, но с использованием только исходного файла и еще одного (назовите их fileA а также file…
03 окт '15 в 17:52
2 ответа

Объединение N отсортированных файлов с помощью K-способа слияния

Существует достаточно литературы о слиянии отсортированных файлов или о слиянии отсортированных файлов. Все они работают над теорией, согласно которой первый элемент каждого файла помещается в кучу, а затем, пока куча не станет пустой, опрашивает эт…