Описание тега parallelism-amdahl
Amdahl's law, also known as Amdahl's argument, is used to find the maximum expected improvement to an overall system when only part of the system is improved. It is often used in parallel computing to predict the theoretical maximum speedup using multiple processors. The law is named after computer architect Gene Amdahl, and was presented at the AFIPS Spring Joint Computer Conference in 1967.
0
ответов
cv::parallel_for_ не очень большое улучшение
Я тестирую класс cv::ParallelLoopBody для обработки кода изображения. Сначала я начал реализовывать нормализацию, где я должен разделить все пиксели с определенными значениями для каждого канала, что является простым приятным распараллеленным кодом.…
14 дек '17 в 22:47
1
ответ
OpenMP - случайное время работы - почему такая большая разница во время выполнения?
Я слежу за лекциямиТима Маттсона по OpenMP, чтобы изучить способы реализации некоторых концепций параллельного программирования. Я пытался наблюдать поведение во время выполнения параллельной программы, которая вычисляет значение PI, используя3x10^8…
17 апр '18 в 20:10
1
ответ
RegCM, MPICH, компьютерная кластеризация
Справочная информация: мне нужно выполнить огромный расчет для моделирования климата с более чем 800 [GB] данных (за последние 50 лет и будущие 80 лет). Для этого я использую RegCM4 на основе Linux. Я использую Ubuntu. Самая мощная из имеющихся у на…
01 дек '17 в 15:41
1
ответ
Увидим ли мы ожидаемое ускорение в часовне, если будут работать "внутри" виртуальных машин?
В следующем семестре я преподаю в Chapel, и мы рассматриваем возможность использования виртуальной машины для студентов вместо физической машины. Как часть класса, я хочу, чтобы студенты могли видеть ускорение при использовании нескольких потоков. Я…
11 дек '17 в 21:31
2
ответа
OpenMP худшая производительность с большим количеством потоков (после уроков openMP)
Я начинаю работать с OpenMP и следую этим урокам: Учебники по OpenMP Я кодирую именно то, что появляется на видео, но вместо лучшей производительности с большим количеством потоков мне становится хуже. Я не понимаю почему. Вот мой код: #include <…
08 май '18 в 17:20
2
ответа
Пафос: варианты параллельной обработки - может кто-нибудь объяснить разницу?
Я пытаюсь запустить параллельные процессы под python (на Ubuntu). Я начал использовать многопроцессорность, и она работала хорошо для простых примеров.Затем произошла ошибка с засолкой, и я перешел на пафос. Я немного запутался с различными опциями …
26 фев '18 в 14:24
2
ответа
Почему многопроцессорная обработка python занимает больше времени, чем последовательный код? Как ускорить это?
Я опробовал многопроцессорный модуль Python. В приведенном ниже коде время последовательного выполнения составляет 0,09 секунды, а время параллельного выполнения составляет 0,2 секунды. Так как я не ускоряюсь, я думаю, что где-то не так import multi…
01 дек '17 в 06:41
1
ответ
Код OpenCL на MQL5 не получает распределенные задания для каждого ядра GPU
Я создал индикатор на основе графического процессора для платформы терминала MetaTrader, используя OpenCL и MQL5. Я изо всех сил старался, чтобы моя работа по оптимизации [ MetaTrader Terminal: Strategy Tester ] была перенесена на GPU по максимуму. …
16 май '18 в 07:03
2
ответа
Ускорение без серийной дроби
Я провел ряд экспериментов на параллельном пакете, скажем superlu-dist с разными номерами процессора, например: 4, 16, 32, 64 Я получил время настенных часов для каждого эксперимента, скажем: 53.17s, 32.65s, 24.30s, 16.03s Формула ускорения: serial …
20 май '18 в 13:09
1
ответ
Кривая ускорения графика в зависимости от количества потоков OpenMP - масштабируемость?
Я работаю над кодом C++, который использует потоки OpenMP. Я построил кривую ускорения в зависимости от количества потоков OpenMP и теоретической кривой (если код мог быть полностью распараллелен). вот этот сюжет: Исходя из этой картины, можем ли мы…
22 окт '14 в 18:13
2
ответа
Рассчитать прирост производительности, используя закон Амдаля
Я озадачен Законом Амдала, чтобы определить прирост производительности и часть последовательного приложения, и не могу понять этого. Известно следующее: S(N) = Speedup factor for (N) CPU's N = Number of CPU's f = The part of the program which is exe…
11 фев '12 в 18:53
3
ответа
Издержки на блок-схеме Intel TBB
Вот моя попытка измерить производительность потоковой диаграммы Intel TBB. Вот установка: Отправка одного широковещательного узла continue_msg в N последующие узлы (а broadcast_node<continue_msg>) Каждый узел-преемник выполняет вычисление, кот…
03 янв '18 в 17:06
2
ответа
Закон Амдала и ГПУ
У меня есть пара сомнений относительно применения закона Амдала в отношении графических процессоров. Например, у меня есть код ядра, который я запустил с несколькими потоками, скажем, N. Итак, в законе amdahl количество процессоров будет равно N, ве…
13 сен '12 в 03:14
1
ответ
Нетривиальное перекодирование: как ускорить мою программу? Cython, Numba, многопроцессорность и NumPy?
У меня есть (или на самом деле работает) программа (стратегия торговли некоторыми парами), которая выполняет следующие действия: Получите подмножество больших данных (финансовые данные: индекс даты и времени и цены на акции для ~100 акций), установл…
31 мар '18 в 04:06
1
ответ
Относится ли -XX: parallelGCThreads = 8 к числу ядер по отношению к закону Амдала?
Вступление: В настоящее время я работаю над программным обеспечением, в котором я сравниваю последовательную программу с многопоточной. На моем оборудовании доступно 24 ядра и 16 ГБ оперативной памяти. Моя программа написана на Java, но выполнена из…
17 фев '14 в 17:05
2
ответа
Количество процессоров, необходимых для достижения определенного ускорения?
Проще говоря, программа имеет 15%, работающих в последовательной части, и 85% является ее параллельной частью. Как я могу определить максимальную скорость при бесконечном количестве процессоров? А также, как я могу выяснить, скажем, сколько процессо…
03 фев '15 в 18:30
2
ответа
python joblib & random walk - выполнение планирования [CONCURRENT]-процесса
Вот мой код на python-3.6 для моделирования 1D отраженного случайного блуждания с использованием joblib модуль для генерации 400 реализаций одновременно через K работники на машине кластера Linux. Я отмечаю, однако, что время выполнения для K=3 хуже…
14 июн '18 в 15:30
2
ответа
Почему закон Амдаля о последовательных и параллельных дробях не обеспечивает теоретическое ускорение 4 на четырехъядерном процессоре?
У меня есть код ( алгоритм Флойда-Варшалла для кратчайшего пути в NxN матрица), с тремя for -циклы, один внутри другого и с одинаковым количеством циклов. Напоследок for У меня есть назначение через троичной операции = <bool> ? <val1> : …
09 янв '17 в 12:02
3
ответа
Как заменить несколько шаблонов в одном файле, основываясь на первом слове строки?
У меня есть список фраз в одном файле (" phrases "), каждое существо на своей линии. У меня также есть другой файл, который содержит список слов, каждое в строке (" words "). Я хочу добавить звездочку в конце каждой фразы в " phrases ", который начи…
27 ноя '17 в 14:26
2
ответа
Альфа-бета "нарушает" закон Амдала?
У меня есть классическое минимаксное решение проблем с дополнительной реализацией сокращения альфа-бета. Я распараллелил алгоритм следующим образом: Делайте итеративное углубление, пока у нас не будет больше узлов, чем доступных потоков Запускайте о…
06 фев '15 в 14:11