Описание тега parallelism-amdahl

Amdahl's law, also known as Amdahl's argument, is used to find the maximum expected improvement to an overall system when only part of the system is improved. It is often used in parallel computing to predict the theoretical maximum speedup using multiple processors. The law is named after computer architect Gene Amdahl, and was presented at the AFIPS Spring Joint Computer Conference in 1967.
0 ответов

cv::parallel_for_ не очень большое улучшение

Я тестирую класс cv::ParallelLoopBody для обработки кода изображения. Сначала я начал реализовывать нормализацию, где я должен разделить все пиксели с определенными значениями для каждого канала, что является простым приятным распараллеленным кодом.…
1 ответ

OpenMP - случайное время работы - почему такая большая разница во время выполнения?

Я слежу за лекциямиТима Маттсона по OpenMP, чтобы изучить способы реализации некоторых концепций параллельного программирования. Я пытался наблюдать поведение во время выполнения параллельной программы, которая вычисляет значение PI, используя3x10^8…
1 ответ

RegCM, MPICH, компьютерная кластеризация

Справочная информация: мне нужно выполнить огромный расчет для моделирования климата с более чем 800 [GB] данных (за последние 50 лет и будущие 80 лет). Для этого я использую RegCM4 на основе Linux. Я использую Ubuntu. Самая мощная из имеющихся у на…
1 ответ

Увидим ли мы ожидаемое ускорение в часовне, если будут работать "внутри" виртуальных машин?

В следующем семестре я преподаю в Chapel, и мы рассматриваем возможность использования виртуальной машины для студентов вместо физической машины. Как часть класса, я хочу, чтобы студенты могли видеть ускорение при использовании нескольких потоков. Я…
2 ответа

OpenMP худшая производительность с большим количеством потоков (после уроков openMP)

Я начинаю работать с OpenMP и следую этим урокам: Учебники по OpenMP Я кодирую именно то, что появляется на видео, но вместо лучшей производительности с большим количеством потоков мне становится хуже. Я не понимаю почему. Вот мой код: #include <…
2 ответа

Пафос: варианты параллельной обработки - может кто-нибудь объяснить разницу?

Я пытаюсь запустить параллельные процессы под python (на Ubuntu). Я начал использовать многопроцессорность, и она работала хорошо для простых примеров.Затем произошла ошибка с засолкой, и я перешел на пафос. Я немного запутался с различными опциями …
2 ответа

Почему многопроцессорная обработка python занимает больше времени, чем последовательный код? Как ускорить это?

Я опробовал многопроцессорный модуль Python. В приведенном ниже коде время последовательного выполнения составляет 0,09 секунды, а время параллельного выполнения составляет 0,2 секунды. Так как я не ускоряюсь, я думаю, что где-то не так import multi…
1 ответ

Код OpenCL на MQL5 не получает распределенные задания для каждого ядра GPU

Я создал индикатор на основе графического процессора для платформы терминала MetaTrader, используя OpenCL и MQL5. Я изо всех сил старался, чтобы моя работа по оптимизации [ MetaTrader Terminal: Strategy Tester ] была перенесена на GPU по максимуму. …
2 ответа

Ускорение без серийной дроби

Я провел ряд экспериментов на параллельном пакете, скажем superlu-dist с разными номерами процессора, например: 4, 16, 32, 64 Я получил время настенных часов для каждого эксперимента, скажем: 53.17s, 32.65s, 24.30s, 16.03s Формула ускорения: serial …
1 ответ

Кривая ускорения графика в зависимости от количества потоков OpenMP - масштабируемость?

Я работаю над кодом C++, который использует потоки OpenMP. Я построил кривую ускорения в зависимости от количества потоков OpenMP и теоретической кривой (если код мог быть полностью распараллелен). вот этот сюжет: Исходя из этой картины, можем ли мы…
2 ответа

Рассчитать прирост производительности, используя закон Амдаля

Я озадачен Законом Амдала, чтобы определить прирост производительности и часть последовательного приложения, и не могу понять этого. Известно следующее: S(N) = Speedup factor for (N) CPU's N = Number of CPU's f = The part of the program which is exe…
3 ответа

Издержки на блок-схеме Intel TBB

Вот моя попытка измерить производительность потоковой диаграммы Intel TBB. Вот установка: Отправка одного широковещательного узла continue_msg в N последующие узлы (а broadcast_node<continue_msg>) Каждый узел-преемник выполняет вычисление, кот…
2 ответа

Закон Амдала и ГПУ

У меня есть пара сомнений относительно применения закона Амдала в отношении графических процессоров. Например, у меня есть код ядра, который я запустил с несколькими потоками, скажем, N. Итак, в законе amdahl количество процессоров будет равно N, ве…
13 сен '12 в 03:14
1 ответ

Нетривиальное перекодирование: как ускорить мою программу? Cython, Numba, многопроцессорность и NumPy?

У меня есть (или на самом деле работает) программа (стратегия торговли некоторыми парами), которая выполняет следующие действия: Получите подмножество больших данных (финансовые данные: индекс даты и времени и цены на акции для ~100 акций), установл…
1 ответ

Относится ли -XX: parallelGCThreads = 8 к числу ядер по отношению к закону Амдала?

Вступление: В настоящее время я работаю над программным обеспечением, в котором я сравниваю последовательную программу с многопоточной. На моем оборудовании доступно 24 ядра и 16 ГБ оперативной памяти. Моя программа написана на Java, но выполнена из…
17 фев '14 в 17:05
2 ответа

Количество процессоров, необходимых для достижения определенного ускорения?

Проще говоря, программа имеет 15%, работающих в последовательной части, и 85% является ее параллельной частью. Как я могу определить максимальную скорость при бесконечном количестве процессоров? А также, как я могу выяснить, скажем, сколько процессо…
03 фев '15 в 18:30
2 ответа

python joblib & random walk - выполнение планирования [CONCURRENT]-процесса

Вот мой код на python-3.6 для моделирования 1D отраженного случайного блуждания с использованием joblib модуль для генерации 400 реализаций одновременно через K работники на машине кластера Linux. Я отмечаю, однако, что время выполнения для K=3 хуже…
2 ответа

Почему закон Амдаля о последовательных и параллельных дробях не обеспечивает теоретическое ускорение 4 на четырехъядерном процессоре?

У меня есть код ( алгоритм Флойда-Варшалла для кратчайшего пути в NxN матрица), с тремя for -циклы, один внутри другого и с одинаковым количеством циклов. Напоследок for У меня есть назначение через троичной операции = <bool> ? <val1> : …
3 ответа

Как заменить несколько шаблонов в одном файле, основываясь на первом слове строки?

У меня есть список фраз в одном файле (" phrases "), каждое существо на своей линии. У меня также есть другой файл, который содержит список слов, каждое в строке (" words "). Я хочу добавить звездочку в конце каждой фразы в " phrases ", который начи…
27 ноя '17 в 14:26
2 ответа

Альфа-бета "нарушает" закон Амдала?

У меня есть классическое минимаксное решение проблем с дополнительной реализацией сокращения альфа-бета. Я распараллелил алгоритм следующим образом: Делайте итеративное углубление, пока у нас не будет больше узлов, чем доступных потоков Запускайте о…