FLOPS (количество операций с плавающей точкой в ​​секунду): единица измерения, используемая для количественной оценки эффективности реализации численного алгоритма.
1 ответ

Код Python для бенчмарка во флопах с использованием потоков

У меня проблемы с написанием кода теста в Python с использованием потоков. Я смог заставить мои потоки работать, но я не могу заставить свой объект возвращать значение. Я хочу взять значения и добавить их в список, чтобы я мог рассчитать флопы. созд…
1 ответ

Сколько стоит производительность современной FPGA по отношению к процессору и в абсолютном выражении (GFlops/GIops)?

Сколько стоит производительность современной FPGA по сравнению с CPU, в абсолютном выражении (GFlops/GIops) и какова стоимость одного миллиарда целочисленных операций в секунду на FPGA? И в каких задачах сейчас выгодно использовать ПЛИС? Я только на…
31 авг '12 в 17:23
1 ответ

Вычисление максимальных провалов GPU с использованием OpenCL

Я пишу простое приложение OpenCL, которое собирается рассчитать максимальный эксперимент FLOPS целевого устройства с графическим процессором. Я решил сохранить ядро ​​cl максимально простым. Вот мое ядро ​​OpenCL и мой код хоста. Код ядра: __kernel …
11 апр '17 в 20:01
1 ответ

Как создать make-файл CUDA, чтобы он выполнялся в CPU для тестирования процессорных FLOP?

Я пытаюсь посчитать ошибки GPU и CPU, и у меня есть источник отсюда Я переименовал его в cudaflops.cu и скомпилировал его с этим make-файлом ################################################################################ # # Build script for projec…
21 окт '10 в 16:47
2 ответа

Расчет FLops

Я пишу программу для подсчета времени, которое требуется моему ЦП для выполнения одного "FLops". Для этого я написал код ниже before = clock(); y= 4.8; x= 2.3; z= 0; for (i = 0; i < MAX; ++i){ z=x*y+z; } printf("%1.20f\n", ( (clock()-before )/CLO…
03 мар '15 в 19:27
9 ответов

FLOPS что на самом деле FLOP

Я пришел из этой темы: шлепает ядро ​​Intel и тестирует его с помощью C (innerproduct) Когда я начал писать простые тестовые сценарии, у меня возникло несколько вопросов. Почему с плавающей точкой? Что такого значительного в плавающей точке, что мы …
09 окт '09 в 04:00
0 ответов

Какая операция должна быть в терминах FLOPS?

Каждый производитель оборудования любит предоставлять оценку производительности FLOPS для своего продукта - будь то процессор, графический процессор или специализированная плата FPGA/ASIC. Таким образом, он измеряет скорость некоторых операций в сек…
10 июн '18 в 05:19
2 ответа

Расчет gflops для двойной точности

У меня есть устройство, предоставляющее максимальные спецификации GFLOPS, и я хочу измерить, насколько далеко от него находится моя программа. Поскольку все данные, которые я использовал, имели двойную точность, я должен умножить количество операций…
19 мар '13 в 18:43
0 ответов

Как получить FLOPS в RISC-V, используя метод SW или HW?

Я новичок в RISC-V. Интересно, как я мог получить FLOPS, используя метод SW или HW. Я пытаюсь использовать CSR для получения FLOPS, но есть некоторые проблемы. Как я знаю, если я перепроектирую hpmcounter, который считает каждое событие плавающей оп…
30 мар '18 в 17:08
0 ответов

Расчет gFLOP процессора Intel

Как измерить gFLOP моего компьютера за цикл? Я использую следующий процессор - Intel(R) Pentium(R) CPU G620. Он работает на частоте 2,60 ГГц.
22 окт '12 в 17:13
0 ответов

Выбор подходящего устройства GPU для требований GFLOP

В таблице приведены требования к GFLOP для отдельных сетей. Например, resnet-50 требуется 4GFLOP для ввода изображения 224x224. Скажите, если бы я увеличил размер входного изображения до 600x600, насколько увеличится GFLOP? Скажем, я выбираю Quardro…
08 фев '19 в 07:23
1 ответ

Python FLOPS расчет

Я пытался получить стандартизированную оценку FLOPS для всех компьютеров, на которых я реализовал программу распределенной обработки Python. В то время как в настоящее время я могу достаточно хорошо рассчитать количество камней, они не особенно изве…
07 сен '12 в 02:41
1 ответ

Подсчет FLOP и размера данных и проверка, связана ли функция с памятью или с процессором

Я собираюсь проанализировать и оптимизировать некоторый C-код, и поэтому сначала я должен проверить, связаны ли функции, которые я хочу оптимизировать, с памятью или с процессором. В общем, я знаю, как это сделать, но у меня есть несколько вопросов …
05 май '13 в 12:45
1 ответ

Можно ли использовать FMA вместо ADD для операций XMM/YMM FP на Intel Haswell?

Этот вопрос относится к упакованным операциям с плавающей запятой одинарной точности с регистрами XMM/YMM в Haswell. Итак, в соответствии с потрясающей, потрясающей таблицей, составленной Агнером Фогом, я знаю, что MUL может быть выполнен на любом п…
04 мар '15 в 17:52
6 ответов

Какова относительная скорость сложения с плавающей запятой и умножения с плавающей запятой?

Десять или два года назад стоило написать числовой код, чтобы не использовать умножения и деления, а вместо этого использовать сложение и вычитание. Хорошим примером является использование прямых разностей для оценки полиномиальной кривой вместо неп…
3 ответа

У меток RFID есть процессор?

Есть ли у RFID-меток "настоящий" процессор, способный к простым вычислениям? Если да, то какова вычислительная мощность современных процессоров RFID?
01 авг '10 в 13:52
7 ответов

Как сравнить производительность двух кусков кода

У меня есть дружеское соревнование с парой парней в области программирования, и в последнее время мы так заинтересовались написанием эффективного кода. Наша задача состояла в том, чтобы попытаться оптимизировать код (в смысле времени и сложности про…
09 сен '12 в 16:33
5 ответов

Что считается флопом?

Скажем, у меня есть программа на Си, которая на псевдониме: For i=0 to 10 x++ a=2+x*5 next Является ли количество FLOP для этого (1 [x++] + 1 [x*5] + 1 [2+(x+5))] * 10[loop] для 30 FLOPS? У меня проблемы с пониманием, что такое флоп. Обратите вниман…
28 авг '10 в 22:01
1 ответ

GPU FLOPS и FPS

Я моделирую графический процессор (не могу раскрыть, какой именно) для оценки производительности приложений OpenCL и OpenGL. Модель может разумно оценить FLOPS исполняемого приложения / ядра / кода, есть ли способ оценить число кадров в секунду из F…
08 сен '14 в 02:43
1 ответ

Сроки Эксперимент - Матрицы

Определите размер матрицы, который вы можете удобно разместить в вашей доступной оперативной памяти. Например, если у вас есть машина на 4 ГБ, вы сможете удобно хранить матрицу, которая занимает около 800 МБ. Сохраните это значение в переменной Mb, …
02 мар '18 в 08:41