Описание тега flops
FLOPS (количество операций с плавающей точкой в секунду): единица измерения, используемая для количественной оценки эффективности реализации численного алгоритма.
1
ответ
Код Python для бенчмарка во флопах с использованием потоков
У меня проблемы с написанием кода теста в Python с использованием потоков. Я смог заставить мои потоки работать, но я не могу заставить свой объект возвращать значение. Я хочу взять значения и добавить их в список, чтобы я мог рассчитать флопы. созд…
27 ноя '18 в 03:15
1
ответ
Сколько стоит производительность современной FPGA по отношению к процессору и в абсолютном выражении (GFlops/GIops)?
Сколько стоит производительность современной FPGA по сравнению с CPU, в абсолютном выражении (GFlops/GIops) и какова стоимость одного миллиарда целочисленных операций в секунду на FPGA? И в каких задачах сейчас выгодно использовать ПЛИС? Я только на…
31 авг '12 в 17:23
1
ответ
Вычисление максимальных провалов GPU с использованием OpenCL
Я пишу простое приложение OpenCL, которое собирается рассчитать максимальный эксперимент FLOPS целевого устройства с графическим процессором. Я решил сохранить ядро cl максимально простым. Вот мое ядро OpenCL и мой код хоста. Код ядра: __kernel …
11 апр '17 в 20:01
1
ответ
Как создать make-файл CUDA, чтобы он выполнялся в CPU для тестирования процессорных FLOP?
Я пытаюсь посчитать ошибки GPU и CPU, и у меня есть источник отсюда Я переименовал его в cudaflops.cu и скомпилировал его с этим make-файлом ################################################################################ # # Build script for projec…
21 окт '10 в 16:47
2
ответа
Расчет FLops
Я пишу программу для подсчета времени, которое требуется моему ЦП для выполнения одного "FLops". Для этого я написал код ниже before = clock(); y= 4.8; x= 2.3; z= 0; for (i = 0; i < MAX; ++i){ z=x*y+z; } printf("%1.20f\n", ( (clock()-before )/CLO…
03 мар '15 в 19:27
9
ответов
FLOPS что на самом деле FLOP
Я пришел из этой темы: шлепает ядро Intel и тестирует его с помощью C (innerproduct) Когда я начал писать простые тестовые сценарии, у меня возникло несколько вопросов. Почему с плавающей точкой? Что такого значительного в плавающей точке, что мы …
09 окт '09 в 04:00
0
ответов
Какая операция должна быть в терминах FLOPS?
Каждый производитель оборудования любит предоставлять оценку производительности FLOPS для своего продукта - будь то процессор, графический процессор или специализированная плата FPGA/ASIC. Таким образом, он измеряет скорость некоторых операций в сек…
10 июн '18 в 05:19
2
ответа
Расчет gflops для двойной точности
У меня есть устройство, предоставляющее максимальные спецификации GFLOPS, и я хочу измерить, насколько далеко от него находится моя программа. Поскольку все данные, которые я использовал, имели двойную точность, я должен умножить количество операций…
19 мар '13 в 18:43
0
ответов
Как получить FLOPS в RISC-V, используя метод SW или HW?
Я новичок в RISC-V. Интересно, как я мог получить FLOPS, используя метод SW или HW. Я пытаюсь использовать CSR для получения FLOPS, но есть некоторые проблемы. Как я знаю, если я перепроектирую hpmcounter, который считает каждое событие плавающей оп…
30 мар '18 в 17:08
0
ответов
Расчет gFLOP процессора Intel
Как измерить gFLOP моего компьютера за цикл? Я использую следующий процессор - Intel(R) Pentium(R) CPU G620. Он работает на частоте 2,60 ГГц.
22 окт '12 в 17:13
0
ответов
Выбор подходящего устройства GPU для требований GFLOP
В таблице приведены требования к GFLOP для отдельных сетей. Например, resnet-50 требуется 4GFLOP для ввода изображения 224x224. Скажите, если бы я увеличил размер входного изображения до 600x600, насколько увеличится GFLOP? Скажем, я выбираю Quardro…
08 фев '19 в 07:23
1
ответ
Python FLOPS расчет
Я пытался получить стандартизированную оценку FLOPS для всех компьютеров, на которых я реализовал программу распределенной обработки Python. В то время как в настоящее время я могу достаточно хорошо рассчитать количество камней, они не особенно изве…
07 сен '12 в 02:41
1
ответ
Подсчет FLOP и размера данных и проверка, связана ли функция с памятью или с процессором
Я собираюсь проанализировать и оптимизировать некоторый C-код, и поэтому сначала я должен проверить, связаны ли функции, которые я хочу оптимизировать, с памятью или с процессором. В общем, я знаю, как это сделать, но у меня есть несколько вопросов …
05 май '13 в 12:45
1
ответ
Можно ли использовать FMA вместо ADD для операций XMM/YMM FP на Intel Haswell?
Этот вопрос относится к упакованным операциям с плавающей запятой одинарной точности с регистрами XMM/YMM в Haswell. Итак, в соответствии с потрясающей, потрясающей таблицей, составленной Агнером Фогом, я знаю, что MUL может быть выполнен на любом п…
04 мар '15 в 17:52
6
ответов
Какова относительная скорость сложения с плавающей запятой и умножения с плавающей запятой?
Десять или два года назад стоило написать числовой код, чтобы не использовать умножения и деления, а вместо этого использовать сложение и вычитание. Хорошим примером является использование прямых разностей для оценки полиномиальной кривой вместо неп…
18 июл '09 в 01:49
3
ответа
У меток RFID есть процессор?
Есть ли у RFID-меток "настоящий" процессор, способный к простым вычислениям? Если да, то какова вычислительная мощность современных процессоров RFID?
01 авг '10 в 13:52
7
ответов
Как сравнить производительность двух кусков кода
У меня есть дружеское соревнование с парой парней в области программирования, и в последнее время мы так заинтересовались написанием эффективного кода. Наша задача состояла в том, чтобы попытаться оптимизировать код (в смысле времени и сложности про…
09 сен '12 в 16:33
5
ответов
Что считается флопом?
Скажем, у меня есть программа на Си, которая на псевдониме: For i=0 to 10 x++ a=2+x*5 next Является ли количество FLOP для этого (1 [x++] + 1 [x*5] + 1 [2+(x+5))] * 10[loop] для 30 FLOPS? У меня проблемы с пониманием, что такое флоп. Обратите вниман…
28 авг '10 в 22:01
1
ответ
GPU FLOPS и FPS
Я моделирую графический процессор (не могу раскрыть, какой именно) для оценки производительности приложений OpenCL и OpenGL. Модель может разумно оценить FLOPS исполняемого приложения / ядра / кода, есть ли способ оценить число кадров в секунду из F…
08 сен '14 в 02:43
1
ответ
Сроки Эксперимент - Матрицы
Определите размер матрицы, который вы можете удобно разместить в вашей доступной оперативной памяти. Например, если у вас есть машина на 4 ГБ, вы сможете удобно хранить матрицу, которая занимает около 800 МБ. Сохраните это значение в переменной Mb, …
02 мар '18 в 08:41