Описание тега kepler

Семейство графических процессоров NVIDIA, которые можно использовать для графики или вычислений.
2 ответа

Мониторинг аппаратного обеспечения NVENC (активный или бездействующий)

Мы можем запросить доступный графический процессор с помощью оборудования nvenc следующим образом: cuResult = cuInit(0); if (cuResult != CUDA_SUCCESS) { printf(">> GetNumberEncoders() - cuInit() failed error:0x%x\n", cuResult); exit(EXIT_FAILU…
09 авг '13 в 14:51
1 ответ

На блоках двойной точности (DPU) на Kepler K20Xm

Согласно документу по архитектуре Kepler, SMX имеет 192 Ядра CUDA и 64 Единицы двойной точности (DPU). Для K20Xm есть 14 SMX на общую сумму в 2688 ядра, что означает, что учитываются только ядра CUDA. Для чего же в действительности используется DPU …
09 дек '13 в 13:35
1 ответ

Почему инициализация графического процессора занимает очень много времени на архитектуре Kepler и как это исправить?

При запуске моего приложения самая первая cuda_malloc занимает 40 секунд, что связано с инициализацией графического процессора. Когда я работаю в режиме отладки, это сокращается до 5 секунд, а когда я запускаю тот же код на устройстве Fermi, это зан…
18 окт '13 в 15:17
2 ответа

Профилирование кэш-памяти второго уровня на CUDA Compute 3.x с nvprof

У меня проблема с профилированием кэша L2 на моей карте CUDA с вычислительными возможностями 3.5. В Kepler (3.x) нагрузки из глобальной памяти кэшируются только в L2 и никогда в L1. Мой вопрос: как мне использовать nvprof (профилировщик командной ст…
16 фев '14 в 14:09
1 ответ

CUDA: трансляция на уровне блоков потоков на K40 с использованием инструкций Shuffle

indirectJ2[MAX_SUPER_SIZE] это общий массив. Ядро моего устройства cuda содержит следующий оператор (выполняется всеми потоками в блоке потоков): int nnz_col = indirectJ2[MAX_SUPER_SIZE - 1]; Я подозреваю, что это приведет к банковским конфликтам. М…
08 мар '15 в 20:42
0 ответов

Планирование деформации в графическом процессоре Kepler

Я недавно прочитал технический документ GK110, в котором утверждается, что у каждого SM есть 4 планировщика основы, и у каждого из них есть две единицы отправки команд. В каждом цикле каждый планировщик деформации выбирает деформацию, которая подход…
08 май '18 в 07:32
1 ответ

Сколько ядер одновременно поддерживается на Kepler CC3.0/3.5, 16 или 32 (STREAMs)?

Как известно, Fermi поддерживает только одно подключение к графическому процессору, и, как написано здесь: http://on-demand.gputechconf.com/gtc-express/2011/presentations/StreamsAndConcurrencyWebinar.pdf Архитектура Fermi может одновременно поддержи…
21 окт '13 в 14:14
3 ответа

Kepler CUDA динамический параллелизм и дивергенция потоков

Существует очень мало информации о dynamic parallelism Кеплер, из описания этой новой технологии, означает ли это, что проблема расхождения потока управления потоком в той же основе решена? Это позволяет recursion и получение ядра из кода устройства…
09 июл '12 в 06:46
0 ответов

Как доступ к системе управления документооборотом kepler развернут в докер-контейнере

Я вытягиваю изображение kepler и затем запускаю контейнер из этого изображения, используя: Docker run -p 5900:5900 -it indigodatacloudapps/kepler Как я могу получить доступ к системе Kepler? Я набрал http://localhost:5900/, он возвращает RFB 003.007
13 дек '18 в 12:06
2 ответа

Kepler RCP CoolBar + внешний вид PerspectiveBar

Coolbar на всех приложениях Kepler RCP выглядит просто ужасно. Этот проект создан с нуля на Windows 8. Что это за толстая черная линия вокруг крутой панели? Может ли это быть сделано с помощью CSS? Из моего тестирования кажется, что оно появляется т…
23 окт '13 в 15:48
1 ответ

(pool-2-thread-5) Ошибка при закрытии канала JBREM00206

Мое затмение (Кеплер) застряло при запуске развертывания, щелкнув сервер RUN ON SER (JBOSS 7.0.1 final). Я могу успешно развернуть приложение с помощью ручного процесса (сделать войну и скопировать войну в каталог развертывания и запустить standalon…
18 мар '16 в 14:07
1 ответ

Происходит ли сериализация одновременных обращений к глобальной памяти по одному адресу при наличии уровней кэша L1 и L2?

Исходя из того, что я знаю, когда потоки деформации обращаются к одному и тому же адресу в глобальной памяти, запросы сериализуются, поэтому лучше использовать постоянную память. Происходит ли сериализация одновременных обращений к глобальной памяти…
16 ноя '13 в 02:52
1 ответ

* Изменено * Nvidia Maxwell, увеличено количество команд в глобальной памяти

У меня был эксперимент на GTX760(Kepler) и GTX750Ti(Maxwell) с использованием тестов (Parboil, Rodinia). Затем я проанализировал результаты с помощью визуального профилировщика Nvidia. В большинстве приложений количество глобальных команд в архитект…
18 мар '15 в 08:59
1 ответ

nvmlDeviceGetPowerManagementMode() всегда возвращает NVML_ERROR_INVALID_ARGUMENT?

Я пишу код для периодического измерения энергопотребления графического процессора NVIDIA Tesla K20 (архитектура Kepler) с использованием API-интерфейса NVML. Переменные: nvmlReturn_t result; nvmlEnableState_t pmmode; nvmlDevice_t nvmlDeviceID; unsig…
18 май '16 в 20:24
1 ответ

Почему отсутствуют зависимости после импорта gradle в eclipse kepler

Я импортировал проект JCPABE ( https://github.com/TU-Berlin-SNET/JCPABE) через интеграцию Buildship Gradle в Eclipse Kepler в Windows 10. Теперь многие пакеты показывают мне похожие ошибки, касающиеся 5-10 классов, которые не существуют, кажется, чт…
02 июл '17 в 12:28
1 ответ

vpython) Как смоделировать 2-й закон Кеплера?

Я очень плохо знаком с python, но мне нужно смоделировать второй закон Кеплера с помощью vpython! У меня так далеко идет орбита, но я не знаю, как кодировать движение, как кодировать т, тета и т. Д. Кто-нибудь может помочь? http://en.wikipedia.org/w…
10 дек '13 в 14:22
2 ответа

Блоки загрузки / хранения (LD/ST) и блоки специальных функций (SFU) для архитектуры Kepler

В техническом описании архитектуры Kepler NVIDIA утверждает, что 32 Специальные функциональные блоки (SFU) и 32 Загрузите / Сохраните Единицы (LD/ST) на SMX. SFU предназначены для "быстрых приближенных трансцендентных операций". К сожалению, я не по…
09 дек '13 в 14:09
1 ответ

Ошибка: внешние вызовы не поддерживаются (обнаружен не встроенный вызов cublasGetVersion_v2)

Я пытаюсь использовать вызов cublasIdamax(), но я получил похожую ошибку, как название. Поэтому я пишу простой код для проверки версии cublas, чтобы избежать ошибки версии в сигнатуре функции. Но даже этот простой код приводит к ошибке компиляции. В…
25 окт '13 в 16:25
2 ответа

HttpServlet является ограниченным классом. Пожалуйста, посмотрите Google App Engine

Я получаю следующую ошибку при запуске базового сервлета в Eclipse Kepler (Windows 7) с GAE SDK 1.9.3 и Java 7: java.lang.NoClassDefFoundError: javax.servlet.http.HttpServlet is a restricted class. Please see the Google App Engine developer's guide …
1 ответ

"Глобальная эффективность нагрузки" более 100%

У меня есть программа CUDA, в которой потоки блока читают элементы длинного массива за несколько итераций и обращения к памяти практически полностью объединены. При профилировании общая эффективность нагрузки превышает 100% (от 119% до 187% в зависи…
29 окт '13 в 05:56