Описание тега sse3
SSE3, Streaming Single Instruction Multiple Data Extensions 3, является третьей итерацией набора инструкций SSE для архитектуры (x86).
1
ответ
SIMD целочисленный магазин
Я пишу программу с использованием инструкций SSE для умножения и добавления целочисленных значений. Я сделал ту же программу с плавающей точкой, но мне не хватает инструкции для моей целочисленной версии. С помощью float, после того, как я завершил …
03 ноя '13 в 11:39
1
ответ
AVX и Bubble Sort
Я должен разработать алгоритм пузырьковой сортировки с инструкциями AVX с числами одинарной точности на входе. Может ли кто-нибудь помочь мне найти лучшую реализацию? Я сделал версию с пузырьковой сортировкой для SSE3: global sort32 sort32: start mo…
01 июл '13 в 14:53
1
ответ
Как работает _mm_mwait?
Как _mm_mwait от pmmintrin.h Работа? (Я имею в виду не Asm для этого, а действие и как это действие выполняется в системах NUMA. store Мониторинг легко реализовать только в системах на основе шины SMP с отслеживанием шины.) Какие процессоры это реал…
02 апр '10 в 02:23
1
ответ
(Vec4 x Mat4x4) продукт с использованием SIMD и улучшений
Я пишу сложную программу симуляции, и кажется, что самая трудоемкая процедура - это умножение четырех векторов (float4) на матрицу 4x4. Мне нужно запустить эту программу на нескольких компьютерах, которые более или менее старые. Вот почему я попытал…
26 июн '15 в 15:01
1
ответ
Действительно базовый SSE
У меня есть очень простая программа, которую я пытаюсь улучшить производительность. Один способ, который, как я знаю, поможет, - это использовать SSE3 (поскольку машина, на которой я работаю, поддерживает это), но я абсолютно не знаю, как это сделат…
02 ноя '11 в 05:23
1
ответ
Чтение файла с "пробелами" в массиве назначения
Я пытаюсь найти способ прочитать файл в массив с "пробелами":Таким образом, прочитанные данные находятся в байтовом массиве buffer на позициях buffer[0], buffer[2], .., buffer[2*i]без каких-либо существенных потерь скорости. Более конкретно, я хочу …
20 ноя '13 в 20:16
2
ответа
Как включить набор инструкций SSE3/SSE4.1 в Visual Studio 2008?
Я пытался следовать: Проект> Свойства> Свойства конфигурации> C/C++ > Генерация кода> Включить расширенный набор инструкций Но единственные варианты, которые я получил, были - SSE или SSE2. Благодарю.
05 май '10 в 20:06
2
ответа
Оптимизация кода с использованием встроенных функций Intel SSE для векторизации
Я впервые работаю с SSE. Я пытаюсь преобразовать простой кусок кода в более быструю версию, используя встроенную функцию Intel SSE (до SSE4.2). Кажется, я столкнулся с рядом ошибок. Скалярная версия кода: (простое умножение матриц) void mm(int n, do…
08 июн '12 в 16:50
1
ответ
Преобразование 24 - 16-битного аудио с использованием инструкций SSE/simd
Интересно, есть ли какой-нибудь быстрый способ сделать квантование от 24 до 16 бит на массиве аудиосэмплов (с использованием встроенных или asm). Исходный формат подписан 24 ле. Обновление: удалось выполнить преобразование, как описано: static void …
02 май '15 в 21:40
1
ответ
C++ SSE3 набор команд не включен
Я пытаюсь обработать некоторый скрытый марковский код в C++, используя библиотеку HMMlib из http://www.cs.au.dk/~asand/?page_id=152 Я использую Ubuntu 12.04, с gcc / g++ 4.6 Моя инструкция по компиляции: g++ -I/usr/local/boost_1_52_0 -I../ MAIN.cpp …
15 фев '13 в 11:36
2
ответа
Как включить встроенные функции SSSE3, но отключить их использование при оптимизации компилятора
У меня есть код, который использует внутренние команды SSSE3 (обратите внимание на тройку S) и проверку во время выполнения, нужно ли его использовать, поэтому я предположил, что приложение должно выполняться на процессорах без поддержки SSSE3. Одна…
16 июл '13 в 07:52
2
ответа
Уменьшение суммы беззнаковых байтов без переполнения с использованием SSE2 на Intel
Я пытаюсь найти уменьшение суммы 32 элементов (каждый 1-байтовых данных) на процессоре Intel i3. Я сделал это: s=0; for (i=0; i<32; i++) { s = s + a[i]; } Тем не менее, это занимает больше времени, так как мое приложение представляет собой прилож…
07 июн '12 в 13:13
2
ответа
Нарушения доступа к памяти при использовании операций SSE
Я пытался повторно реализовать некоторые существующие векторные и матричные классы для использования команд SSE3, и мне кажется, что я сталкиваюсь с этими ошибками "нарушения доступа к памяти" всякий раз, когда я выполняю серию операций над массивом…
12 сен '12 в 18:14
1
ответ
Должен ли я скомпилировать с -mssse3 при наличии кода ASM SSSE3?
У меня есть вопрос относительно компиляции сборки x264 на GCC. В сборке x264 имеется ассемблерный код, работающий с наборами команд, такими как SSE3 и SSSE3, и по умолчанию отключена автоматическая векторизация в make-файле. Должен ли я скомпилирова…
19 июл '12 в 11:08
1
ответ
Сумма четырех 32-битных элементов вектора _m128
Я использую встроенные функции для оптимизации моей программы. Но теперь я хотел бы суммировать четыре элемента в векторе __m128, чтобы сравнить результат со значением с плавающей запятой. Например, допустим, у меня есть этот 128-битный вектор: {a, …
15 апр '12 в 16:05
0
ответов
Ошибка MinGW Тип '__m128i' не может быть разрешен в затмении
В затмении с MinGW я пытаюсь скомпилировать c-код, имеющий некоторую внутреннюю инструкцию Intel (sse2 sse3). Я дал опцию компилятора -march=native -msse2 -msse3 -mssse3 -msse4.1, но я получаю ошибку Тип '__m128i' не может быть разрешен. Тем не мене…
08 май '15 в 05:41
1
ответ
ROS (операционная система робота) с флагом SSSE3
В последнее время я начал работать с ROS и застрял на одной проблеме. Мне нужно использовать некоторые классы, которые требуют расширения процессоров SSE2, SSE3 и SSSE3. Я попытался отредактировать файл manifest.xml моего пакета ROS следующим образо…
29 сен '12 в 20:24
3
ответа
Набор инструкций SSE не включен
Я получаю проблемы с этой ошибкой: "Набор инструкций SSE не включен". Как я могу понять это? У меня есть ACER i7, Ubuntu 11.10, пожалуйста, кто-нибудь может мне помочь? Любая помощь будет оценена! Также работает: sudo cat /proc/cpuinfo | grep flags …
04 фев '12 в 21:06
1
ответ
Преобразование из int в (16-разрядное) __m128i
У меня есть следующий код как часть программы, но когда я компилирую его, я получаю следующую ошибку: cannot convert ‘int’ to ‘__m128i {aka __vector(2) long long int}’ in assignment Где код: int t; int s; __m128i *array; __m128i vector; posix_memali…
30 янв '15 в 00:09
1
ответ
Как использовать векторы в ассемблерном коде x86 и SSE
Я не знаю, как получить доступ к вектору STL в x86. Я пытался сделать это так, но у меня есть некоторые ошибки. mov ebx, stl_vector mov eax, [ebx] ;Here I want to store the first element of the vector mov edx, [ebx + 4] ; I want to store the second …
02 май '16 в 15:01