Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

RFpro.ru: Программирование на C / C++


Хостинг портала RFpro.ru:
Московский хостер
Профессиональный ХОСТИНГ на базе Linux x64 и Windows x64

РАССЫЛКИ ПОРТАЛА RFPRO.RU

Лучшие эксперты по данной тематике

Асмик Гаряка
Статус: Советник
Рейтинг: 11045
∙ повысить рейтинг »
Коцюрбенко Алексей aka Жерар
Статус: Советник
Рейтинг: 4069
∙ повысить рейтинг »
CradleA
Статус: Бакалавр
Рейтинг: 2152
∙ повысить рейтинг »

/ КОМПЬЮТЕРЫ И СОФТ / Программирование / C/C++

Номер выпуска:1776
Дата выхода:18.01.2013, 21:30
Администратор рассылки:Киселёва Алёна aka Verena (Академик)
Подписчиков / экспертов:96 / 67
Вопросов / ответов:1 / 1

Консультация # 187100: Здравствуйте! Прошу помощи в следующем вопросе: нужно изменить код программы под другую формулу Ниже приведен пример программы, демонстрирующей работы с SSE и результаты ее работы

Код :
...

Консультация # 187100:

Здравствуйте! Прошу помощи в следующем вопросе: нужно изменить код программы под другую формулу

Ниже приведен пример программы, демонстрирующей работы с SSE
и результаты ее работы

Код :
// SSEIntrinsics.cpp : Defines the entry point for the console application.
#include "stdafx.h"
#include <cstdio>
#include <iostream>
#include <cmath>
#include <windows.h>
#include <xmmintrin.h>
//calc function cpp: z = x*x + y*y + 0.5
void ComputeArrayCpp(
float* pArray1, // [in] first source array
float* pArray2, // [in] second source array
float* pResult, // [out] result array
int nSize) // [in] size of all arrays
{
int i;
float* pSource1 = pArray1;
float* pSource2 = pArray2;
float* pDest = pResult;
for ( i = 0; i < nSize; i++ )
{
*pDest = (float)sqrt((*pSource1) * (*pSource1) + (*pSource2)
* (*pSource2)) + 0.5f;
pSource1++;
pSource2++;
pDest++;
}
}
//calc function sse: z = x*x + y*y + 0.5
void ComputeArrayCppSSE(
float* pArray1, // [in] first source array
float* pArray2, // [in] second source array
float* pResult, // [out] result array
int nSize) // [in] size of all arrays
{
int nLoop = nSize/ 4;
__m128 m1, m2, m3, m4;
__m128* pSrc1 = (__m128*) pArray1;
__m128* pSrc2 = (__m128*) pArray2;
__m128* pDest = (__m128*) pResult;
__m128 m0_5 = _mm_set_ps1(0.5f); // m0_5[0, 1, 2, 3] = 0.5
for ( int i = 0; i < nLoop; i++ )
{
m1 = _mm_mul_ps(*pSrc1, *pSrc1); // m1 = *pSrc1 * *pSrc1
m2 = _mm_mul_ps(*pSrc2, *pSrc2); // m2 = *pSrc2 * *pSrc2
m3 = _mm_add_ps(m1, m2); // m3 = m1 + m2
m4 = _mm_sqrt_ps(m3); // m4 = sqrt(m3)
*pDest = _mm_add_ps(m4, m0_5); // *pDest = m4 + 0.5
pSrc1++;
pSrc2++;
pDest++;
}
}
//init array with sin(rnd())
void init(float* a, int size)
{
for(int i = 0; i < size; i++)
{
float x = (float)rand()/RAND_MAX;
a[i] = sin(x);
}
}
int _tmain(int argc, _TCHAR* argv[])
{
setlocale(LC_ALL, "Russian");
const int MAX_SIZE = 10000000;
float *a = (float*)_aligned_malloc(sizeof(float)*MAX_SIZE, 16);
float *b = (float*)_aligned_malloc(sizeof(float)*MAX_SIZE, 16);
float *c = (float*)_aligned_malloc(sizeof(float)*MAX_SIZE, 16);
DWORD startTime, endTime;
startTime = GetTickCount();
init(a, MAX_SIZE);
init(b, MAX_SIZE);
endTime = GetTickCount();
printf("Инициализация массивов: %d мс\n", endTime - startTime);
startTime = GetTickCount();
ComputeArrayCpp(a, b, c, MAX_SIZE);
endTime = GetTickCount();
printf("Вычисление средствами C++: %d мс\n", endTime - startTime);
startTime = GetTickCount();
ComputeArrayCppSSE(a, b, c, MAX_SIZE);
endTime = GetTickCount();
printf("Вычисление средствами SSE: %d мс\n", endTime - startTime);
_aligned_free(a);
_aligned_free(b);
_aligned_free(c);
return 0;
}


Код :
Результат работы программы:
Инициализация массивов: 2855 мс
Вычисление средствами C++: 889 мс
Вычисление средствами SSE: 62 мс

Дата отправки: 15.01.2013, 20:57
Вопрос задал: Евгений (Посетитель)
Всего ответов: 1
Страница онлайн-консультации »


Консультирует Лысков Игорь Витальевич (Старший модератор):

Здравствуйте, Евгений!
Прошу... Полная аналогия... smile

Код :
// SSEIntrinsics.cpp : Defines the entry point for the console application.
#include "stdafx.h"
#include <cstdio>
#include <iostream>
#include <cmath>
#include <windows.h>
#include <xmmintrin.h>
//calc function cpp: f(x,y,z) = x*x + y - sqrt(z*z + 1)
void ComputeArrayCpp(
	float* pArray1, // [in] first source array
	float* pArray2, // [in] second source array
	float* pArray3, // [in] third source array
	float* pResult, // [out] result array
	int nSize)		// [in] size of all arrays
{
	float*	pSource1 = pArray1;
	float*	pSource2 = pArray2;
	float*	pSource3 = pArray3;
	float*	pDest = pResult;
	for ( int i = 0; i < nSize; i++ )
	{
		*pDest = (float)((*pSource1) * (*pSource1) + (*pSource2) -
			sqrt((*pSource3) * (*pSource3)) + 1.f);
		pSource1++;
		pSource2++;
		pSource3++;
		pDest++;
	}
}
//calc function sse: f(x,y,z) = x*x + y - sqrt(z*z + 1)
void ComputeArrayCppSSE(
	float*	pArray1, // [in] first source array
	float*	pArray2, // [in] second source array
	float*	pArray3, // [in] third source array
	float*	pResult, // [out] result array
	int		nSize) // [in] size of all arrays
{
	int		nLoop = nSize/ 4;
	__m128	m1, m2, m3, m4;
	__m128* pSrc1 = (__m128*) pArray1;
	__m128* pSrc2 = (__m128*) pArray2;
	__m128* pSrc3 = (__m128*) pArray3;
	__m128* pDest = (__m128*) pResult;
	__m128 m1_0 = _mm_set_ps1(1.0f); // m1_0[0, 1, 2, 3] = 1.0
	for ( int i = 0; i < nLoop; i++ )
	{
		m1 = _mm_mul_ps(*pSrc1, *pSrc1);// m1 = x * x
		m2 = _mm_mul_ps(*pSrc3, *pSrc3);// m2 = z * z
		m3 = _mm_add_ps(m2, m1_0);		// m3 = z*z + 1.0
		m4 = _mm_sqrt_ps(m3);			// m4 = sqrt(z*z+1)
		m2 = _mm_add_ps(m1, *pSrc2);	// m2 = x*x + y
		*pDest = _mm_sub_ps(m2, m4);	// *pDest = x*x + y - sqrt(z*z+1)
		pSrc1++;
		pSrc2++;
		pSrc3++;
		pDest++;
	}
}
//init array with sin(rnd())
void init(float* a, int size)
{
	for(int i = 0; i < size; i++)
	{
		float x = (float)rand()/RAND_MAX;
		a[i] = sin(x);
	}
}
int _tmain(int argc, _TCHAR* argv[])
{
	setlocale(LC_ALL, "Russian");
	const int MAX_SIZE = 10000000;
	float *a = (float*)_aligned_malloc(sizeof(float)*MAX_SIZE, 16);
	float *b = (float*)_aligned_malloc(sizeof(float)*MAX_SIZE, 16);
	float *c = (float*)_aligned_malloc(sizeof(float)*MAX_SIZE, 16);
	float *f = (float*)_aligned_malloc(sizeof(float)*MAX_SIZE, 16);
	DWORD startTime, endTime;
	startTime = GetTickCount();
	init(a, MAX_SIZE);
	init(b, MAX_SIZE);
	init(c, MAX_SIZE);
	endTime = GetTickCount();
	printf("Инициализация массивов: %d мс\n", endTime - startTime);
	startTime = GetTickCount();
	ComputeArrayCpp(a, b, c, f, MAX_SIZE);
	endTime = GetTickCount();
	printf("Вычисление средствами C++: %d мс\n", endTime - startTime);
	startTime = GetTickCount();
	ComputeArrayCppSSE(a, b, c, f, MAX_SIZE);
	endTime = GetTickCount();
	printf("Вычисление средствами SSE: %d мс\n", endTime - startTime);
	_aligned_free(a);
	_aligned_free(b);
	_aligned_free(c);
	_aligned_free(f);
	return 0;
}

Консультировал: Лысков Игорь Витальевич (Старший модератор)
Дата отправки: 16.01.2013, 12:44
Рейтинг ответа:

НЕ одобряю 0 одобряю!


Оценить выпуск | Задать вопрос экспертам

главная страница  |  стать участником  |  получить консультацию
техническая поддержка  |  восстановить логин/пароль

Дорогой читатель!
Команда портала RFPRO.RU благодарит Вас за то, что Вы пользуетесь нашими услугами. Вы только что прочли очередной выпуск рассылки. Мы старались. Пожалуйста, оцените его. Если совет помог Вам, если Вам понравился ответ, Вы можете поблагодарить автора - для этого в каждом ответе есть специальные ссылки. Вы можете оставить отзыв о работе портале. Нам очень важно знать Ваше мнение. Вы можете поближе познакомиться с жизнью портала, посетив наш форум, почитав журнал, который издают наши эксперты. Если у Вас есть желание помочь людям, поделиться своими знаниями, Вы можете зарегистрироваться экспертом. Заходите - у нас интересно!
МЫ РАБОТАЕМ ДЛЯ ВАС!



В избранное