Currently Being Moderated

San Pablo, 14 de Noviembre de 2012 – Cada vez más los mayores desafíos de la sociedad requieren una mayor complejidad computacional. Desde las previsiones climáticas, hasta las investigaciones farmacéuticas y la seguridad nacional, la Computación de Alto Rendimiento (HPC, por sus siglas en inglés), estimulada por el paralelismo, está ayudando a ampliar las fronteras de la competencia y de los descubrimientos.

            Actualmente, Intel Corporation está ayudando a avanzar los descubrimientos al anunciar el coprocesador Intel® Xeon Phi™, un producto que ayudará a proporcionar niveles exponenciales de rendimiento para cargas de trabajo altamente paralelas. Basado en la arquitectura Intel® Many Integrated Core (Intel® MIC), el coprocesador Intel Xeon Phi complementa las actuales familias del procesador Intel® Xeon® E5-2600/4600, para proporcionar rendimiento y eficiencia sin precedentes en aplicaciones altamente paralelas que posibilitarán innovaciones en manufactura, en ciencias de la vida, en energía y en otras áreas. Los coprocesadores Intel Xeon Phi también señalan el compromiso de Intel para alcanzar la computación Exascale (una mejora de mil veces con relación a la Petascale), hasta el 2018.

           

 

 

Modelos de programación compartidos por todos sus códigos

            Una gran variedad de lenguajes, modelos y herramientas de programación ofrecen soporte para la arquitectura Intel® y pueden utilizarse ya sea con el procesador Intel Xeon, como con los coprocesadores Intel Xeon Phi. Esa uniformidad puede reducir mucho la complejidad del desarrollo, optimizando y manteniendo los códigos de software. Las aplicaciones aun necesitan utilizar una programación paralela para cualquier hardware en paralelo, pero con la estrategia de Intel, los desarrolladores pueden contar con un modelo, con herramientas y con experiencias comunes sin la necesidad de un cambio hacia nuevas herramientas y modelos de programación propietarios. Las inversiones hechas en la paralización de los códigos proporcionarán beneficios a una amplia gama de entornos computacionales.

 

 

 

Mayor eficiencia para el procesamiento paralelo

            Mientras que la familia del procesador Intel Xeon E5 continúa siendo la mejor opción para la mayoría de las aplicaciones, los coprocesadores Intel Xeon Phi proporcionan un rendimiento más eficiente para aplicaciones altamente paralelas. El énfasis en más y menores núcleos, mucho más núcleos, y mayores unidades vectoriales ofrecen un alto grado de paralelismo. El mayor paralelismo compensa la menor velocidad de cada núcleo individual para proporcionar mayor rendimiento agregado para las cargas de trabajo que puedan ser subdivididas en un número suficientemente grande de tareas simultáneas.

 

 

 

Coprocesadores Intel Xeon Phi: principales características

            El coprocesador Intel Xeon Phi es un marco de innovación que contiene innúmeras capacidades que ayudan a acelerar las oportunidades para la HPC.

 

  • Memoria adecuada para la HPC:

  El coprocesador Intel Xeon Phi ofrece hasta 8 GH de capacidad de memoria (7.75 GB con el ECC habilitado), con el pico de banda ancha de memoria de 352 Gigabytes/segundo. Esa banda ancha asegura que los datos puedan agregarse y analizarse rápidamente.   

  • Cache donde más se necesita:

Con hasta 30,5 MB de cache L2, el coprocesador Intel Xeon Phi es capaz de proveer el nivel correcto de poder computacional para cargas de trabajo altamente paralelas.

  • Mayor paralelismo de datos a través de un avanzado mecanismo de vector de 512 bits.
  • Con el apoyo de varios proveedores de herramientas de software como parte de las herramientas estándar.
  • El coprocesador ejecuta Linux: Red Hat Enterprise Linux 6.x o SuSE Linux 12+

 

 

 

Los primeros productos del Coprocesador Intel® Xeon Phi™

 

SKU #

Factor de forma,

Pico de Doble Precisión

Núcleos

Velocidad del Clock (GHz)

GDDR5 Velocidad de Memoria

Pico

Capacidad de Memoria

L2 Cache

Coprocesador (Board)

Proceso

Térmico

(GT/s)

Memoria

(GB)

(MB)

TDP (Watts)

 

 

BW

 

 

 

SE10P

PCIe Card,

1073 GF

61

  1. 1.1
  2. 5.5

352

8

  1. 30.5

300

22nm

(edición especial)

Resfriado pasivamente

SE10X

PCIe Card,

1073 GF

61

  1. 1.1
  2. 5.5

352

8

  1. 30.5

300

(edición especial)

Sin solución térmica

5110P

PCIe Card, Resfriado pasivamente

1011 GF

60

  1. 1.053

5

320

8

30

225

3100 Series

PCIe Card, Resfriado activamente

>1 TF

Divulgada

5

240

6

>25

300

en las 3100 series

PCIe Card, Resfriado pasivamente

> 1 TF

lanzamiento  (H1’13)

5

240

6

>25

300

 

 

 

Desempeño

Los resultados del rendimiento divulgados aquí por Intel ofrecen un enfoque conservador para los puntos de referencia al comparar apenas el rendimiento de procesadores bien optimizados con el desempeño de coprocesadores bien optimizados. Esto evita una exageración en el valor del coprocesador que ocurriría si los rendimientos de procesadores en optimización fueran utilizados. Además, dos procesadores son utilizados para comparar con un coprocesador, esto es un esfuerzo para comparar la igual utilización de energía y evitar la exageración con relación al coprocesador, al mismo tiempo en que se permite que consuma más energía que los demás con los cuales se le compara.

 

 

 

 

Resumen del test de rendimiento sintético

 

Puntos de referencia

Resultado

SGEMM

Mejora de hasta 2.9 veces.

DGEMM

Mejora de hasta 2.8 veces

SMP Linpack

Mejora de hasta 2.6 veces

STREAM Triad

Mejora de hasta 2.2 veces

 

 

*Los puntos de referencia han sido realizados utilizando un único coprocesador Intel® Xeon Phi™ versus un servidor de 2 socket basado en el procesador Intel® Xeon® E5-2670. Apenas códigos paralelos, roscados y vectores han sido comparados. La Intel Math Kernel Library (MKL) actual ha sido utilizada para SGEMM, DGEMM y SMP Linpack y no una biblioteca personalizada para punto de referencia.  

 

 

 

Resultados del rendimiento de las aplicaciones

Cliente

Aplicación

Aumento en el desempeño1 vs. 2S Xeon*

Los Alamos

Dinámica Molecular

Mejora de hasta 2.52 veces.

Acceleware

Velocidad isotrópica variable de 8ª orden

Mejora de hasta 2.05 veces.

Jefferson Labs

Lattice QCD

Mejora de hasta 2.27 veces.

Financial Services

Black-Scholes SP

Monte Carlo SP

Mejora de hasta 10.75 veces.

Mejora de hasta 8.92 veces.

Sandia Labs

MiniFF

(Solucionador por Elementos Finitos)

Mejora de hasta 1.7 veces3.

Sinopec

Imágenes sísmicas

Mejora de hasta 2.53 veces2.

 

 

 

 

Acerca de Intel

Intel (NASDAQ: INTC) es líder mundial en innovación en cómputo. La compañía diseña y construye las tecnologías esenciales que sirven como base para los dispositivos de cómputo del mundo. Información adicional sobre Intel está disponible en http://newsroom.intel.com/community/es_lar  y blogs.intel.com

***

Intel, Intel Xeon Phi, Xeon y el logo de Intel son marcas de comercio de Intel Corporation en los Estados Unidos y en otros países.

* Otros nombres y marcas pueden ser propiedad de otros

 

 

 

El Software y las cargas de trabajo utilizadas en los puntos de referencia pueden haber sido optimizados para el rendimiento apenas en los microprocesadores de Intel. Test de desempeño, como SYSmark y Mobile Mark, son realizados utilizando sistemas, componentes, software y funciones específicos. Cualquier mudanza en cualquiera de estos factores puede resultar en variaciones en los resultados. Puede consultar otras fuentes de información y test de desempeño para ayudarlo a evaluar plenamente su intención de compra, incluyendo el rendimiento de este producto cuando combinado con otros productos.

El rendimiento relativo se calcula a través de las atribuciones de un valor base de 1.0 para cada resultado del punto de referencia, y luego dividiendo el resultado real del punto de referencia de la plataforma por cada uno de los resultados del punto de referencia de cada una de las otras plataformas, atribuyéndoles un número de desempeño relativo relacionado a las mejoras de desempeño relatadas.

Los puntos de referencia y las clasificaciones son medidos utilizando sistemas computacionales e/o componentes específicos y reflejan el desempeño aproximado de productos de Intel, conforme determinado por estos test. Cualquier diferencia en el proyecto o en la configuración del hardware o software del sistema puede afectar el desempeño real. Los compradores deben consultar otras fuentes de información para evaluar el desempeño de sistemas o componentes cuya adquisición estén considerando. Para más informaciones sobre test de rendimiento y el desempeño de los productos de Intel, visite Intel Performance Benchmark Limitations.

Nota acerca de los Test de rendimiento sintético

1.        Procesador Intel® Xeon® E5-2670 utilizado para todos los SGEMM Matrix = 13824 x 13824, DGEMM Matrix 7936 x 7936, SMP Linpack Matrix 30720 x 30720.

2.        Coprocesador Intel® Xeon Phi™ SE10P (ECC) con “Gold Release Candidate” SW stack SGEMM Matrix = 15360 x 15360, DGEMM Matrix 7680 x 7680, SMP Linpack Matrix 26872 x 28672.

 

Notas acerca del desempeño de las aplicaciones

* Xeon = procesador Intel® Xeon®;

* Xeon Phi = coprocesador Intel® Xeon Phi™.

1.        2S Xeon* vs. 1 Xeon Phi* (pre producción HW/SW & Applicación ejecutando 100% en el coprocesador, a menos que se indique lo contrario).

2.        2S Xeon* vs. 2S Xeon* + 2 Xeon Phi* (offload).

3.        Clúster de 4 nudos, cada nudo con 2S Xeon* (comparación de rendimiento en el clúster con y sin 1 Xeon Phi* por nudo) (Hetero).

4.        Medido por Intel en octubre del 2012.

Comments

Filter News Archive

By author: By date:
By tag: