Frente a frente

Tarjetas gráficas de última generación: AMD vs NVIDIA

Casi como en los viejos tiempos, NVIDIA y AMD compiten por el mejor rendimiento gráfico, pero con la vista puesta también en GPGPU, aunque con matizaciones

Manuel Arenas

AMD vs NVIDIA

10 julio 2012

Primero fue AMD con el lanzamiento de Radeon HD 7970 la que incluyó novedades importantes en su arquitectura interna; y, ahora, NVIDIA, presenta la flamante NVIDIA GTX 680 y la arquitectura Kepler.

A día de hoy, AMD ha conseguido lanzar desde la gama alta hasta la baja dentro de la familia Southern Islands, que es el nombre en clave de esta generación de chips basados en la arquitectura GCN (Graphics Core Next). NVIDIA, de momento, se conforma con su modelo GTX 680, competidor directo de la AMD Radeon HD 7970. Enfrentamos a ambas para ver qué se puede esperar de estas arquitecturas.

Cambios relevantes

Como casi siempre que hay una competencia extrema entre dos compañías, no es extraño que haya muchas coincidencias en sus lanzamientos. No significa que se copien, sino que la tecnología se exprime al máximo llegando a soluciones similares en apariencia.

Por lo pronto, en ambos casos, tanto NVIDIA como AMD han pasado de 40 nm a 28 nm como tecnología de fabricación para sus chips. De este modo, pueden reducir el tamaño de los procesadores gráficos, al tiempo que hacen lo propio con el consumo, pero aumentando el número de transistores en los chips. En la tabla, puedes ver un resumen de las características de las nuevas tarjetas (ver PDF), así como de modelos de generaciones anteriores a modo de referencia. El apartado del tamaño del chip, así como el del número de transistores o el del TDP, muestran cómo ha evolucionado cada compañía en sus propuestas.

Tabla arquitecturas gráficas

Clic para su descarga

Recuerda que, con este relevo generacional, tanto NVIDIA como AMD basarán toda su gama de productos para desktop y portátiles en sus nuevas arquitecturas. Las diferencias en rendimiento, precio o consumo vendrán dadas por parámetros como el número de procesadores, la velocidad de la memoria, la velocidad del chip gráfico o la cantidad de memoria.

Eso sí, en estos primeros meses de transición, hay que estar muy pendientes del tipo de chip integrado en las tarjetas gráficas, pues se tiende a renombrar de acuerdo con la nueva nomenclatura, a pesar de que, en algunos casos, se use la arquitectura anterior. Así, se puede dar el caso de que una tarjeta de la gama 6xx de NVIDIA esté basada en Fermi en vez de Kepler, o que modelos Radeon HD 7xxx de AMD estén basados en procesadores de 40 nm en vez de los recientes de 28 GCN.

Por otro lado, como tendencia conjunta, tenemos la apuesta por soluciones con un TDP comedido, rompiendo la costumbre (de momento) de aumentar el TPD como requisito para mejorar el rendimiento. Al menos NVIDIA, sobre el papel, ha conseguido mejorar el apartado de la eficiencia con un TDP inferior a los modelos 5xx, pero incrementando el rendimiento de forma notable.

Tabla arquitecturas gráficas 2

Ambas tarjetas son capaces de manejar múltiples monitores, incluso en configuraciones estereoscópicas, gracias a sus múltiples conexiones, aunque a veces necesitarás adaptadores

Novedades en AMD

Con la familia Radeon HD AMD ha pasado de la arquitectura VLIW (Very Long Instruction Word) a la GCN (Graphics Core Next). Tradicionalmente, AMD ha estado por delante de NVIDIA en eficiencia y consumo bruto de energía, lo que ponía a NVIDIA en una posición complicada, pero también AMD ha estado por detrás de NVIDIA en un apartado clave para el futuro de los procesadores gráficos: GPGPU.

Con GPGPU, se trata de usar los recursos de paralelismo en las arquitecturas gráficas para acelerar aplicaciones y código que en una arquitectura x86 no puede paralelizarse más allá de un nivel básico. En este campo, NVIDIA ha estado por delante con su tecnología CUDA, una API desarrollada por la firma para facilitar la programación de aplicaciones que aprovechen el paralelismo de sus chips gráficos.

AMD ha detectado esta carencia y ha rediseñado los bloques sobre los que se construyen sus chips. El paralelismo en una tarjeta gráfica se basa en la integración de centenares o miles de unidades de procesamiento relativamente simples (shaders) que realizan cálculos a nivel de píxel, vértices o geometría.

En generaciones anteriores, AMD había optado por un paralelismo óptimo para procesar gráficos, donde apenas hay dependencias entre operaciones. Pero, en GPGPU, sí las hay, y, en estos casos, gran parte de los recursos de computación en la arquitectura VLIW estaban a la espera de la resolución de dependencias. Con GCN, AMD ha conseguido liberarse en gran medida de estas dependencias y aumentar el rendimiento en aplicaciones GPGPU sin penalizar el rendimiento gráfico.

Tabla arquitecturas gráficas 4

AMD necesita de un PCB más grande para alojar un procesador con más de 4.000 milllones de transistores. NVIDIA, con 3.500 millones, puede adoptar un menor tamaño y consumir menos

Novedades necesarias

Además de su giro en la arquitectura, AMD ha adoptado tecnologías tan necesarias como PCI-E 3.0, que aumenta el ancho de banda disponible por cada línea PCI Express desde 500 Mbps a 1 Gbps. Y ha optimizado el consumo gracias a una gestión dinámica del TDP y a la reducción del consumo en reposo.

En aspectos como la gestión multimonitor, EyeFinity alcanza su versión 2.0 para seguir como referencia en la gestión de múltiples pantallas e integra el modo 3D con varios monitores, del mismo modo que lo hace NVIDIA con 3DVision Surround. Otra novedad interesante de AMD es DDMA (Discrete MultiPoint Audio), de manera que se pueden transmitir diferentes flujos de sonido a distintos dispositivos. Además, con Fast HDMI es posible alimentar monitores 4K a través de una única conexión HDMI.

En vídeo, la novedad es VCE (Video Codec Engine), junto con Steady Video 2.0 y UVD 3.0. Con Steady Video, se consiguen escenas menos bruscas mediante el procesamiento de las imágenes que conforman las secuencias.

El avance de NVIDIA

Con el modelo GTX 680, NVIDIA se ha puesto al día en cuanto a arquitectura con cambios no tan radicales como los de AMD, pero sí con optimizaciones en eficiencia energética. Uno de los más notables ha sido el de unificar relojes. Es decir, antes NVIDIA usaba una velocidad de reloj para el chip, pero los shaders funcionaban al doble de megahercios, lo que implica mayor consumo energético; así que ha reducido la velocidad de reloj de los shaders, de modo que funcionan a la velocidad del núcleo. Al ser una velocidad menor, para un mismo número de shaders, el rendimiento baja.

Por eso, NVIDIA ha diseñado shaders más simples, aunque con la misma estructura que en la anterior generación, pero ha integrado muchos más. Y de paso ha duplicado el resto de unidades funcionales que acompañan a los shaders. En conjunto, NVIDIA ha conseguido aumentar el rendimiento de sus tarjetas sin un aumento espectacular del número de transistores. Como consecuencia, el funcionamiento es similar a Fermi, pero aumentado y optimizado. El resultado es una tarjeta que no necesita conectores de 8 pines, con un tamaño inferior al de la de AMD y con un TDP inferior.

Tabla arquitecturas gráficas 3

En otros apartados, se ha compensado la reducción del ancho del bus de memoria con el aumento de la frecuencia, e introducido tecnologías como GPU Boost, que aumenta la velocidad de reloj de forma dinámica siempre que haya margen térmico. Además, también aumenta el voltaje dinámicamente para ofrecer más estabilidad.

En el campo del vídeo, NVIDIA permite ahora controlar cuatro monitores en el modo 3D Vision Surround. Además, es compatible con PCI-E Gen 3 y añade la tecnología Adaptive Vsync, que permite desactivar el sincronizado vertical cuando la tasa de frames cae por debajo de los establecidos (60 fps, por ejemplo). En cuanto a la eficiencia, se traduce en un buen nivel de ruido en funcionamiento y en un control fino de las frecuencias de trabajo de forma dinámica.

Tarjetas gráficas analizadas

Radeon HD 7970, la nueva arquitectura de AMD

Radeon HD 7970, la nueva arquitectura de AMD

Asus GTX 680, la eficiencia energética como meta

Asus GTX 680, la eficiencia energética como meta

¿GPGPU importa?

Parece que para el ámbito de consumo no. Las tarjetas Kepler para PC y portátiles no están optimizadas para los cálculos de alta precisión de 64 bits. Pero sí tiene especial interés en el ámbito profesional con la familia de soluciones Tesla, con chips basados en las mismas arquitecturas Fermi o Kepler que las gráficas de consumo, pero con optimizaciones para el cálculo de doble precisión.

Y, a la vista del movimiento de AMD, se confirma que GPGPU sí importa. En principio, para el mercado de consumo, apenas hay aplicaciones que supongan una diferencia a la hora de elegir una solución gráfica optimizada para GPGPU, pero la situación puede cambiar.

Lo que sí está claro es que NVIDIA presentará en breve su gama específica para GPGPU con un modelo Tesla de 7.000 millones de transistores. Big Kepler parece que es su nombre clave, y de paso se anunciará la transición de CUDA hacia OpenACC, una API de más alto nivel y compatible con tecnologías de otros fabricantes. De cara a NVIDIA, el negocio GPGPU está en su visión de futuro a corto, medio y largo plazo; es una apuesta seria y de la que depende el futuro de la compañía.

Tabla arquitecturas gráficas 5

El procesador gráfico precisa de un sistema de ventilación muy potente. Aun así, se alcanzan temperaturas de más de 70 grados en los puntos más calientes

Utilidades de interés

Como herramientas para controlar y monitorizar estas nuevas tarjetas, puedes recurrir a los controladores, pero también a MSI AfterBurner y EVGA Precision Tool. En ambos casos, tienes la posibilidad de controlar y monitorizar todos los parámetros de funcionamiento de la gráfica. Para las GTX 680, el control de reloj dinámico se administra mejor con EVGA Precision Tool.

Pros y contras de las nuevas arquitecturas

Lo mejor

  • Aumento del rendimiento con reducción del consumo. Se invierte la trayectoria de las pasadas generaciones.
  • Atención especial a las aplicaciones GPGPU. Destaca el avance de AMD en este campo.
  • Control dinámico de la velocidad de reloj y voltajes o control del TDP.
  • Mejoras en el vídeo y audio con compatibilidad para monitores 4K, así como modos multimonitor 3D.
  • Mayor ancho de banda en puntos clave: PCI 3.0 vs PCI 2.0, conexiones HDMI que ahora pueden llevar el audio para cada monitor de forma independiente.

Lo peor

  • El precio de las tarjetas de gama alta sigue estando fuera del alcance de la mayoría de los usuarios.