El corazón de tu PC: conoce el rendimiento de tu CPU

En este informe, revisamos el rendimiento de los procesadores que gobiernan los PCs de sobremesa de gamas más altas y medias disponibles en tiendas especializadas y grandes superficies

El corazón de tu PC: conoce el rendimiento de tu CPU

15 noviembre 2008

Intel y AMD disponen ya de procesadores con cuatro núcleos y también con tres, en el caso de AMD, con prestaciones que hace sólo dos años serían casi un sueño. Entre ellos, existen diferencias respecto al comportamiento, que son las que se tratan de detectar en este artículo cuya columna vertebral son las pruebas de rendimiento.

 

Éstas están destinadas a aislar el comportamiento de la CPU del resto de los componentes del sistema, como son la memoria, el disco o la tarjeta gráfica. Éstos influyen en el resultado final, desde luego, pero, eligiendo la misma configuración y usando como variable al procesador, nos aseguramos de que las variaciones en los resultados están relacionadas directamente con el micro.

 

El propósito final es arrojar algo de luz sobre un tema que en los últimos tiempos se ha oscurecido bastante con la convivencia en el mercado de una ingente cantidad de procesadores, tanto de Intel como de AMD, diferenciados no sólo por la velocidad de reloj, sino también por otros parámetros como el tamaño de la caché L2, la velocidad del bus, la tecnología de fabricación o el multiplicador.

 

Para realizar las pruebas, hemos utilizado herramientas estándar, de modo que, siguiendo unas sencillas instrucciones, es posible reproducir en casa algunos de los tests y comparar los resultados con los obtenidos en nuestro Laboratorio. Es más, incluso entra dentro de lo posible llevar en una llave USB algunos de estos programas y realizar algunas pruebas de rendimiento in situ. No llevan mucho tiempo en algunos casos y pueden servir como referencia para una posible decisión de compra.

 

Las variables

En el rendimiento de un microprocesador influyen diversos factores, aparte del aparentemente más obvio que es el de la velocidad de reloj. Una primera aproximación concluye que el rendimiento depende no sólo de la velocidad en megahercios, sino también del número de instrucciones que una determinada arquitectura es capaz de procesar en cada «pulso» de ese reloj.

 

La arquitectura es la que permite optimizar la eficiencia y el número de instrucciones por cada ciclo de reloj y es un elemento decisivo a la hora de caracterizar un procesador. De hecho, la de los Pentium 4 fue el talón de Aquiles de aquella familia de procesadores de Intel, poco eficiente en cuanto a instrucciones por ciclo de reloj, pero supuestamente preparada para velocidades de hasta 10 GHz.

 

En la práctica, fue incapaz de aguantarlas por encima de los 4 GHz siendo sustituida in extremis por la familia Core 2 (Duo, Quad y Extreme). Aún hoy, Intel depende en gran medida de esa arquitectura, aunque en pocos meses será relevada por otra con bastantes novedades llamada Nehalem.

 

Otro ejemplo de arquitectura totalmente distinta es la de los procesadores Atom, específica para equipos con un consumo reducido. AMD también basa su estrategia en estos sucesivos cambios de arquitectura, aunque últimamente con algo más de lentitud que Intel.

 

De hecho, aún existen en el mercado procesadores Athlon 64 X2 de dos núcleos conviviendo con los Phenom con cuatro núcleos y los Phenom X3 con tres núcleos. En este caso, esta familia comparte una misma arquitectura (Barcelona), mientras que los primeros pertenecen a la anterior.

 

A su vez, es conveniente tener en cuenta la tecnología de fabricación, definida esencialmente por el tamaño de los transistores empleados en la «confección» de la CPU. A menor tamaño, en general, mejor. Intel ya lleva tiempo fabricando procesadores con tecnología de 45 nm y está a punto de tener la de 32 nm. Una menor disipación junto con un tamaño menor para el chip propiamente dicho son algunas de las ventajas de una reducción en el tamaño de los transistores.

 

Otra variable interesante es el tamaño de la memoria caché L2 (de segundo nivel). Para una misma arquitectura, se pueden tener modelos prácticamente idénticos que sólo difieren en el tamaño de esta memoria. Si bien por encima de un mínimo es un parámetro que no supone una diferencia abismal entre distintos modelos, sí que es necesario disponer de, al menos, 2 Mbytes para evitar que haya aplicaciones que se vean penalizadas en exceso.

 

La velocidad del bus es otro factor que influye en aspectos como el del overclocking, por ejemplo. Si la velocidad del bus es reducida, el factor de multiplicación necesario para obtener la velocidad del micro será elevado y se podrán experimentar velocidades altas para el procesador sin tener que aumentar en exceso la del bus, un elemento determinante en el éxito de esta práctica y que suele ser el que pone el límite al potencial del procesador.

 

Si el multiplicador es bajo, será preciso aumentar mucho la velocidad del bus. En los procesadores AMD, no existe bus como tal, pues la comunicación entre el procesador y el resto del sistema (con la excepción de la memoria controlada directamente desde la propia CPU) se realiza mediante la tecnología Hypertransport.

 

El número de núcleos es también importante, pues, en aplicaciones que los aprovechen completamente, el incremento del rendimiento es excelente. No es lineal, pero teniendo en cuenta que los precios de los Quad Core son cada vez más próximos a los de dos cores, no hay motivo para no decantarse por uno de más núcleos a poco que se trabaje con aplicaciones multimedia, científicas o con varios programas a la vez, por ejemplo.

 

AMD, a pesar de llegar con retraso al mercado de los cuatro núcleos, ha conseguido un producto honesto, aunque lejos del rendimiento extremo de los modelos más avanzados de Intel. Además, AMD se ha diferenciado con una gama de tres núcleos denominada Phenom X3 claramente distinta de las otras de dos y cuatro. En el extremo superior, está la plataforma Skulltrail de Intel para entusiastas y profesionales, con nada menos que ocho núcleos repartidos entre sendos procesadores integrados en una misma placa base.

 

Pruebas realizadas

Uno de los objetivos de este artículo es ofrecer unas cifras de referencia sobre el rendimiento de los procesadores para ordenadores de sobremesa, así como animar a que estas pruebas o algunas de ellas se usen en la vida real en el momento de comprar un equipo y buscar una cifra que aproximadamente permita ubicar a un PC en un segmento de rendimiento concreto. Llevar algunos de estos test siempre encima en una llave USB puede resultar útil en aquellos establecimientos donde posibiliten tomar contacto con el equipo.

 

Kribibench 1.1.7 (www.adeptdevelopment.com) es un programa aparentemente simple que realiza un renderizado gráfico empleando exclusivamente recursos de CPU y memoria. La escena elegida para realizar las pruebas se llama Ultra City y consta de un número extraordinario de polígonos. Tanto es así que las cifras de resultados obtenidos con este programa no superan unos pocos frames por segundo, o incluso se quedan por debajo de uno.

 

Para conseguir un resultado comparable al que os mostramos en este artículo, es preciso cargar el modelo Ultra, desde el menú del propio programa navegando hasta la carpeta de Adept Development en el directorio de Archivos de programa y, a su vez, dentro de la carpeta Models. Luego, en el menú de selección de calidad de renderizado, escoger Realistic y lanzar el test.

 

PovRay 3.7 beta (www.povray.org) es otra aplicación típicamente dependiente del sistema procesador y de la memoria. En este caso, sólo se necesita instalar el programa y lanzar el benchmark en el modo multiprocesador. Esta opción se encuentra dentro del menú Render. Tras completar la ejecución, se puede observar en la esquina inferior derecha de la pantalla de la aplicación el tiempo invertido en la prueba.

 

FutureMark dispone de dos herramientas sintéticas para extraer la información sobre el rendimiento conjunto de un equipo. El resultado final depende de la CPU, la memoria, el sistema de vídeo o el de almacenamiento, aunque, para pruebas donde la única variable es el procesador, los resultados dan una idea bastante precisa sobre las variaciones de rendimiento de cada CPU.

 

Además, esta versión ofrece resultados desglosados por tareas como las comunicaciones, el tratamiento de vídeo, imágenes, etcétera. Existe una versión de prueba de PCMark Vantage en www.futuremark.com, aunque los tests tardan más de una hora en completarse.

 

PCMark 2005 es la versión anterior a PCMark Vantage y la otra aplicación de FutureMark. Tarda menos que éste en completarse, pero está en desuso. A pesar de ello, sus pruebas recorren todo el abanico de actividades que un usuario convencional aborda en el día a día.

 

Otro bench es X264 Benchmark HD, que comprime un fichero de vídeo de origen y muestra la tasa de frames por segundo empleados para ello. Esencialmente, comprime el vídeo y lo convierte en un formato compatible de tipo MP4. El benchmark sólo se ejecuta desde la línea de comandos, aunque dispone de un script que lanza el banco de pruebas automáticamente. Más información en la dirección www.techarp.com/showarticle.aspx?artno=520.

 

TMPEG Xpress 4, por su parte, es uno de los conversores de vídeo por excelencia. En este caso, se ha utilizado como origen para la conversión el fichero MPEG PlushLife.mpeg, de un minuto y 50 segundos de duración y con 1.280 x 720 puntos de resolución.

 

Para el destino, se elige el formato MPEG 4 AVC a 2.360 kbps. El resultado es mejor cuanto menos tiempo se tarde en realizar la conversión. Este programa es de pago, aunque dispone de una versión trial de prueba en la web http://tmpgenc.pegasys-inc.com/es.

 

Cinebench R10 es otro clásico de las pruebas de rendimiento, basado en el programa Cinema 4D. Se trata de renderizar una escena compleja, primero, con un único procesador/núcleo y, luego, con todos los disponibles, y evaluar el impacto en el rendimiento. Se trata de  una prueba fácil de reproducir y que no consume demasiado tiempo (unos 10 minutos en total). En ella, se observa con claridad el beneficioso efecto de los sistemas con múltiples núcleos. Más detalles en www.maxon.net/pages/download/cinebench_e.html.

 

Apuntes tras las pruebas

Respecto al overclocking, hemos de decir que la modificación de los parámetros de funcionamiento de un procesador para aumentar el rendimiento base es una práctica delicada. Salvo casos muy excepcionales, la recomendación es no aumentar ningún voltaje. Jugar con el multiplicador (en el caso de los modelos Extreme de Intel o Black Edition de AMD) es la práctica más segura, así como elevar la velocidad del bus del sistema.

 

Eso sí, para obtener el mejor resultado, lo mejor es esperar a que hayan aparecido una o dos revisiones (steppings) de la arquitectura original y elegir procesadores con velocidades intermedias o bajas y factores de multiplicación elevados. Los procesadores con velocidades elevadas por defecto están casi al límite de las posibilidades de la arquitectura y no es fácil conseguir un overclocking estable.

 

Modificar manualmente la afinidad de los núcleos y las aplicaciones en sistemas multicore puede suponer un incremento de la velocidad global. Por ejemplo, se puede asignar al antivirus un único núcleo de los cuatro de un procesador Quad Core, de modo que, por mucho que esté escaneando, nunca se apropiará de más de una cuarta parte del total de la capacidad de proceso. O asignar dos cores a IE7, por ejemplo, para que un posible cuelgue no afecte al resto de las aplicaciones.

 

Respecto al impacto de la caché en el rendimiento, en las pruebas se ha visto que, en aplicaciones con una gran demanda de proceso de CPU, una mayor caché influye positivamente en los resultados, incluso cuando se trata de pasar de una L2 de 8 Mbytes a otra de 12 Mbytes, cifras de por sí muy elevadas.

 

Mientras que en el impacto de la memoria en el rendimiento no ha supuesto tanta diferencia el paso de DDR2 a DDR3. En las pruebas, se ha visto que el incremento global de rendimiento es ínfimo o inexistente. La memoria DDR3 es más veloz, pero también tiene una mayor latencia.

 

En las pruebas, también hemos querido saber si valen para algo los cuatro cores. Y el resultado es que no hay lugar a duda. A pesar de que en PCMark 2005 se observa una menor influencia del número de núcleos en el resultado global, en aquellas aplicaciones que demandan un uso de CPU intenso, el incremento de núcleos se traduce instantáneamente en un mejor rendimiento.

 

Las versiones X3 de los procesadores Phenom son interesantes en tanto en cuanto ofrecen rendimiento multinúcleo con un precio competitivo, aunque hay propuestas de cuatro próximas en precio con un rendimiento bastante más elevado.

 

En cuanto al mito del Quad Core auténtico, AMD siempre ha criticado a Intel por su concepto, obtenido a partir de integrar en una única pieza de silicio dos procesadores de dos núcleos cada uno, mientras que, en el caso de Phenom, los cuatro cores son entidades que trabajan conjuntamente. En la teoría es una discusión interesante, pero, en la práctica, los resultados hablan por sí mismos. Y lo cierto es que Intel tiene un buen producto que se comporta igual y mejor que el quad core real de AMD (los Phenom).

 

 

Variables que intervienen en el rendimiento de un procesador

 

• Velocidad de reloj. Velocidad de reloj = Velocidad del bus x Multiplicador

• Arquitectura / Tecnología de fabricación. Rendimiento = IPC x Velocidad de reloj, siendo IPC el acrónimo de Instructions per clock

Tamaño de la memoria caché L2

• Número de núcleos, aunque el rendimiento no se incrementa proporcionalmente con el número de núcleos en todas las aplicaciones

 

 

El factor euro

Aunque el dinero no juegue un papel determinante en lo que al rendimiento se refiere, sí que es cierto que el elevado precio de una CPU puede hacer que directamente no se compre. Una métrica interesante es la que se obtiene de dividir el precio de un procesador entre el resultado de una prueba de rendimiento determinada, lo cual genera el coste en euros por unidad de rendimiento.

 

Este precio se comporta más o menos linealmente para procesadores de gama media baja y baja, pero comienza a subir exponencialmente pasada esa barrera. Es obvio que siempre se busque el producto más solvente, con más caché y más megahercios, pero su precio suele ser tan elevado como sus prestaciones, por lo que, salvo que se disponga de una buena cantidad de dinero, lo mejor es investigar esta métrica y dirigirse a los procesadores más interesantes.

 

 

Configuraciones empleadas

 

* Configuración Intel

 

• Fuente de alimentación: OCZ Elite Xtream 800 W, 80+

• Memoria: 2 x 1 Gbytes Kingston DDR2 800 CL 5

• Placa base: Gigabyte GA-EP35C-DS3R

• Tarjeta gráfica: NVIDIA GTX 280 (Drivers 177.34)

• Disco duro: Seagate Barracuda 7.200.10, 7.200 rpm y 500 Gbytes

• SO: Windows Vista Ultimate 32 bits

• Ventilador: OCZ Vendetta 2

 

* Configuración AMD

 

• Fuente de alimentación: OCZ Elite Xtream 800 W, 80+

• Memoria: 2 x 1 Gbyte Kingston DDR2 800 CL 5

• Placa base: Gigabyte GA-MA78G-DS3H

• Tarjeta gráfica: NVIDIA GTX 280 (Drivers 177.34)

• Disco duro: Seagate Barracuda 7.200.10, 7.200 rpm y 500 Gbytes

• SO: Windows Vista Ultimate 32 bits

• Ventilador: OCZ Vendetta 2

 

La plataforma Skulltrail requiere su propia placa y fuente con requisitos bastante elevados en cuanto a potencia consumida y espacio ocupado por la propia placa base.

 

(Nuestro agradecimiento a OCZ por la cesión de la fuente y el ventilador para las pruebas, y también a Intel Iberia por su buena gestión a la hora de tramitar el préstamo de los procesadores para este artículo. Agradecimientos también para la agencia de AMD en España por su perseverancia a la hora de gestionar las muestras).

 

 

Breve cronología de procesadores Intel

 

• Pentium 4 - Willamette, 180 nm / Enero 2001

• Pentium 4 - Northwood, 130 nm / Enero 2002

• Pentium 4 - Prescott, 90 nm / Febrero 2004

• Pentium 4 - Prescott (con 2 MB caché L2), 90 nm / Febrero  2005

• Pentium 4 - Cedar Mill, 65 nm / Enero 2006

• Pentium D - Smithfield (dual core), 90 nm / Diciembre 2005

• Pentium D - Presler (dual core), 65 nm / Enero 2006

• Core 2 Duo - Allendale, 65 nm / Enero 2007

• Core 2 Duo - Conroe, 65 nm / Enero 2007

• Core 2 Duo - Wolfdale (con 3 MB de caché L2), 45 nm / Abril 2008

• Core 2 Duo - Wolfdale, 45 nm / Enero 2008

• Core 2 Quad - Kentsfield, 65 nm / Enero 2007

• Core 2 Quad - Yorksfield (con 6 MB de cachè L2), 45 nm / Marzo 2008

• Core 2 Quad - Yorksfield, 45 nm / Marzo 2008

• Core 2 Duo / Quad - Nehalem, 45 nm / Q4 2008- Disco duro: Seagate Barracuda 7.200.10, 7.200 rpm y 500 Gbytes