Ya está aquí la mejor CPU del mundo

Esta profunda renovación de la microarquitectura Intel Core contempla mejoras esenciales: Hyper-Threading, 8 Mbytes de caché L3, un controlador de memoria DDR3 de 3 canales... ¿El resultado? Una relación rendimiento/vatio de récord

Ya está aquí la mejor CPU del mundo

23 enero 2009

La filosofía Tick-Tock esgrimida por Intel para determinar el ritmo de lanzamiento de sus microprocesadores sigue su curso. Cada año, la firma de Santa Clara nos depara un anuncio de entidad: bien una tecnología de fabricación más sofisticada, bien una nueva microarquitectura.

En 2007, llegaron los primeros chips Intel Core 2 fabricados con litografía de 45 nm y, como esperábamos, a mediados del pasado mes de octubre desembarcaron en nuestro Laboratorio las primeras unidades de los procesadores más avanzados que los ingenieros de esta compañía han puesto a punto hasta la fecha.

La designación comercial de esta flamante familia de CPUs es Intel Core i7 y, aunque en su fabricación se ha empleado la tecnología de integración de 45 nm que conocemos, su microarquitectura ha sido profundamente revisada con el ambicioso objetivo de ofrecer la mayor relación rendimiento/vatio del mercado. Sí, los novísimos Intel Core i7 son los mejores microprocesadores para PC disponibles en la actualidad. Veamos por qué.

Microarquitectura nativa con cuatro núcleos

A diferencia de Yorkfield, nombre en código que identifica a los chips Intel Core 2 con 4 núcleos que emplean la microarquitectura Penryn, los procesadores Nehalem han sido diseñados desde su nacimiento para aglutinar 4 núcleos sin que medie proceso alguno de adaptación desde una microarquitectura previamente definida para un número inferior de cores.

Este profundo rediseño ha permitido a los ingenieros de Intel implementar en el núcleo de las nuevas CPUs un conjunto de mejoras muy amplio que, como veremos, permite a los Core i7 aventajar con claridad tanto a los demás procesadores de Intel como a las soluciones que recoge el catálogo de AMD en la actualidad.

Además, algunas de estas innovaciones son habituales en los chips para servidores y estaciones de trabajo (especialmente la integración de una extensa memoria caché de nivel 3), lo que apunta con claridad que esta microarquitectura desembarcará también en estas máquinas y, con total seguridad, también llegará a los ordenadores portátiles (confiemos en que antes del segundo semestre de 2009).

El empaquetado de los microprocesadores Core i7 es diferente y, por lo tanto, incompatible con el de sus predecesores. Y es que los 775 contactos de los chips Intel Core 2 son insuficientes para estas nuevas soluciones debido a que el controlador de memoria se ha incorporado en el interior del núcleo.

Esta característica, unida al profundo rediseño de la lógica de estos chips, ha ocasionado que su tamaño pase de los 214 mm2 de Penryn a 263 mm cuadrados en Nehalem. El número de contactos asciende a 1.366, por lo que el nuevo zócalo se llamará LGA-1366.

Vuelve el Hyper-Threading

Como hemos explicado, la microarquitectura de Nehalem, conocida como New Intel Core, se ha diseñado para permitir que los 4 núcleos que incorporan estos chips trabajen en perfecta armonía. Pero hay más. El regreso de la tecnología Hyper-Threading brinda la oportunidad de desplegar ante el sistema operativo nada menos que 8 núcleos lógicos, lo que permite a los Intel Core i7 procesar simultáneamente otros tantos hilos de ejecución (threads).

Esta técnica también se conoce como Simultaneous Multi-Threaded (SMT) y resulta esencial para incrementar drásticamente el nivel de utilización de las unidades de ejecución del chip, que, de otra forma, permanecen infrautilizadas durante la mayor parte del tiempo.

No obstante, para implementar esta tecnología no es necesario incrementar los recursos que intervienen de forma estricta en el proceso de ejecución. Basta con duplicar algunos registros (estado, RSB, etc), repartir ciertos búfers (carga, almacenamiento, TLB, etc) y compartir determinados recursos, como la caché de nivel 3.

Afortunadamente, el software que ejecutamos en nuestros ordenadores favorece el máximo aprovechamiento de esta tecnología, por lo que el incremento del rendimiento es muy notable, algo que podéis comprobar observando las gráficas que ilustran este análisis.

Un controlador de memoria de triple canal

Oficialmente, Intel Core i7 soporta únicamente módulos de memoria DDR3 a 1.066 MHz; pero, por fortuna, en las placas base gobernadas por el chipset Intel X58 podremos instalar memorias capaces de trabajar a 1.333 y 1.600 MHz sin grandes problemas.

La integración del controlador en el seno del núcleo reduce la latencia derivada de las operaciones de acceso a la memoria, aunque lo llamativo es que se trata de una solución de triple canal y no de doble, como en los chips Intel Core 2.

Por esta razón, para sacar el máximo partido al controlador tendremos que instalar en nuestra placa al menos tres módulos de memoria. Si implantamos únicamente dos, los accesos se efectuarán en la modalidad de doble canal, por lo que es interesante averiguar si el rendimiento de este subsistema es muy diferente en ambos escenarios.

En nuestras pruebas con SiSoft Sandra 2009, hemos comprobado que la diferencia es notable. Como muestra un botón: en la modalidad de triple canal hemos obtenido unas tasas de transferencia de 18,21 GBytes/s Int iSSE2 y 18,29 GB/s Float iSSE2, mientras que en doble canal el resultado en estas mismas pruebas recoge 12,46 GB/s Int iSSE2 y 12,38 GB/s Float iSSE2.

En cambio, estas diferencias se reducen a la mínima expresión si comparamos de la misma forma el rendimiento de un procesador Core i7 al ejecutar aplicaciones reales, como PCMark Vantage o Crysis.

Por todo ello, la utilización del triple canal no nos parece determinante a menos que utilicemos módulos capaces de trabajar a una frecuencia de reloj superior a los 1.066 MHz que oficialmente soportan los nuevos microprocesadores.

Un último apunte: a lo largo de 2009 Intel lanzará una versión económica de los «micros» Core i7 equipada con un controlador de memoria de doble canal. Estos chips incorporarán menos contactos y, por lo tanto, utilizarán un nuevo zócalo que conoceremos como LGA-1156, y permitirán a la firma de Santa Clara competir con garantías en el segmento de microprocesadores de precio inferior a 200 dólares.

Adiós FSB, bienvenido QPI

El bus que hace posible la comunicación entre los principales bloques funcionales de la CPU deja en Nehalem de llamarse Frontal Side Bus (FSB) y pasa a Quick Path Interconnect (QPI). Este enlace de alto rendimiento ofrece una tasa de transferencia máxima de 25,6 Gbytes/s y es muy similar al bus HyperTransport utilizado por AMD.

La frecuencia a la que trabajan los núcleos de la CPU es el resultado de aplicar a la velocidad del enlace QPI un factor de multiplicación determinado. Si tomamos como ejemplo uno de los chips que hemos usado en este artículo, el Core i7-965 Extreme Edition a 3,2 GHz, concluiríamos: 133 MHz x 24 = 3.192 MHz.

El nuevo núcleo en detalle

Otra de las mejoras de entidad de las que se han implementado en Core i7 es la incorporación de una memoria caché de nivel 3 compartida entre los 4 núcleos. Su tamaño asciende a 8 Mbytes y resulta decisiva a la hora de ofrecer el mejor rendimiento en entornos multihilo. Si las comparamos con Penryn, las cachés L1 y L2 han salido malparadas.

La primera de ellas tiene el mismo tamaño por núcleo en ambas microarquitecturas (64 Kbytes), pero es más rápida en Penryn (3 ciclos de reloj) que en Nehalem (4 ciclos de reloj). Por su parte, la caché L2 ha menguado drásticamente, de hecho, en Nehalem cada núcleo incorpora «sólo» 256 Kbytes, eso sí, es más rápida que la caché L2 de Penryn (11 frente a 15 ciclos de reloj).

Además, la microarquitectura New Intel Core contempla otras innovaciones de especial importancia. Y es que los ingenieros que han intervenido en su diseño han mejorado la lógica de predicción de bifurcaciones, implementado búfers de mayor tamaño, mejorado la jerarquía de las memorias caché, puesto a punto nuevas instrucciones SSE4…

Pero, sin lugar a dudas, una de las características más curiosas de Nehalem es el modo Turbo, que no es otra cosa que un overclocking automático. Cuando las condiciones de temperatura de la CPU son las idóneas, la frecuencia de reloj de los 4 núcleos se incrementa en 133 MHz, por lo que la velocidad de trabajo del chip tope de gama de Intel, el Core i7-965 a 3,2 GHz, ascendería a 3,33 GHz.

Pero esto no es todo. En aquellos escenarios en los que sólo uno de los núcleos permanece activo y los otros tres están ociosos, el core operativo es capaz de trabajar a una frecuencia superior en 266 MHz a su velocidad original. En nuestro ejemplo, el núcleo activo del procesador Intel Core i7-965 trabajaría a 3,46 GHz.

Sin duda, un overclocking en toda regla que es posible debido a que esta microarquitectura monitoriza las condiciones de trabajo de cada uno de los núcleos para sacarles el máximo partido incrementando su frecuencia de reloj siempre y cuando el TDP de la CPU no se vea superado.

¿Para cuándo en portátiles?

Si observáis con detenimiento las gráficas que ilustran este análisis (ver PDF adjunto) os percataréis de que el rendimiento de los nuevos procesadores de Intel es superior al ofrecido por los Intel Core 2 y los AMD Phenom X3/X4.

En la gráfica en la que detallamos el consumo podemos apreciar que los nuevos «micros» consumen más que los chips Penryn a igual frecuencia de reloj, pero, si calculamos el cociente rendimiento/vatio, que es el índice que realmente debemos valorar, son los nuevos Core i7 los que despuntan de forma abrumadora.

A nuestro juicio, son los mejores microprocesadores disponibles en la actualidad para gobernar un PC no sólo porque aventajan claramente a las soluciones de AMD, sino también debido a que resultan mucho más atractivos que los procesadores con los que la propia Intel ha competido hasta ahora.

En la próxima actualización de nuestro ranking de CPUs expondremos de forma minuciosa el resultado que han arrojado los chips que protagonizan este análisis en nuestro extenso banco de pruebas y que, debido a limitaciones de espacio, no hemos podido reseñar en este artículo. Mientras tanto, sólo nos queda desear que Intel no nos haga esperar mucho para disfrutar de estos fabulosos procesadores en nuestros ordenadores portátiles.

La configuración de nuestra plataforma de pruebas

Para afrontar el banco de tests que nos ha permitido diseccionar las novísimas soluciones de Intel hemos utilizado componentes de última generación y contrastada fiabilidad. Entre estos elementos creemos que merece la pena destacar los siguientes: una placa base Intel Desktop Board DX58SO equipada con el chipset iX58 Express, 3 módulos DDR3-1.066 CL7 Qimonda non-ECC de 1 Gbyte cada uno (necesarios para habilitar el acceso al subsistema de memoria principal en la modalidad de triple canal), un ventilador Thermalright Ultra-120 eXtreme RT (para el procesador Intel Core i7-965 Extreme Edition) y otro Intel DBA (para el Intel Core i7-720), un disco duro Intel SATA SSD X25-M 80 Gbytes MLC y, por último, una robusta fuente de alimentación Enermax de 800 vatios.