Présentation rapide

Le 9 Janvier 2011 Intel met à disposition les premiers Cores iX-2XXX en 32 nm basés sur la micro-architecture « Sandy Bridge » pour les segments desktops et notebooks sur le socket LGA1155. Le segment haut de gamme en LGA2011 n'apparaitra pas avant 2012. Les performances, à frequence égale, seront supérieures de 10 à 30 % et le GPU intégré vera sa performance doublée. Les cartes mères seront basées sur les chipsets de la serie 6 (P67, H67, ...) qui supportent le SATA 6 Gbps et l'USB 3.0

Parmi les nouveautés introduites par les processeurs Sandy Bridge, les plus notables sont :

Hormis ces caractéristiques qui distinguent Sandy Bridge de son prédécesseur, celui-ci conserve les choix technologiques introduits ou réintroduits durant Nehalem, à savoir :

 

Plus d' information

Retour en haut de page

Sandy Bridge à l'IDF2010

Le Intel Developer Developer Forum 2010 -- IDF2010 -- c'est tenu du 13 au 15 septembre 2010 au Moscone Center de SFO. De nombreuses informations ont été présentées, mais nous allons nous intéresser ici à la présentation de la nouvelle architecture Sandy Bridge.

Si vous parlez l'anglais le mieux est de regarder les Webcasts suivants sur ce sujet:

En particulier le Webcast sur les innovations du processeur est extremement interressante.

Retour en haut de page

Sandy Bridge: Les points forts

Je vais essayer ici de résumer les points forts de l'architecture Sandy Bridge:

Première vrais intégration d'un CPU et d'un GPU sur une puce. Le fait d'avoir intégré les deux processeurs sur une seule puce (et non pas deux puce dans un chip comme pour les i3 et i5) permet une optimisation des performances et de la consommation entre les deux fonctions.

Toute la gestion du processeur est faite par une unité appelé le System Agent SA (équivalent au uncore). Il contient le northbridge (PCI express, le DMI, le controlleur memoire, le Display Engine) ... Il est en charge du control indépendant des frequences et tensions des différentes unités, ainsi que du control optimisé de la puissance en fonction de la dissipation thermique (PCU - Power Control Unit).

Le système de cache traditionel L3 à été repensé afin de pouvoir benéficier au CPU et GPU. Il prend le nom de LLC (last level cache) et fonctionne à la même vitesse que les Cores. Les différents cores, le GPU, et le system agent communique par un bus en boucle (ring bus) extremement performant qui delivre une bande passante de 96 Go/s par Core (384 Go/s dans un Quad Core!)

Un nouveau jeu d'instruction vectorielle flottante sur 256 bits est introduit sous le nom d'AVX. Des unités de calcul vectoriel ont été ajouter afin d'executer ces instructions directement par le matériel.

L'unité de prédiction de branche et le cache des micro-instruction ont été completement repensé. L'augmentation du cache de micro-instruction et l'optimisation du predicteur de branche permet d'alimenter l'ordonanceur d'instruction en minimisant les accès mémoire par le cache d'instruction traditionel. Le cache de micro-instructions à été remplacé par un cache de micro-operations décodées ce qui permet un gain important de place et de puissance. Un nouveau bloc apellé le detecteur de boucle (Loop Stream Detector LSD) detecte les boucles d'instruction. En cas de detection de boucle il prend la place du predicteur de branche et du bloc de decodage afin d'alimenté directement l'unité d'execution. Intel introduit dans l'unité d'execution "out-of-order" un ensemble de registres physiques qui contient les opérandes des micro-instruction. Ceci permet d'optimiser la surface et la puisance nécéssaire pour accéder aux opérandes. Cette optimisation particulièrement importante pour les opérandes de 256 bits du jeu d'instruction AVX. A noter que le support de l'AVX nécessite Windows 7 Service Pack 1.

A fréquence égale le gain de performance de la nouvelle architecture permet de gagner environ 10 à 30 % de performance. Cependant à dissipation égale (TDP) le gain de performance avoisine les 50 % !

La technologie Intel Turbo Boost repose sur l'augmentation de la fréquence d'un ou de plusieurs cores, en fonction de leur utilisation. En effet, lorsque tous les cores ne sont pas utilisés pleinement, le processeur tourne en deçà de ses spécifications thermiques. Turbo Boost met cette marge à profit pour accélérer les cores sollicités. La gestion du Turbo est confiée à une unité intégrée dans le system agent et appelée PCU (Power Control Unit). La PCU affecte les accélérations en fonction de l'enveloppe thermique globale du processeur, celle-ci ne devant pas dépasser un seuil spécifique au modèle et appelé TDP (Thermal Design Power).

Le turbo-boost du Sandy Bridge (TB V2) evolue dans deux domaine. D'une part cette fonction peut être est appliqué au processeur graphique avec une repartition intéligente de puissance entre le CPU et le GPU. Mais l'innovation la plus marquante est la possibilité de depasser de façon temporaire le TDP du processeur en ce basant sur une notion d'inertie thermique. En effet dans beaucoup d'application la charge instantané du processeur augmente de manière importante mais pour un laps de temps relativement court. Le turbo-boost de Sandy Bridge permet donc d'augmenter instantanement la fréquence du processeur au dela du TDP pour un laps de temps allant jusqu'a 26 sec. Ceci est par exemple intéressant pour des applications graphique comme Photoshop qui fait appel au CPU de façon intermittente.

La puissance total dissipable par le puce est répartie automatiquement entre les Cores CPU et le GPU.


Dans Sandy Bridge le processur graphique (GPU) à été optimiser de manière importante et les performances sont doublés par rapport au génération précedentes et donc être équivalent à une carte graphique d'entrée de gamme comme les HD5450 ou les GeForce 210.

Le processeur "media "engine" apporte des optimisations portant sur en autre sur le traitement vidéo ce qui devrait permettre de decoder efficacement les flux haute définition à puissance réduite.

Le video encode engine va permettre quand a lui permettre des encodages extremement rapide. Les démonstrations faites par Intel montrait un encodages à 400 frames/sec !

En ce qui concerne l'overclocking Intel le bloque sur les séries normal (multiplicateurs bloqués) et le débloque dans les series K moyennant finance.

Sur Sandy Bridge, la fréquence des différents bus est calée sur celle du bus processeur de façon synchrone : PCI Express, PCI, SATA, USB utilisent tous une fréquence directement proportionnelle aux 100 MHz du bus. Cela limite la montée en frequence du bus à environ 106 MHz .

Les modèles les plus puissants (Core i7-2600 et Core i5-2500) existent ainsi en version K, dont le coefficient multiplicateur peut être librement fixé jusqu'à 57 x (soit une fréquence théorique maximale de 5,7 GHz), et dont le prix est à peine supérieur à la version classique (+ $23 pour le 2600K, et + $11 pour le 2500K). Notez que pour modifier le multiplicateur des modèles K, ceux-ci devront être impérativement installés sur un chipset P67, et non H67.

Quant aux modèles classiques non K, ceux-ci permettent quand même quelques fantaisies : choix des fréquences mémoire (DDR3 1067, 1333 mais aussi 1600, 1867 et 2133), du GPU (diviseurs libres) et réglage du seuil de puissance régulant le mode turbo. De plus, il est possible d’augmenter de 4 crans le coefficient multiplicateur du Turbo, ce qui permet ainsi d’atteindre 500 MHz de plus avec 4 core utilisés.

L'overclocking n'a jamais été aussi facile. Les premiers tests en air cooling permettent d'atteindre facilement :

Retour en haut de page

Gammes Sandy Bridge

La gamme Sandy Bridge est très logiquement découpée comme la gamme Nehalem:

Variante puissance / overclocking specifiée par un suffix:

La PLL du Southbridge est entirement intégré dans les processeur Sandy Bridge. C'est donc le CPU qui regle la fréquence de tous les élements du système BCLK, PCIe, USB, ... en fonction du DMICLK. Dans les versions "normal" tous les coefficients du PLL seront fixes et donc il ne sera pas posible de faire de l'overclocking. En effet augmenter la frequence de base entraine l'augmentation de toutes les fréquences: mémoire, PCI, USB, etc. Pour l'overclocking Intel proposera moyennant finance une serie K ou les coefficients de la PLL seront débloqués. Par exemple le coefficient du BCLK pourra monter à 57 pour atteindre 5.7 GHz


Nom Core - HT Fréq. - TB2 Ratio Cache L2 Cache LLC GPU
Freq. - TB
HD Graphics Ctrl. Mémoire Prix Grav. Socket TDP
Core i7-2600 4-8 3,4-3,8 GHz 34 x 100 MHz 4 x 256 Ko 8 Mo 850-1350 MHz 2000 2x2 DDR3 1600-2133 294 $ 32 nm LGA1155 95W
Core i7-2600K 4-8 3,4-3,8 GHz 34 x 100 MHz 4 x 256 Ko 8 Mo 850-1350 MHz 3000 2x2 DDR3 1600-2133 317 $ 32 nm LGA1155 95W
Core i7-2600S 4-8 2,8-3,8 GHz 34 x 100 MHz 4 x 256 Ko 8 Mo 850-1350 MHz 2000 2x2 DDR3 1600-2133 306 $ 32 nm LGA1155 65W
Core i5-2500 4 3,3-3,7 GHz 33 x 100 MHz 4 x 256 Ko 6 Mo 850-1100 MHz 2000 2x2 DDR3 1600-2133 205 $ 32 nm LGA1155 95W
Core i5-2500K 4 3,3-3,7 GHz 33 x 100 MHz 4 x 256 Ko 6 Mo 850-1100 MHz 3000 2x2 DDR3 1600-2133 216 $ 32 nm LGA1155 95W
Core i5-2500S 4 2,7-3,7 GHz 27 x 100 MHz 4 x 256 Ko 6 Mo 850-1100 MHz 2000 2x2 DDR3 1600-2133 216 $ 32 nm LGA1155 65W
Core i5-2500T 4 2,3-3,3 GHz 23 x 100 MHz 4 x 256 Ko 6 Mo 850-1100 MHz 2000 2x2 DDR3 1600-2133 216 $ 32 nm LGA1155 45W
Core i5-2400 4 3,1-3,4 GHz 31 x 100 MHz 4 x 256 Ko 6 Mo 850-1100 MHz 2000 2x2 DDR3 1600-2133 184 $ 32 nm LGA1155 95W
Core i5-2400S 4 2,5-3,3 GHz 25 x 100 MHz 4 x 256 Ko 6 Mo 850-1100 MHz 2000 2x2 DDR3 1600-2133 195 $ 32 nm LGA1155 65W
Core i5-2300 4 2,8-3,1 GHz 28 x 100 MHz 4 x 256 Ko 6 Mo 850-1100 MHz 2000 2x2 DDR3 1600-2133 177 $ 32 nm LGA1155 95W
Core i3-2120 2-4 3,3 GHz 33 x 100 MHz 4 x 256 Ko 6 Mo 850-1100 MHz 2000 2x2 DDR3 1600-2133 138 $ 32 nm LGA1155 65W
Core i3-2100 2-4 3,1 GHz 31 x 100 MHz 4 x 256 Ko 3 Mo 850-1100 MHz 2000 2x2 DDR3 1600-2133 117 $ 32 nm LGA1155 65W
Core i3-2100T 2-4 2,5 GHz 25 x 100 MHz 4 x 256 Ko 3 Mo 850-1100 MHz 2000 2x2 DDR3 1600-2133 127 $ 32 nm LGA1155 35W

Voici le fonctionnement exact du Turbo Boost en fonction du nombre de coeurs actifs :

De plus, il est possible d’augmenter de 4 crans le coefficient multiplicateur du Turbo, ce qui permet ainsi d’atteindre 500 MHz de plus avec 4 core utilisés comme précisé dans le tableau suivant

 

Retour en haut de page

Performances

Voici un tableau comparatif de performances réalisé par Hardware.fr

En combinant une fréquence et une efficacité supérieure, les nouveaux processeurs Core i5 et 7i LGA 1155 affichent une belle progression face à leurs prédécesseurs LGA 1156 : l’i5-2300 est ainsi 15% plus rapide que l’i5-750, et l’écart grimpe à 20% si on compare l’i7-880 et l’i7-2600. Cette dernière version se rapproche d’ailleurs de très près du Core i7-970 malgré ses six cœurs.
A tarif égal, l’i7-2600 est 24% plus rapide que l’i7-870, et l’i5-2500 26% au dessus de l’i5-760 !

Cette hausse du rapport performance / prix chez Intel rend la situation encore plus délicate qu’elle ne l’était pour AMD sur le haut de gamme. En moyenne, un simple i5-2300 (177$) suffit à contrarier un Phenom II X6 1100T (265$) pourtant placer entre les i5-2500 et 2600 d’un point de vue tarifaire (205 et 294$).

Retour en haut de page

Chipsets

Les Chipset P67, H67, Q67 pour Sandy bridge ont pour code name : Cougar point


Retour en haut de page

Motherboards

Les cartes mères en LGA 1155 arrivent voir ici pour des informations préliminaires

Articles et Références

Retour en haut de page