Introduction
Transcription
Introduction
Architectures A hit t avancées é : Introduction Daniel Etiemble d @l i f [email protected] Les ordinateurs : de 1946 à hier/aujourd’hui • ENIAC (1946) – – – – 19000 tubes 30 tonnes surface de 72 m2 consomme 140 kilowatts. Horloge : 100 KHz. – ≈ 330 multiplications/s • Mon pportable ((2006)) – Intel Duo Processor 2GHz – 1 Go DRAM, 100 Go disque – 1, 9 kg M1 Informatique 2012-2013 1 « Systèmes informatiques » M1 Informatique 2012-2013 Systèmes embarqués ou enfouis • “Ordinateurs” camouflés Sony Playstation 2 Casio Camera Watch Nokia 7110 Browser Phone Philips TiVo Recorder Philips DVD player Prof. Stephen A. Edwards of Columbia University M1 Informatique 2012-2013 2 Les grandes classes de système Caractéristique Ordinateur de bureau Serveur Enfoui/embarqué Prix du microprocesseur 100 à 1000 € 200 à 2000 € par processeur 0,20 à 200 € par processeur Microprocesseurs vendus en 2000 150 millions 4 millions 300 millions (en ne comptant que les 32 et 64 bits) Critères Prixperformance Performance graphique Débit, disponibilité, extensibilité Prix, puissance dissipée, performance pour l’application M1 Informatique 2012-2013 Ventes des microprocesseurs (fin du siècle dernier ) • Processeurs enfouis/embarqués – – – – 4 bits bit : 2 milliards illi d 8 bits : 4,7 milliards 16 bits : 700 millions 32 bits : 400 millions • DSP (traitement du signal) – 600 millions • Généralistes classiques – 150 millions M1 Informatique 2012-2013 3 Gammes de processeurs • Haut de gamme • Contraintes – Processeurs des PC et serveurs • Spécialisé – Haut de gamme des générations précédentes Ex : MIPS, PowerPC « enfouis » • Spécialisé p embarqué q – – – – – Prix Performance Encombrement Consommation Temps réel • temps d’exécution déterministe ou non – Faible consommation – Temps réel M1 Informatique 2012-2013 Les applications • • • • • • • • • Usage général Calcul Scientifique GRAPHIQUE Traitement du signal JAVA Bases de données WEB Cloud Enfoui et embarqué M1 Informatique 2012-2013 4 “Roadmap” des applications enfouies M1 Informatique 2012-2013 “Roadmap” du traitement enfoui Source ITRS Design ITWG July 2003 Process Technology (nm) Operation p voltage g ((V)) Clock frequency (MHz) Application (MAX performance required) Application (Others) 130 1,2 150 x 40 90 65 45 32 1 0,8 0,6 0,5 300 450 600 900 Real Time Video Codec Real Time Interpretation Still Image Processing MPEG4/CIF Web Browser TV phone (1:1) TV phone (>3:1) Electric mailer Voice recognition (input) Voice recognition (operation) Scheduler Authentification (Crypto engine) Processing Performance (GOPS) 0,3 2 14 77 461 Parallelism factor 1 4 4 4 4 Communication speed (Kbps) 64 384 2304 13824 82944 Energy Efficiency (MOPS/mW) 3 20 140 770 4160 Peak Power Concumption (mW) 100 100 100 100 100 St d b P Stand-by Power C Concumption ti ((mW) W) 2 2 2 2 2 Battery Capacity (Wh/kg) 120 200 400 22 0,4 1200 2458 4 497664 24580 100 2 Performance Efficacité énergétique (MOPS/mW) Puissance dissipée Capacité batterie M1 Informatique 2012-2013 5 Exemple : industrie automobile Hétérogénéité M1 Informatique 2012-2013 Sources : C. Balle – Renault Les moteurs de l’évolution • Les contraintes économiques – Lois L i économiques é i – Volumes de vente MARCHE GRAND PUBLIC PCs Consoles de jeux C j Smartphones Tablettes Intel, Intel Microsoft Apple, Samsung M1 Informatique 2012-2013 6 Le modèle économique Intel Nouveau modèle plus performant tous les x années Performance relative 40 30 20 10 0 0 1 Années 2 3 4 5 6 Disponible 7 8 9 10 Besoins M1 Informatique 2012-2013 Un autre modèle économique Performance supérieure aux besoins de « masse » P f Performance relative l ti 40 30 20 10 0 0 1 Années 2 3 4 5 Disponible 6 7 8 9 10 Besoins Recherche des “killer applications” M1 Informatique 2012-2013 7 Killer Application M1 Informatique 2012-2013 Performance : Microprocesseur Texécution = NI * CPI * Tc = NI IPC * F Temps de cycle Nombre de cycles/Instruction 10000 1000 CPU 100 Microarchitecture ((IPC)) F(MHz) 10 96 20 00 92 88 84 80 1 Technologie M1 Informatique 2012-2013 8 DES EXPONENTIELLES MICROPROCESSEURS 2 /1 5 2x/1,5an CPU Performance après 1987 Performance avant 1986 Fréquence d'horloge (MOS) 0% Evolution/an 10% 20% 30% 40% 50% 60% M1 Informatique 2012-2013 DES EXPONENTIELLES MEMOIRES 2x/1,5an 0,5/10 ans Bande passante Latence Quantité/Prix Capacité 0% Evolution/an 20% DRAM 40% 60% DISK M1 Informatique 2012-2013 9 La loi de Moore Transistors par puce 108 256M 64M Mémoire Mi Microprocesseur 107 4M 106 1M 256K 105 4K 16K 1K 80286 Pentium® Pentium® II Pentium® Pro i386™ 8086 103 102 i486™ 64K 104 Pentium® III 16M 4004 8080 101 100 ’70 ’73 ’76 ’79 ’82 ’85 ’88 ’91 ’94 '97 2000 Source: Intel M1 Informatique 2012-2013 Processeurs Intel : nombre de transistors l’année d’introduction 1000000000 Itanium2 P4 Nb de transistors 100000000 10000000 1000000 i486 100000 i286 10000 1000 PIIPIII Pentium Itanium2 Itanium i386 8086 4004 8080 100 10 1 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 M1 Informatique 2012-2013 10 LES DIFFERENTIELS 10000 1000 CPU 100 Mémoire 10 20 000 98 96 94 92 90 88 86 84 82 80 1 Complexité croissante de la hiérarchie mémoire : L1, L2, L3, MP M1 Informatique 2012-2013 Evolution des hiérarchies mémoire (1985-2000) Bus spécial a) CPU L1 cache MP d) Bus système + 386 b) CPU + Caches L1 MP Caches L1 Cache L2 MP PentiumII Bus système Bus système Bus spécial Pentium c) Cache L2 CPU superscalaire e) CPU Cache superscalaire + L2 Caches L1 MP Bus système Pentium Pro MP RDRAM CPU superscalaire + Caches L1 Cache L2 Pentium4 Bus système M1 Informatique 2012-2013 11 La densité de puissance 1000 Réacteur nucléaire Watts/cm2 100 Trainée fusée Pentium® 4 Plat chaud 10 Pentium® III Pentium® II Pentium® Pro Pentium® i386 i486 1 * “New Microarchitecture Challenges in the Coming Generations of CMOS Process Technologies” – Fred Pollack, Intel Corp. Micro32 conference key note - 1999. M1 Informatique 2012-2013 Multiprocesseurs et puissance (d’après F. Anceau) M1 Informatique 2012-2013 12 Le grand virage… • Evolution des processeurs pour PC (Intel, AMD) – D De l’augmentation l’ t ti de d la l ffréquence é d’h d’horloge… l – Au parallélisme • Hyperthread • Multi-cœurs M1 Informatique 2012-2013 Processeurs Intel et AMD : Multithread et Multiprocesseurs Processeur logique 1 Etat archit. (registres) Processeur logique 2 Etat archit. (registres) Processeur physique 1 Etat archit. (registres) Unités fonctionnelles Unités fonctionnelles Caches Caches Mémoire principale Processeur physique 2 Etat archit. (registres) Unités fonctionnelles Caches Mémoire principale M1 Informatique 2012-2013 13 CPU et GPU 10000 T12 GTX285 8800 Ultra GFLOPS 1000 GTX280 7800 GTX 8800 GTX 7900 GTX 6800 Ultra 100 10 Dual core P4 P4 Dual core P4 NVIDIA GPU Xeon Westmere Quad Core 2 Duo Intel CPU 0 -1 ja nv -0 ja nv -0 ja nv 9 8 7 -0 6 ja nv -0 ja nv -0 5 4 ja nv -0 ja nv ja nv -0 3 1 M1 Informatique 2012-2013 Puissance et énergie Energie • “Capacité p à faire qquelque q chose d’utile” • Important pour – Durée de vie des piles et batteries – Facture d’électricité • Mesurée au cours du temps p à la somme des capacités p et au carré • Proportionnelle 2 de la tension (CV ) M1 Informatique 2012-2013 14 Les batteries Batteries au lithium : 1992 : 90 Wh/kg, g, 2000 : 140 à 160 Wh/kg . 2007 : de 190 à 200 Wh/kg. Source : CEA M1 Informatique 2012-2013 Puissance et énergie Puissance • Travail effectué par unité de temps • – Mesuré en Watts P = CV2f (: activité, C: capacités, V: tension, f : fréquence) • “Mesurée” à sa valeur maximale • Plus de puissance Plus de courant – Ne peut dépasser les contraintes de puissance maximale disponible • Plus de puissance Température plus élevée – Ne peut dépasser les contraintes thermiques M1 Informatique 2012-2013 15 Evolution de la puissance (à taille de puce constante) 250 100 Watts 200 150 Puissance utile 75 Puissance/cm2 50 100 25 50 0 Puissance (W/c cm2) Puissance fuite ~ puce 15mm Fréquence q X 1.5 chaque génération 0 Limites: 1. Puissance dissipée, 2. Alimentation, et 3. Densité de puissance M1 Informatique 2012-2013 Le spectre d’implémentation Microprocesseur Matériel Reconfigurable ASIC – ASIC • Haute performance – dédié à l’application • Non modifiable – Processeur • Programmable • Non dédié à l’application – Matériel reconfigurable • Bon compromis M1 Informatique 2012-2013 16 M1 Informatique 2012-2013 Espace d’implémentation M1 Informatique 2012-2013 17 Un grand défi : la réduction de l’énergie consommée et de la puissance dissipée • Effort à tous les niveaux – – – – – Niveau technologique Niveau circuit/logique Niveau architectural Niveau algorithmique Niveau système M1 Informatique 2012-2013 Systèmes multiprocesseurs sur puce (MPSoC) Méthodologies de conception DSP MMU External Memory IP CORE D$ Engine I$ CONTROL BUS IP Platform IP IP . . CONTROL BUS . Middleware / OS Niveau d’abstraction consid déré IP MEMORY BUS Application IP Conception à base de plateformes RISC CORE D$ Engine I$ SW HW RTL RTL TA SW Mers de processeurs Portes Blocs matériels + logiciel Transistors Mer de portes Mer de transistors Dessins de masques Années 70’s 80’s Années 90 (début) Années 90 (fin) 2005+ M1 Informatique 2012-2013 18 Les écarts de productivité • Évolution comparée du temps de conception d’un circuit et du nombre de portes disponibles Écart de productivité de conception 10,000 100,000 1,000 10,000 100 Transistors par 10 puce 1 (en millions) 0.1 0.01 Capacité des circuits intégrés Ecart productivité 0.001 1000 100 10 1 Productivité (K)Transistors par Homme-Mois. 0.1 0.01 M1 Informatique 2012-2013 Où va l’effort de conception ? Lo ogiciel Matériel Source : IBS 2002 M1 Informatique 2012-2013 19 Les technologies du futur • Les interconnexions devenant prédominante, jouer sur la fréquence d’horloge n’est plus efficace • La puissance de fuite devient plus importante que la puissance active • La dispersion des composants augmentent (problèmes de conception, de rendement) • La conception traditionnelle “pire cas” devient trop pessimiste. 2.2 Performances relatives de l’inverseur (sortance 4) 2.0 1.8 fast process T=-40degC 1.6 typ process T=25degC 1.4 1.2 Performance degradation!!! 1.0 slow process T=125degC 0.8 0.6 0.19 CMOS180.17 0.15 CMOS12 0.13 0.11 CMOS090 0.09 CMOS065 0.07 0.05 M1 Informatique 2012-2013 20