Les ordinateurs : de 1946 à aujourd`hui
Transcription
Les ordinateurs : de 1946 à aujourd`hui
Architectures avancées : Introduction Daniel Etiemble [email protected] Les ordinateurs : de 1946 à aujourd’hui • ENIAC (1946) – – – – 19000 tubes 30 tonnes surface de 72 m2 consomme 140 kilowatts. Horloge : 100 KHz. – ≈ 330 multiplications/s • Mon portable (2006) – Intel Duo Processor 2GHz – 1 Go DRAM, 100 Go disque – 1, 9 kg M2 SETI 2006-2007 Architectures avancées D. Etiemble 2 1 « Systèmes informatiques » M2 SETI 2006-2007 Architectures avancées D. Etiemble 3 Systèmes embarqués ou enfouis • “Ordinateurs” camouflés Sony Playstation 2 Casio Camera Watch Nokia 7110 Browser Phone Philips TiVo Recorder Philips DVD player M2 SETI 2006-2007 Prof. Stephen A. Edwards of Columbia University Architectures avancées D. Etiemble 2 Les applications • • • • • • • • Usage général Calcul Scientifique GRAPHIQUE Traitement du signal JAVA Bases de données WEB Enfoui et embarqué M2 SETI 2006-2007 Architectures avancées D. Etiemble 5 Les grandes classes de système Caractéristique Ordinateur de bureau Serveur Enfoui/embarqué Prix du microprocesseur 100 à 1000 € 200 à 2000 € par processeur 0,20 à 200 € par processeur Microprocesseurs vendus en 2000 150 millions 4 millions 300 millions (en ne comptant que les 32 et 64 bits) Critères Prixperformance Performance graphique Débit, disponibilité, extensibilité Prix, puissance dissipée, performance pour l’application M2 SETI 2006-2007 Architectures avancées D. Etiemble 6 3 Gammes de processeurs • Haut de gamme • Contraintes – Processeurs des PC et serveurs – – – – – • Spécialisé – Haut de gamme des générations précédentes Ex : MIPS « enfouis » Prix Performance Encombrement Consommation Temps réel • temps d’exécution déterministe ou non • Spécialisé embarqué – Faible consommation – Temps réel M2 SETI 2006-2007 Architectures avancées D. Etiemble 7 Ventes des microprocesseurs (fin du siècle dernier ☺) • Processeurs enfouis/embarqués – – – – 4 bits : 2 milliards 8 bits : 4,7 milliards 16 bits : 700 millions 32 bits : 400 millions • DSP (traitement du signal) – 600 millions • Généralistes classiques – 150 millions M2 SETI 2006-2007 Architectures avancées D. Etiemble 8 4 Performance : Microprocesseur NI Texécution = NI * CPI * Tc = IPC * F Temps de cycle Nombre de cycles/Instruction 10000 1000 CPU 100 Microarchitecture (IPC) F(MHz) 10 Technologie 96 20 00 92 88 84 80 1 M2 SETI 2006-2007 Architectures avancées D. Etiemble 9 DES EXPONENTIELLES MICROPROCESSEURS 2x/1,5an CPU Performance après 1987 Performance avant 1986 Fréquence d'horloge (MOS) Evolution/an M2 SETI 2006-2007 0% 10% 20% 30% 40% 50% 60% Architectures avancées D. Etiemble 10 5 DES EXPONENTIELLES MEMOIRES 2x/1,5an 0,5/10 ans Bande passante Latence Quantité/Prix Capacité 0% Evolution/an M2 SETI 2006-2007 20% 40% DISK 60% DRAM Architectures avancées D. Etiemble 11 La loi de Moore Transistors par puce 108 256M 64M Mémoire Microprocesseur 107 106 16M 4M 1M 256K 105 i486™ i486™ 64K 4K 16K 104 1K 103 4004 102 80286 Pentium® Pentium® III Pentium® II Pentium® Pro i386™ i386™ 8086 8080 101 100 ’70 ’73 ’76 ’79 ’82 ’85 ’88 ’91 ’94 '97 2000 Source: Intel M2 SETI 2006-2007 Architectures avancées D. Etiemble 12 6 Processeurs Intel : nombre de transistors l’année d’introduction 1000000000 Itanium2 P4 100000000 Nb de transistors 10000000 1000000 i486 100000 i286 10000 PIII PII Pentium Itanium2 Itanium i386 8086 1000 4004 8080 100 10 1 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 M2 SETI 2006-2007 Architectures avancées D. Etiemble 13 LES DIFFERENTIELS 10000 1000 CPU 100 Mémoire 10 2000 98 96 94 92 90 88 86 84 82 80 1 Complexité croissante de la hiérarchie mémoire : L1, L2, L3, MP M2 SETI 2006-2007 Architectures avancées D. Etiemble 14 7 La densité de puissance 1000 Nuclear Nuclear Reactor Reactor 2 Watts/cm 100 Rocket Nozzle Pentium® Pentium® 4 Hot plate 10 Pentium® Pentium® III Pentium® Pentium® II Pentium® Pentium® Pro Pentium® Pentium® i386 i486 1 1.5μ 1μ 0.7μ 0.5μ 0.35μ 0.25μ 0.18μ 0.13μ 0.1μ 0.07μ * “New Microarchitecture Challenges in the Coming Generations of CMOS CMOS Process Technologies” Technologies” – Fred Pollack, Intel Corp. Micro32 conference key note - 1999. M2 SETI 2006-2007 Architectures avancées D. Etiemble 15 Le grand virage… • Evolution des processeurs pour PC (Intel, AMD) – De l’augmentation de la fréquence d’horloge… – Au parallélisme • Hyperthread • Multi-cœurs M2 SETI 2006-2007 Architectures avancées D. Etiemble 16 8 Processeurs Intel et AMD : Multithread et Multiprocesseurs Processeur logique 1 Etat archit. (registres) Processeur logique 2 Processeur physique 1 Etat archit. (registres) Etat archit. (registres) Unités fonctionnelles Unités fonctionnelles Caches Caches Mémoire principale M2 SETI 2006-2007 Processeur physique 2 Etat archit. (registres) Unités fonctionnelles Caches Mémoire principale Architectures avancées D. Etiemble 17 Puissance et énergie Energie • “Capacité à faire quelque chose d’utile” • Important pour – Durée de vie des piles et batteries – Facture d’électricité • Mesurée au cours du temps • Proportionnelle à la somme des capacités et au carré de la tension (CV2) M2 SETI 2006-2007 Architectures avancées D. Etiemble 18 9 Puissance et énergie Puissance • Travail effectué par unité de temps • – Mesuré en Watts P = αCV2f (α : activité, C: capacités, V: tension, f : fréquence) • “Mesurée” à sa valeur maximale • Plus de puissance Plus de courant – Ne peut dépasser les contraintes de puissance maximale disponible • Plus de puissance Température plus élevée – Ne peut dépasser les contraintes thermiques M2 SETI 2006-2007 Architectures avancées D. Etiemble 19 Evolution de la puissance (à taille de puce constante) 100 250 Watts 200 150 Puissance utile 75 Puissance/cm2 50 100 25 50 0 ~ puce 15mm Fréquence X 1.5 chaque génération 0 0.25μ M2 SETI 2006-2007 Puissance (W/cm2) Puissance fuite 0.18μ 0.13μ 0.1μ Architectures avancées D. Etiemble Limites: Limites: 1. 1.Puissance Puissancedissipée, dissipée, 2. Alimentation, 2. Alimentation,et et 3. 3.Densité Densitéde depuissance puissance 20 10 Plan des 3 premiers cours • Jeux d’instructions – Impact sur performance – Impact sur taille du code • Pipelines – Simple, superpipeline et superscalaire : impact sur la performance – Impact des branchements • Prédicteurs • Alternative : instructions conditionnelles et prédicats (ARM, IA-64) • Hiérarchie mémoire – Caches et impact sur la performance • Monoprocesseur • Cohérence des caches dans les multiprocesseurs – Alternatives aux caches • Processeurs vectoriels • Mémoire scratch-pad M2 SETI 2006-2007 Architectures avancées D. Etiemble 21 11