Rechnerarchitektur I
Transcription
Rechnerarchitektur I
Rechnerarchitektur I, Wintersemester 2006/07 12. November 2006 Rechnerarchitektur I Wintersemester 2006/07 Philipp Buchegger, Patrick Ruo Tübingen, den 12. November 2006 Aufgabe 3 3a) SpeedupGesamt = 1 (1 − Anteilbeschleunigt ) + AnteilBeschleunigung Speedupbeschleunigt SpeedupGesamt (10) ≈ 6.8966 SpeedupGesamt (100) ≈ 16.8067 SpeedupGesamt (1000) ≈ 19.6270 SpeedupGesamt (∞) = 20 3b) Speedup real 1000 900 800 700 600 500 400 300 200 100 0 Speedup=1000: 80,08% Speedup=100: 80,80% 1000 800 Speedup=10: 88,8% 0 0.2 0.4 beschl. Anteil Philipp Buchegger, Patrick Ruo 600 400 0.6 Speedup ideal 200 0.8 1 0 speedup_gesamt(x,y) 1 Rechnerarchitektur I, Wintersemester 2006/07 12. November 2006 Aufgabe 7 Home-PC: Conroe E6600@2,4GHz mit und ohne Register Microseconds for one run through Dhrystone: 0.1 Dhrystones per Second: 7142857 Home-PC: Conroe E6600@2,4GHz mit und ohne Optimierung Microseconds for one run through Dhrystone: 0.2 Dhrystones per Second: 5000000 Home-PC: Conroe E6600@3,0GHz Microseconds for one run through Dhrystone: 0.1 Dhrystones per Second: 7142857 virginis: Microseconds for one run through Dhrystone: 1.5 Dhrystones per Second: 666666.7 virginis mit Registern Microseconds for one run through Dhrystone: 1.5 Dhrystones per Second: 675675.7 virginis ohne Optimierung Microseconds for one run through Dhrystone: 2.8 Dhrystones per Second: 354609.9 mimi: Microseconds for one run through Dhrystone: 0.3 Dhrystones per Second: 3846153.8 mimi mit Registern: Microseconds for one run through Dhrystone: 0.3 Dhrystones per Second: 3571428.5 puppis: Microseconds for one run through Dhrystone: 1.5 Dhrystones per Second: 675675.7 puppis ohne Optimierung Microseconds for one run through Dhrystone: 2.8 Dhrystones per Second: 354609.9 b) Ohne Optimierung hat man also einen Geschwindigkeitsverlust von ca. 50%, während das verwenden von Registern teilweise auch Geschwindigkeitseinbuÿen brachte. Desweiteren ist zu bemerken, dass dieser Benchmark wohl nicht für so schnelle Computer, wie wir heute haben, geschrieben wurde. Zwei Werte unterscheiden sich nicht, obwohl der Computer einmal im idle-Zustand war und das andere mal mit ca. 10%iger Auslastung. c) Der Dhrystone-Benchmark enthält nur Integer-Operationen, da im Jahr 1984 eine FPU nicht wie heute zum Standard gehörte. Deswegen ist der auch um die Geschwindigkeit heutiger Computer zu vergleichen extrem unzuverlässig. Vergleichen mit z.B. dem Benchmark SuperPI zeigt Dhrystone bei 600MHz Taktfrequenz die selben Werte an, während bei der Berechnung von 1Mio Stellen von Pi sich 15 deutlich von 21s unterscheiden. Ein guter Benchmark besteht aus mehreren anwendungsbezogenen Programmen, die alle Features der CPU und des Speichercontrollers nutzen können, aber auch auf ältere Hardware laufen. Zu beachten ist, dass e neben Integer-Benchmarks auch Floatingpoint-Benchmarks durchlaufen werden. Philipp Buchegger, Patrick Ruo 2