Rechnerarchitektur I

Transcription

Rechnerarchitektur I
Rechnerarchitektur I,
Wintersemester 2006/07
12. November 2006
Rechnerarchitektur I
Wintersemester 2006/07
Philipp Buchegger, Patrick Ruo
Tübingen, den 12. November 2006
Aufgabe 3
3a)
SpeedupGesamt =
1
(1 − Anteilbeschleunigt ) +
AnteilBeschleunigung
Speedupbeschleunigt
SpeedupGesamt (10) ≈ 6.8966
SpeedupGesamt (100) ≈ 16.8067
SpeedupGesamt (1000) ≈ 19.6270
SpeedupGesamt (∞) = 20
3b)
Speedup real
1000
900
800
700
600
500
400
300
200
100
0
Speedup=1000: 80,08%
Speedup=100: 80,80%
1000
800
Speedup=10: 88,8%
0
0.2
0.4
beschl. Anteil
Philipp Buchegger, Patrick Ruo
600
400
0.6
Speedup ideal
200
0.8
1 0
speedup_gesamt(x,y)
1
Rechnerarchitektur I,
Wintersemester 2006/07
12. November 2006
Aufgabe 7
Home-PC: Conroe E6600@2,4GHz mit und ohne Register
Microseconds for one run through Dhrystone: 0.1
Dhrystones per Second: 7142857
Home-PC: Conroe E6600@2,4GHz mit und ohne Optimierung
Microseconds for one run through Dhrystone: 0.2
Dhrystones per Second: 5000000
Home-PC: Conroe E6600@3,0GHz
Microseconds for one run through Dhrystone: 0.1
Dhrystones per Second: 7142857
virginis:
Microseconds for one run through Dhrystone: 1.5
Dhrystones per Second: 666666.7
virginis mit Registern
Microseconds for one run through Dhrystone: 1.5
Dhrystones per Second: 675675.7
virginis ohne Optimierung
Microseconds for one run through Dhrystone: 2.8
Dhrystones per Second: 354609.9
mimi:
Microseconds for one run through Dhrystone: 0.3
Dhrystones per Second: 3846153.8
mimi mit Registern:
Microseconds for one run through Dhrystone: 0.3
Dhrystones per Second: 3571428.5
puppis:
Microseconds for one run through Dhrystone: 1.5
Dhrystones per Second: 675675.7
puppis ohne Optimierung
Microseconds for one run through Dhrystone: 2.8
Dhrystones per Second: 354609.9
b)
Ohne Optimierung hat man also einen Geschwindigkeitsverlust von ca. 50%, während das verwenden von Registern
teilweise auch Geschwindigkeitseinbuÿen brachte. Desweiteren ist zu bemerken, dass dieser Benchmark wohl nicht
für so schnelle Computer, wie wir heute haben, geschrieben wurde. Zwei Werte unterscheiden sich nicht, obwohl der
Computer einmal im idle-Zustand war und das andere mal mit ca. 10%iger Auslastung.
c)
Der Dhrystone-Benchmark enthält nur Integer-Operationen, da im Jahr 1984 eine FPU nicht wie heute zum Standard
gehörte. Deswegen ist der auch um die Geschwindigkeit heutiger Computer zu vergleichen extrem unzuverlässig.
Vergleichen mit z.B. dem Benchmark SuperPI zeigt Dhrystone bei 600MHz Taktfrequenz die selben Werte an,
während bei der Berechnung von 1Mio Stellen von Pi sich 15 deutlich von 21s unterscheiden. Ein guter Benchmark
besteht aus mehreren anwendungsbezogenen Programmen, die alle Features der CPU und des Speichercontrollers
nutzen können, aber auch auf ältere Hardware laufen. Zu beachten ist, dass e neben Integer-Benchmarks auch
Floatingpoint-Benchmarks durchlaufen werden.
Philipp Buchegger, Patrick Ruo
2

Documents pareils