Regular Expressions II

Transcription

Regular Expressions II
Perl
Programmierung
Fachhochschule Leipzig
University of Applied Sciences
Regular Expressions
Verwenden Sie bitte das Vorlesungsscript, Ihre Notizen und die Perl-Dokumentation für die folgenden Übungen.
Übung 1: Auf ‚upload’ finden Sie das Perl-Script ‚log-analyse.pl’. Dieses Script liest ein
Logfile von einem Apache- Webserver ein und ermittelt die Besucher der
Webseite (URL der Clients) und die Anzahl Zugriffe jedes Clients.
Analysieren Sie das Script: Wie arbeitet es?
Dazu diese Informationen: Ein Datensatz im Logfile hat diesen Aufbau:
client - user [datetime] "request" status - "referer" "agent"
mit: client =
user =
datetime =
request =
status =
referer =
agent =
client URL
user name, wenn vorhanden, sonst date/time im NCSA-Format
request line (nur bei HTTP)
response code, 3 Ziffern
HTTP referer
HTTP user agent (Browser Name)
beispielsweise:
!!"
# $ %"
!& ' ( )
'* +, -
.
'(/ ' .
0 12
Übung 2: Ändern Sie ‚log-analyse.pl’ so ab, dass es die Besucherzahl (Anzahl Clients
insgesamt) jeder der verschiedenen Webseiten ermittelt und ausgibt.
Übung 3: Ändern Sie ‚log-analyse.pl’ so ab, dass es eine Statistik der verwendeten
Browser (die „agents“) ausgibt.
Übung 4: Speichern Sie eine Webseite „http://henry/“ lokal als HTML-File. Schreiben
Sie ein Programm, das diese Datei liest und alle darin enthaltenen URL ausgibt.
Hinweis: Im HTML-Code finden Sie die URL eingebettet in den a-Tags, beispielsweise so:
3
-2-
…<a href="http://henry/">"Henry"</a>…
(absoluter Link), oder
…<a href="/ifg/">"Informatik Grundlagen"</a>…
(relativer Link)
Manchmal fehlen die Anführungszeichen auch:
…<a href=/ifg/>Informatik Grundlagen</a>…
Zusatz:
Schreiben Sie ein Programm, das in der HTML-Datei von Übung 4 die relativen durch absolute Adressen ersetzt und das Ergebnis in einer neuen Datei
speichert.
2006-11-01