Regular Expressions II
Transcription
Regular Expressions II
Perl Programmierung Fachhochschule Leipzig University of Applied Sciences Regular Expressions Verwenden Sie bitte das Vorlesungsscript, Ihre Notizen und die Perl-Dokumentation für die folgenden Übungen. Übung 1: Auf ‚upload’ finden Sie das Perl-Script ‚log-analyse.pl’. Dieses Script liest ein Logfile von einem Apache- Webserver ein und ermittelt die Besucher der Webseite (URL der Clients) und die Anzahl Zugriffe jedes Clients. Analysieren Sie das Script: Wie arbeitet es? Dazu diese Informationen: Ein Datensatz im Logfile hat diesen Aufbau: client - user [datetime] "request" status - "referer" "agent" mit: client = user = datetime = request = status = referer = agent = client URL user name, wenn vorhanden, sonst date/time im NCSA-Format request line (nur bei HTTP) response code, 3 Ziffern HTTP referer HTTP user agent (Browser Name) beispielsweise: !!" # $ %" !& ' ( ) '* +, - . '(/ ' . 0 12 Übung 2: Ändern Sie ‚log-analyse.pl’ so ab, dass es die Besucherzahl (Anzahl Clients insgesamt) jeder der verschiedenen Webseiten ermittelt und ausgibt. Übung 3: Ändern Sie ‚log-analyse.pl’ so ab, dass es eine Statistik der verwendeten Browser (die „agents“) ausgibt. Übung 4: Speichern Sie eine Webseite „http://henry/“ lokal als HTML-File. Schreiben Sie ein Programm, das diese Datei liest und alle darin enthaltenen URL ausgibt. Hinweis: Im HTML-Code finden Sie die URL eingebettet in den a-Tags, beispielsweise so: 3 -2- …<a href="http://henry/">"Henry"</a>… (absoluter Link), oder …<a href="/ifg/">"Informatik Grundlagen"</a>… (relativer Link) Manchmal fehlen die Anführungszeichen auch: …<a href=/ifg/>Informatik Grundlagen</a>… Zusatz: Schreiben Sie ein Programm, das in der HTML-Datei von Übung 4 die relativen durch absolute Adressen ersetzt und das Ergebnis in einer neuen Datei speichert. 2006-11-01