Geographische Informationstechnologie

Transcription

Geographische Informationstechnologie
Geographische Informationstechnologie
Oliver Bender & Doreen Jens, Universität Bamberg
BLOCK 2: 22.-24.06.2001
3.1 Datenformate, Datenquellen und Datendokumentation
Datentransfer (1/2)
Rolle von Austauschformaten
Typen externer Schnittstellen
Geographische Formate (1)
DXF (AutoCAD Drawing Interchange Format)
Unterschied CAD und GIS
CAD:
• geometrische Elemente besitzen fest vorgegebene graphische Darstellungsweise (Strichdicke, Farbe etc.)
• Strich eines CAD-Systems ist OBJEKT, besitzt ein oder mehrere graphische Attribute (Strichdicke etc.)
• CAD- ELemente kennen keine Sachinformationen
• keine Topologie (Nachbarschaftsbeziehungen von Objekten)
GIS
• Objekt vollständig durch Attribute beschrieben (z.B. Haus: Strasse, Hausnummer, Baualter, Stockwerke, ..). Geometrie ist ein
Attribut.
• Graphik ist keine Objekteigenschaft, wird flexibel aus seinen Attributen erzeugt
• über räumliche Analysemöglichkeiten neue Informationen generierbar
Übung - Datenimport Vermessung
Import .dxf / .dwg-Daten
• Extensions: CAD-Reader
• Datei: c:\esri\av_gis30\avtutor\arcview\cad\parcels.dwg
• CAD-Zeichnungsebenen verwalten über die Option „Drawings“ in den Themeneigenschaften
Geographische Formate (2)
SQD (sequential datafile)
GDF (geographic data files)
Graphische Formate (1/2)
Postscript / EPS (.ps / .eps)
Graphics Interchange Format GIF * (.gif)
JPEG (.jpg / .jpeg)
Tag Image File Format (TIFF) (.tif); World File in Zusammenhang mit Georeferenzierung von Rasterbildern
GeoTIFF (.tif)
Konverter für Grafikformate: Image Alchemy, Image Alchemy PS
Schnittstellen
EDBS als "Einheitliche DatenBankSchnittstelle"
• zur Abgabe der ALK und ATKIS-Daten durch LVA der BRD
• EDBS-Schnittstellenprogramme nach SICAD Spatial Desktop, nach IBM-GTIS (IFF-Format), nach MapInfo, ARCEDBS
(bidirektionale Schnittstelle für ARC/INFO), für ArcView
INTERLIS-Format ITF in der Schweiz
ÖNORM A2260 in Österreich als "Datenschnittstelle für den digitalen Austausch von Geo-Daten"
1
Globale Geodatenquellen (1)
World Data Base II der CIA
World Databank I
Digital Chart of the World (DCW), abgeleitetes Produkt: v.a. von Operational Navigation Chart (ONC) der DMA, M 1:1000000
GLIS (Global Land Information System) des US Geological Survey
Globale Geodatenquellen (2)
GTOPO30
TerrainBase Global Terrain Model vom National Geophysical Data Center / World Data Center for Marine Geology 1991-94
Digital Terrain Elevation Data (DTED®) Level 0
Europäische Datenquellen
SABE (Seamless Administrative Boundaries of Europe) im Rahmen von MEGRIN (Multipurpose European Ground Related
Information Network)
Straßendaten, z.B. Teleatlas; AND Data (Claris)
GRID-Arendal (Global Resource Information Database - Arendal Norway)
Deutsche Datenquellen (1/2)
ATKIS (Amtlich-Topographisch-Kartographisches Informationssystem) von der AdV
Digitales Landschaftsmodell 1:25 000 (DLM 25)
• räumliche Entitäten nach hierarchischem Objektartenkatalog in Anlehnung an Informationsgehalt der TK 25
Digitale Topographische Karte (früher: digitales kartographisches Modell [DKM]) aus DLM abgeleitet
Deutsche Datenquellen (3)
Digitale Gebäudedaten
• Einzelgebäude als Grundrisse stereo-fotogrammetrisch erfasst zum DLM25 passfähig; Lagegenauigkeit von +/- 50 cm;
zugeordnet ist Attribut " Relative Gebäudehöhe"
Digitale Verwaltungsgrenzen
• Kreise, Ämter und Gemeinden als Polygone; Landes- und Staatsgrenze als Linien; Sachdaten
Digitales Geländehöhenmodell (DGM)
• Gitter von 25 m, 50 m, 100 m oder 200 m; Böschungen
Deutsche Datenquellen (4)
ALB (Amtliches Liegenschaftsbuch) mit DFK (Digitaler Flurkarte)
• ALB in spezieller Datenbank
• DFK derzeit im Aufbau; Abgabeformate in Bayern: DXF, SQD, DFK (Bayern), EBDS (zukünftig)
Dokumentation: Metadaten (1)
Metadaten sind "Daten über Daten"
• automatische Berücksichtung ! verbunden mit Geodatensatz
• Nutzbarkeit für die Anwendung beschreiben / Beurteilung für einen bestimmten Einsatzzweck
• längerfristige Wertsicherung
• Katalogfähigkeit
umgekehrt: Gefahren ohne Metadaten
Dokumentation: Metadaten (2)
•
•
•
•
•
•
US-NSDI (National Spatial Data Infrastructure): Unterstützung des Spatial Data Transfer Standard (SDTS)
EGII (European Geographic Information Infrastructure), Kooperation mit OpenGIS- Konsortium
nationale Projekte
Internet als grundsätzliche Zugriffsmöglichkeit zu verteilt vorliegenden Geodaten:
aktives Eintragen in Kataloge vs. "Abholprinzip" mit Indizierung in Form von Suchmaschinen
"header" mit Metadaten, Bsp. HTML-Datei, Grafikformate (TIFF, JPEG) Textdateien (MS-Word)
2
Dokumentation: Metadaten (3)
Kategorien von Metadaten
• semantisch
• syntaktisch
• strukturell !Bezugsniveau
• navigatorisch
• "abgeleitet"
• extern
• genetisch
Dokumentation: Metadaten (4)
FGDC-Standard - Hauptkategorien an Metadaten
• Identifikation
• Datenqualität
• Räumliche Datenorganisation
• Georeferenzierung
• Entitäten u. Attribute
• Bezug
• Metadatenreferenz
• empfohlene Zitierform
• Zeitliche Gültigkeit
• Kontaktadressen
3.2 Attributdaten in Datenbanken
Attributdatentypen
Datentypen: alphabetisch, numerisch, alphanumerisch
Feldtypen in Datenbanken:
– Text/String/Character,
– Ganzzahl/Integer, Dezimalzahl/Numeric,
– Logical/Bool,
– Datum/Date, Zeit/Time, Währung,
– Memo (Referenzadresse für Texte, begrenzter Speicherplatz),
– BLOB (Binary Large Object),
– spezielle Typen z.B. OLE (Object Linking and Embedding)
Skalenniveaus:
Nominal (Kulturarten) ! Text;
Ordinal (Schulnoten) ! Text, Zahl
Intervall (Zeit, Temperatur)
Verhältnis ! Numm., Gleitkomma
Datenbanken
Datenbasis
DBMS: Programme (z.B. ORACLE, WATCOM, MS Access); Metadaten
Datenbankschema: Relational, Hierarchisch, Netzwerk
Datenbank: Erstellung, Abfrage, Aktualisierung
Tabellen
Tabellen
• statische Basistabellen/base tables,
• Datenbank-Abfragen/queries,
• dynamische Benutzersichten/views,
• Bearbeitungshistorie
3
Spalten/columns ! Attribute
• Domäne/domain = Gültigkeits- und Wertebereich;
• Anzahl Spalten ! Grad/degree
Zeilen/Tupel/rows ! Objekte, Entitäten
• Anzahl Zeilen! Mächtigkeit/cardinal
• für jeden Objekttyp eine Tabelle
Relation: Sammlung von Attributen eines Datensatzes,
Assoziationen (Beziehungen) zwischen Objekten/Attributen; Typen: 1:1, 1:n, n:1, n:m
Schlüssel
• (Primär)-Schlüssel = Attribut(e), eindeutige Wertekombination ! Identifikation von Objekten
• Sekundär-/ Fremdschlüssel ! Einsprungstellen für andere Tabellen, muß nicht eindeutig sein
• Einfachschlüssel/ zusammengesetzte Schlüssel
Relationales Datenbanksystem (CODD)
12 Regeln
derzeit keine Software, die alle Anforderungen erfüllt, insbes. PC-DBMS erfüllen R12 nicht
Relationale Algebra
klassische Mengenoperatoren
∪ Vereinigung/Insert,
∩ Durchschnitt,
⁄ Differenz/Delete
spezielle Relationenoperatoren
π Projektion/Spaltenauswahl
σ Selektion/Tupelauswahl
!"
Verbund/Join
Datenbankdesign
Analyse, Entwurf, Normalisierung (logische Korrektheit), physisches Design (entspr. Software), Test, Implementierung, Revision
Ziele (1): Redundanzfreiheit, Wartungssicherheit, Speicherplatz
Ziele (2): (kein/e) DELETE-, INSERT, UPDATE-Anomalien, Verlust von Informationen beim Verknüpfen von Tabellen (Join),
Verlust von funktionalen Abhängigkeiten
Normalisierung
Vermeidung von Anomalien, Herstellen funktionaler Abhängigkeiten
(zu jedem Wert von Attribut Z genau 1 Wert von Attribut Y)
PERSON:= *Name, Vorwahl_1, Telnr_1, Vorwahl_2, TelNr_2
1. NF: Auflösung von Attributwiederholungen, Relation in sich keine weiteren Relationen
PERSON:= *Persnr, Name
TELEFON := *Persnr, Lfdnr, Vorwahl, Telnr
STUDENT := *Stdnr, *Fachnr, Name, Vorname, Fachname, Fachadresse
2. NF: Auflösung kombinierter Primärschlüssel, wenn Attribute nur auf Primärschlüsselteile bezogen
STUDENT := *Stdnr, Name, Vorname, Fachnr
FACH := *Fachnr, Fachname, Fachadresse
GEBAEUDE := *GebNr, GebTyp, Baujahr, StrasseNr, Strassenname, HausNr
3. NF: Beseitigung von transitiven Abhängigkeiten
GEBAEUDE := *GebNr, GebTyp, Baujahr, StrasseNr, HausNr
STRASSE := * StrasseNr, Strassenname
Übung: Normalisierung (1/2/3)
4
ER-Modellierung (CHEN)
Modellierungswerkzeug / Datenbankschema
Software: PowerDesigner (SYBASE)
verschiedene Darstellungsvarianten, z.B. CHEN 1976:
"
Entitäten, Entitätstypen
jede Entität des Sets hat gleiches Gefüge von Attributen
Domänen der Attribute gelten für ganzen Set
Schlüssel
#
Properties = Attribute
Relationsships/~typen: Beziehungstypen zwischen Entitäten ! 1 Datenbanktabelle
<>
Komplexität: Häufigkeit mit der Entitäten Relationshipset enthalten ! (min/max)
(n,m)
Jeder Beziehungstyp kann als eigenständige Tabelle abgebildet werden
• Schlüsselattribute der beteiligten Entitätstabellen dann als Fremdschlüssel
• Primärschlüssel von Beziehungstyptabellen entweder aus den Fremdschlüsseln oder als künstlicher Schlüssel
Einsatzumgebung
•
•
•
•
PC-Einplatzsysteme
Rechner-Terminal-System (Administrator)
Client-Server-System (Netzwerk)
ODBC (Open DataBase Connectivity)
GIS & Datenbank
Intern:
Rastermodell:
Flat-File-System (z.B. IDRISI):
Duale Systeme (z.B. ARC/INFO):
Integrierte Systeme (z.B. SICAD, IBM/GS):
Extern:
• Verknüpfung mit selbständiger externer Datenbanksoftware
• Einbeziehung externer Datenbestände
• Auslagerung bestimmter Daten aus dem System
Aktuelle Entwicklungen
• Erweiterte integrierte RDBMS
• Objektorientierte Systeme (z.B. Smallworld GIS)
• neue Ansätze zur Speicherung der Geometrie
• SDO (Spatial Data Option) von ORACLE
SQL (Structured Query Language)
•
•
•
•
•
•
•
Datenbanksprache
ursprünglich Abfragesprache, seit 1976/79
heute universelles Sprachsystem für alle sprachlichen Komponenten eines DBMS
internationaler Standard: ANSI/ISO
SQL in den einzelnen Datenbankprodukten unterschiedlich umgesetzt/erweitert
RDBMS stellen meist Kommunikationsplattform für Kommandoeingabe
Entwicklung einer Schnittstelle zu höherer Programmiersprache, versch. Lösungsansätze wie z.B. ESQL (Embedded SQL)
•
•
•
•
abbildungsorientiert – mengenorientiert
SELECT y FROM x WHERE f
Auswahlvorschrift (f) auf Definitionsbereich (x) für Abbildung auf gesuchten Wertebereich (y)
Ergebnis des SELECT-Kommandos ist eine Menge, wird in temporärer Tabelle abgelegt
DDL - Data Definition
z.B. Aufbau einer neuen Tabelle:
5
DML / DQL - Data Manipulation / Query
z.B. Datenübernahme aus anderer Tabelle:
z.B. Auswahl von Spalten:
Management der Datenerfassung (allg.)
weniger technisches, mehr organisatorisches Problem
• hohe Eintrittsschwelle in GIS-Projekte
• Wertverlust von Daten vs. Wartung und Pflege
• Kostenschätzung / Kosten-Nutzen-Vergleich
rechtliche Aspekte
• TCO (Total Cost of Ownership)
• TCU (Total Cost of Usage
• Copyright
• Nutzungs- und Lizenzvereinbarungen
• OpenGIS
• Bedarfsanalyse
• Datenmodelle und Technologien: Raster vs. Vektor, Bild vs. Objekt, automatische vs. manuelle Erfassung
• Eigenerfassung vs. Dienstleistung / Mehrpartnerprojekte
• Auf- und Vorbereitung des Ausgangsmaterials
• Sekundär- vs. Primärdatenerfassung
• Nachbereitung primär erhobener Daten
• Erfassungseinheit (=Primitiv)
• Just-in-time oder vorab "alles"?
• Referenzrahmen gescannter Datenbestand, Digitalisieren nur an einzelnen Stellen nach Bedarf
• Quality Assurance
• Quality Control: Schwellwert, Vergleich mit dem Ausgangsmaterial, Dokumentation!
• Wartung der Daten
Tabellen in ArcView GIS
•
•
•
•
jedem Thema (außer bei Bilddatenquellen) eine Tabelle (Feature-Attribut-Table) zugeordnet, die im Dokument View über das
Tabellen-Icon aufgerufen wird
neue Tabellen generieren sowie externe Tabellen hinzuzufügen
dBase-Format
Nutzung anderer Datenbanken mit ODBC (OpenDataBase Connectivity)
Übung: Tabellenanbindung an ArcView
Übung: Abfragen in ArcView
6
4.1 Analyse und Visualisation (I)
Datenanalyse & Visualisation
aus vorliegenden Geodaten
neue Information
Information verdichtet bzw. reduziert
Fragen an GIS
•
•
•
Analyseschritte und -methoden
Analyseschritte als Transformationen
Analyseabläufe
Analysemethoden
Selektion und Aggregation
•
•
•
•
•
•
•
Aussagen über Teilmengen der insgesamt beobachteten Grundgesamtheit
Direkte Selektion
Nachbarschafts-Selektion
Distanz-Selektion
Koinzidenz-Selektion
attributgestützte Aggregation
Räumliche Aggregation (Raumtypen, Regionen)
Übung: Aggregation mit ArcView (1/2)
Klassifikation
Wertebereich
• gleitende Skala mittels kontinuierlicher Legende
• Festlegung von Klassenzahl und Klassengrenzen; Kriterien Ähnlichkeit und Differenzierung
Qualitative Daten
• "Unique Value"
Klassifikationsmethoden
graphische Methoden
• steam-and-leaf Diagramm (im GIT-Zusammenhang zu vernachlässigen)
numerisch-statistische Methoden
• Sinnklassen
• Zentralwerte
• Äquidistante Klassifikation
• andere Intervall-orientierte Klassifikationen
• Quantil-Klassifikationen
• Natural Breaks
Klassifikation und Visualisierung
Übung: ArcView Help – "Classification methods"
Visualisierung von Klassifikationen
• Grau-/Farbstufen
• Regeln der Farbassoziation
Übung - Klassifikation mit ArcView
Lösung - Klassifikation mit ArcView
7
Distanzanalyse
•
•
Distanz als Relation zwischen Objekten – oder thematische Oberfläche ausgehend von Bezugsobjekten
Distanz als Indikator bzw. Maß für die Intensität räumlicher Beziehungen im weiteren Sinn
Distanzmessung (1)
•
•
sphärische und ebene Bezugssysteme
"Luftlinie" vs. real wirksame Entfernung (vgl. Straßennetz)
Distanzmessung (2)
•
•
•
•
•
Buffer = Distanzkorridore (um Linien) bzw. Distanzzonen (um Punkte und Polygone)
Distanz als sich kontinuierlich veränderndes Merkmal, als sog. thematische Oberfläche ausgehend von Bezugsobjekten
"Wasserscheiden" = Grenzen der Einzugsgebiete von Bezugsobjekten
Isohypsen (Isoplethen) = Linien gleicher Entfernung vom jeweils nächstgelegenen Bezugsobjekt
Kriterium der geringsten Entfernung zu einem von mehreren Bezugspunkten ! Definition der Thiessen-Polygone
Übung - Distanzmessung / -oberfläche
Entfernungsmessung in ArcView GIS: Abstandseinheiten, "Maßband" in der Werkzeugleiste
Distanzoberfläche erstellen (Extension: Spatial Analyst)
Übung - Thiessen-Polygone
Übung - Buffer
4.2 Analyse und Visualisation (II)
Räumliche Interpolation
•
•
•
"Oberflächen", nicht flächendeckend beobachtet
Einzelwerte aus Stichproben-Messungen
Interpolation vs. Extrapolation
•
•
•
•
Annahme einer (thematischen oder topographischen) "Oberfläche" ! Werteausprägungen kontinuierlich variierend
gesuchter Punktwert einem Stützpunktes umso ähnlicher, je näher
Wahl der Interpolationstechnik ! "bestmögliche Schätzung"
Ergebnisse in für Oberflächen adäquaten Datenmodell (Raster, TIN, ...) repräsentieren
•
Beurteilung des Skalenniveaus vorliegender Daten
– metrische Daten ! Berechnung gewichteter Mittelwerte
– nominale Daten ! Thiessen-Polygone
Arten von Interpolationstechniken: global vs. lokal / exakt vs. approximativ
•
Interpolationstechniken
Trendoberflächen
IDW ("Inverse Distance Weighting")
Spline
Bruchkanten
weitere Techniken, z.B. Kriging
Isoplethen-Interpolation
Übung - Interpolation mit ArcView
8
Verschneidung - Overlay
•
•
•
"Überlagerung mehrerer Layer" (BILL)
zwecks Gewinnung neuer Erkenntnisse miteinander kombiniert ! multi-thematische Analyse
Voraussetzung: einheitliches räumliches Bezugssystem
Raster - Verschneidung
•
•
Gewichtete Verschneidung: Anwendung zu Eignungsbewertung, Risikoabschätzungen
Matrix Overlay: Matrix aller möglichen Wertekombinationen;
Vektor - Verschneidung
•
•
•
Integration von meist nur jeweils zwei Themen
bei mehreren Themen: Wiederholung der Verschneidung
hohe Anzahl an Schnittpunktberechnungen, Neuaufbau der Polygontopologie, Attributzusammenführung aller Themen !
sehr komplex
Probleme:
unabhängig voneinander entstandene Datenbestände bei in der Natur identischen Abgrenzungen nicht idente Vertices
bei der Verschneidung entstehen Pseudopolygone (sliver polygons) ohne sinnvolle thematische Aussage
nachträglich eliminiert oder von vornherein vermieden durch Festlegung eines Schwellwertes
•
•
•
Übung - Verschneidung mit ArcView
View \ Geoprocessing Wizard
Netzwerke (1)
Netzwerke von linearen Verbindungen (Strassen, Leitungen oder Wasserwege)
hier ausschließlich vor dem Hintergrund des Vektor-Datenmodells, auch (seltener) rasterbasierte Ansätze
Fragen
• Verortung von Punkten bzw. Standorten in Netzen
• Distanz entlang von Netzen
• Effektive Distanz in Form alternativer Masse wie Zeit, Kosten etc.
• Kapazität von Netzen und Teilen davon
• Analyse und Optimierung von Standorten in Netzwerken
Netzwerke
• Graphen, bestehend aus – Kanten – Knoten
• Route – Durchgehender Pfad (Weg) zwischen zwei Punkten im Netz
• Kanten wie auch Knoten sind Objekte, die mit Attributen versehen sein können
•
•
Netzwerke (2)
Positionen in Netzen
• absolute Koordinate und Zuordnung zur nächstgelegenen Kante ("Falllinie")
• Laufende Kilometrierung
• Straßen-Adresse – separater Punkt – Kilometrierung – Bereichsadresse
Bewerteter Graph
• Kanten-Attribute: Länge bzw. "Kosten", z.B. Fahrzeit
• Routen – Summe der Kanten-Werte
• Knoten – z.B. mit Übergangszeit (z.B. Ampelzeit, Linksabbiegen u.ä.)
Richtung
• Jede Kante ist orientiert
• Kosten je Richtung gleich oder unterschiedlich
• Sperre: "Kosten"-Attribut auf "unendlichen" Wert / Sperrkode gesetzt
• Berücksichtigung unterschiedlicher Abbiegerichtungen
9
Netzwerkanalyse
Kürzester Weg und Tourenplanung
• festgelegte Endpunkte – Start und Ziel – "Beste" Route (Kriterium: "Kosten")
• Zwischenstops – fix oder optimierte Reihenfolge
• Kriterien: "Beste Route" – Kapazität
• hierarchischer Baum-Algorithmus
Versorgungsgebiet
• entspricht "Allokation" bzw. den "Thiessen-Polygonen" in der Distanzanalyse
• "Sprengel" (Schulen, Wahllokale, Zählsprengel) ! Zonen, die am "halben Weg" zwischen zwei Zentren eine scharfe Grenze
ziehen
• wirtschaftliche Zentren ! Zonen, die sich potentiell überlappen und bis zu einem Distanz- oder Kapazitätsschwellwert von
einem Zentrum ausgehend reichen
Übung - Netzwerkanalyse mit ArcView (1/2)
Extension: Network Analyst
Lokalisieren von Adressen
Berechnung kürzester Routen
Oberflächenanalyse
•
•
"Oberfläche": jede Art von räumlich kontinuierlichen Phänomenen: topographische Oberflächen / thematische Oberflächen
Raster-Datenmodell vs. Vektor-Datenmodell (TIN)
Oberflächenbeschreibung
•
•
•
•
•
•
•
ausgehend von Geländeoberfläche
Hangneigung: Gradient einer Oberfläche in Richtung der stärksten Neigung
Exposition: Richtung der steilsten Neigung
Krümmung: Mulde ↔ Kuppe / konvex ↔ konkav
Beleuchtung - Einstrahlung
Oberflächen-Abfluss
...
Übung - Oberflächenanalyse ArcView
Extension: Spatial Analyst
10