Geographische Informationstechnologie
Transcription
Geographische Informationstechnologie
Geographische Informationstechnologie Oliver Bender & Doreen Jens, Universität Bamberg BLOCK 2: 22.-24.06.2001 3.1 Datenformate, Datenquellen und Datendokumentation Datentransfer (1/2) Rolle von Austauschformaten Typen externer Schnittstellen Geographische Formate (1) DXF (AutoCAD Drawing Interchange Format) Unterschied CAD und GIS CAD: • geometrische Elemente besitzen fest vorgegebene graphische Darstellungsweise (Strichdicke, Farbe etc.) • Strich eines CAD-Systems ist OBJEKT, besitzt ein oder mehrere graphische Attribute (Strichdicke etc.) • CAD- ELemente kennen keine Sachinformationen • keine Topologie (Nachbarschaftsbeziehungen von Objekten) GIS • Objekt vollständig durch Attribute beschrieben (z.B. Haus: Strasse, Hausnummer, Baualter, Stockwerke, ..). Geometrie ist ein Attribut. • Graphik ist keine Objekteigenschaft, wird flexibel aus seinen Attributen erzeugt • über räumliche Analysemöglichkeiten neue Informationen generierbar Übung - Datenimport Vermessung Import .dxf / .dwg-Daten • Extensions: CAD-Reader • Datei: c:\esri\av_gis30\avtutor\arcview\cad\parcels.dwg • CAD-Zeichnungsebenen verwalten über die Option „Drawings“ in den Themeneigenschaften Geographische Formate (2) SQD (sequential datafile) GDF (geographic data files) Graphische Formate (1/2) Postscript / EPS (.ps / .eps) Graphics Interchange Format GIF * (.gif) JPEG (.jpg / .jpeg) Tag Image File Format (TIFF) (.tif); World File in Zusammenhang mit Georeferenzierung von Rasterbildern GeoTIFF (.tif) Konverter für Grafikformate: Image Alchemy, Image Alchemy PS Schnittstellen EDBS als "Einheitliche DatenBankSchnittstelle" • zur Abgabe der ALK und ATKIS-Daten durch LVA der BRD • EDBS-Schnittstellenprogramme nach SICAD Spatial Desktop, nach IBM-GTIS (IFF-Format), nach MapInfo, ARCEDBS (bidirektionale Schnittstelle für ARC/INFO), für ArcView INTERLIS-Format ITF in der Schweiz ÖNORM A2260 in Österreich als "Datenschnittstelle für den digitalen Austausch von Geo-Daten" 1 Globale Geodatenquellen (1) World Data Base II der CIA World Databank I Digital Chart of the World (DCW), abgeleitetes Produkt: v.a. von Operational Navigation Chart (ONC) der DMA, M 1:1000000 GLIS (Global Land Information System) des US Geological Survey Globale Geodatenquellen (2) GTOPO30 TerrainBase Global Terrain Model vom National Geophysical Data Center / World Data Center for Marine Geology 1991-94 Digital Terrain Elevation Data (DTED®) Level 0 Europäische Datenquellen SABE (Seamless Administrative Boundaries of Europe) im Rahmen von MEGRIN (Multipurpose European Ground Related Information Network) Straßendaten, z.B. Teleatlas; AND Data (Claris) GRID-Arendal (Global Resource Information Database - Arendal Norway) Deutsche Datenquellen (1/2) ATKIS (Amtlich-Topographisch-Kartographisches Informationssystem) von der AdV Digitales Landschaftsmodell 1:25 000 (DLM 25) • räumliche Entitäten nach hierarchischem Objektartenkatalog in Anlehnung an Informationsgehalt der TK 25 Digitale Topographische Karte (früher: digitales kartographisches Modell [DKM]) aus DLM abgeleitet Deutsche Datenquellen (3) Digitale Gebäudedaten • Einzelgebäude als Grundrisse stereo-fotogrammetrisch erfasst zum DLM25 passfähig; Lagegenauigkeit von +/- 50 cm; zugeordnet ist Attribut " Relative Gebäudehöhe" Digitale Verwaltungsgrenzen • Kreise, Ämter und Gemeinden als Polygone; Landes- und Staatsgrenze als Linien; Sachdaten Digitales Geländehöhenmodell (DGM) • Gitter von 25 m, 50 m, 100 m oder 200 m; Böschungen Deutsche Datenquellen (4) ALB (Amtliches Liegenschaftsbuch) mit DFK (Digitaler Flurkarte) • ALB in spezieller Datenbank • DFK derzeit im Aufbau; Abgabeformate in Bayern: DXF, SQD, DFK (Bayern), EBDS (zukünftig) Dokumentation: Metadaten (1) Metadaten sind "Daten über Daten" • automatische Berücksichtung ! verbunden mit Geodatensatz • Nutzbarkeit für die Anwendung beschreiben / Beurteilung für einen bestimmten Einsatzzweck • längerfristige Wertsicherung • Katalogfähigkeit umgekehrt: Gefahren ohne Metadaten Dokumentation: Metadaten (2) • • • • • • US-NSDI (National Spatial Data Infrastructure): Unterstützung des Spatial Data Transfer Standard (SDTS) EGII (European Geographic Information Infrastructure), Kooperation mit OpenGIS- Konsortium nationale Projekte Internet als grundsätzliche Zugriffsmöglichkeit zu verteilt vorliegenden Geodaten: aktives Eintragen in Kataloge vs. "Abholprinzip" mit Indizierung in Form von Suchmaschinen "header" mit Metadaten, Bsp. HTML-Datei, Grafikformate (TIFF, JPEG) Textdateien (MS-Word) 2 Dokumentation: Metadaten (3) Kategorien von Metadaten • semantisch • syntaktisch • strukturell !Bezugsniveau • navigatorisch • "abgeleitet" • extern • genetisch Dokumentation: Metadaten (4) FGDC-Standard - Hauptkategorien an Metadaten • Identifikation • Datenqualität • Räumliche Datenorganisation • Georeferenzierung • Entitäten u. Attribute • Bezug • Metadatenreferenz • empfohlene Zitierform • Zeitliche Gültigkeit • Kontaktadressen 3.2 Attributdaten in Datenbanken Attributdatentypen Datentypen: alphabetisch, numerisch, alphanumerisch Feldtypen in Datenbanken: – Text/String/Character, – Ganzzahl/Integer, Dezimalzahl/Numeric, – Logical/Bool, – Datum/Date, Zeit/Time, Währung, – Memo (Referenzadresse für Texte, begrenzter Speicherplatz), – BLOB (Binary Large Object), – spezielle Typen z.B. OLE (Object Linking and Embedding) Skalenniveaus: Nominal (Kulturarten) ! Text; Ordinal (Schulnoten) ! Text, Zahl Intervall (Zeit, Temperatur) Verhältnis ! Numm., Gleitkomma Datenbanken Datenbasis DBMS: Programme (z.B. ORACLE, WATCOM, MS Access); Metadaten Datenbankschema: Relational, Hierarchisch, Netzwerk Datenbank: Erstellung, Abfrage, Aktualisierung Tabellen Tabellen • statische Basistabellen/base tables, • Datenbank-Abfragen/queries, • dynamische Benutzersichten/views, • Bearbeitungshistorie 3 Spalten/columns ! Attribute • Domäne/domain = Gültigkeits- und Wertebereich; • Anzahl Spalten ! Grad/degree Zeilen/Tupel/rows ! Objekte, Entitäten • Anzahl Zeilen! Mächtigkeit/cardinal • für jeden Objekttyp eine Tabelle Relation: Sammlung von Attributen eines Datensatzes, Assoziationen (Beziehungen) zwischen Objekten/Attributen; Typen: 1:1, 1:n, n:1, n:m Schlüssel • (Primär)-Schlüssel = Attribut(e), eindeutige Wertekombination ! Identifikation von Objekten • Sekundär-/ Fremdschlüssel ! Einsprungstellen für andere Tabellen, muß nicht eindeutig sein • Einfachschlüssel/ zusammengesetzte Schlüssel Relationales Datenbanksystem (CODD) 12 Regeln derzeit keine Software, die alle Anforderungen erfüllt, insbes. PC-DBMS erfüllen R12 nicht Relationale Algebra klassische Mengenoperatoren ∪ Vereinigung/Insert, ∩ Durchschnitt, ⁄ Differenz/Delete spezielle Relationenoperatoren π Projektion/Spaltenauswahl σ Selektion/Tupelauswahl !" Verbund/Join Datenbankdesign Analyse, Entwurf, Normalisierung (logische Korrektheit), physisches Design (entspr. Software), Test, Implementierung, Revision Ziele (1): Redundanzfreiheit, Wartungssicherheit, Speicherplatz Ziele (2): (kein/e) DELETE-, INSERT, UPDATE-Anomalien, Verlust von Informationen beim Verknüpfen von Tabellen (Join), Verlust von funktionalen Abhängigkeiten Normalisierung Vermeidung von Anomalien, Herstellen funktionaler Abhängigkeiten (zu jedem Wert von Attribut Z genau 1 Wert von Attribut Y) PERSON:= *Name, Vorwahl_1, Telnr_1, Vorwahl_2, TelNr_2 1. NF: Auflösung von Attributwiederholungen, Relation in sich keine weiteren Relationen PERSON:= *Persnr, Name TELEFON := *Persnr, Lfdnr, Vorwahl, Telnr STUDENT := *Stdnr, *Fachnr, Name, Vorname, Fachname, Fachadresse 2. NF: Auflösung kombinierter Primärschlüssel, wenn Attribute nur auf Primärschlüsselteile bezogen STUDENT := *Stdnr, Name, Vorname, Fachnr FACH := *Fachnr, Fachname, Fachadresse GEBAEUDE := *GebNr, GebTyp, Baujahr, StrasseNr, Strassenname, HausNr 3. NF: Beseitigung von transitiven Abhängigkeiten GEBAEUDE := *GebNr, GebTyp, Baujahr, StrasseNr, HausNr STRASSE := * StrasseNr, Strassenname Übung: Normalisierung (1/2/3) 4 ER-Modellierung (CHEN) Modellierungswerkzeug / Datenbankschema Software: PowerDesigner (SYBASE) verschiedene Darstellungsvarianten, z.B. CHEN 1976: " Entitäten, Entitätstypen jede Entität des Sets hat gleiches Gefüge von Attributen Domänen der Attribute gelten für ganzen Set Schlüssel # Properties = Attribute Relationsships/~typen: Beziehungstypen zwischen Entitäten ! 1 Datenbanktabelle <> Komplexität: Häufigkeit mit der Entitäten Relationshipset enthalten ! (min/max) (n,m) Jeder Beziehungstyp kann als eigenständige Tabelle abgebildet werden • Schlüsselattribute der beteiligten Entitätstabellen dann als Fremdschlüssel • Primärschlüssel von Beziehungstyptabellen entweder aus den Fremdschlüsseln oder als künstlicher Schlüssel Einsatzumgebung • • • • PC-Einplatzsysteme Rechner-Terminal-System (Administrator) Client-Server-System (Netzwerk) ODBC (Open DataBase Connectivity) GIS & Datenbank Intern: Rastermodell: Flat-File-System (z.B. IDRISI): Duale Systeme (z.B. ARC/INFO): Integrierte Systeme (z.B. SICAD, IBM/GS): Extern: • Verknüpfung mit selbständiger externer Datenbanksoftware • Einbeziehung externer Datenbestände • Auslagerung bestimmter Daten aus dem System Aktuelle Entwicklungen • Erweiterte integrierte RDBMS • Objektorientierte Systeme (z.B. Smallworld GIS) • neue Ansätze zur Speicherung der Geometrie • SDO (Spatial Data Option) von ORACLE SQL (Structured Query Language) • • • • • • • Datenbanksprache ursprünglich Abfragesprache, seit 1976/79 heute universelles Sprachsystem für alle sprachlichen Komponenten eines DBMS internationaler Standard: ANSI/ISO SQL in den einzelnen Datenbankprodukten unterschiedlich umgesetzt/erweitert RDBMS stellen meist Kommunikationsplattform für Kommandoeingabe Entwicklung einer Schnittstelle zu höherer Programmiersprache, versch. Lösungsansätze wie z.B. ESQL (Embedded SQL) • • • • abbildungsorientiert – mengenorientiert SELECT y FROM x WHERE f Auswahlvorschrift (f) auf Definitionsbereich (x) für Abbildung auf gesuchten Wertebereich (y) Ergebnis des SELECT-Kommandos ist eine Menge, wird in temporärer Tabelle abgelegt DDL - Data Definition z.B. Aufbau einer neuen Tabelle: 5 DML / DQL - Data Manipulation / Query z.B. Datenübernahme aus anderer Tabelle: z.B. Auswahl von Spalten: Management der Datenerfassung (allg.) weniger technisches, mehr organisatorisches Problem • hohe Eintrittsschwelle in GIS-Projekte • Wertverlust von Daten vs. Wartung und Pflege • Kostenschätzung / Kosten-Nutzen-Vergleich rechtliche Aspekte • TCO (Total Cost of Ownership) • TCU (Total Cost of Usage • Copyright • Nutzungs- und Lizenzvereinbarungen • OpenGIS • Bedarfsanalyse • Datenmodelle und Technologien: Raster vs. Vektor, Bild vs. Objekt, automatische vs. manuelle Erfassung • Eigenerfassung vs. Dienstleistung / Mehrpartnerprojekte • Auf- und Vorbereitung des Ausgangsmaterials • Sekundär- vs. Primärdatenerfassung • Nachbereitung primär erhobener Daten • Erfassungseinheit (=Primitiv) • Just-in-time oder vorab "alles"? • Referenzrahmen gescannter Datenbestand, Digitalisieren nur an einzelnen Stellen nach Bedarf • Quality Assurance • Quality Control: Schwellwert, Vergleich mit dem Ausgangsmaterial, Dokumentation! • Wartung der Daten Tabellen in ArcView GIS • • • • jedem Thema (außer bei Bilddatenquellen) eine Tabelle (Feature-Attribut-Table) zugeordnet, die im Dokument View über das Tabellen-Icon aufgerufen wird neue Tabellen generieren sowie externe Tabellen hinzuzufügen dBase-Format Nutzung anderer Datenbanken mit ODBC (OpenDataBase Connectivity) Übung: Tabellenanbindung an ArcView Übung: Abfragen in ArcView 6 4.1 Analyse und Visualisation (I) Datenanalyse & Visualisation aus vorliegenden Geodaten neue Information Information verdichtet bzw. reduziert Fragen an GIS • • • Analyseschritte und -methoden Analyseschritte als Transformationen Analyseabläufe Analysemethoden Selektion und Aggregation • • • • • • • Aussagen über Teilmengen der insgesamt beobachteten Grundgesamtheit Direkte Selektion Nachbarschafts-Selektion Distanz-Selektion Koinzidenz-Selektion attributgestützte Aggregation Räumliche Aggregation (Raumtypen, Regionen) Übung: Aggregation mit ArcView (1/2) Klassifikation Wertebereich • gleitende Skala mittels kontinuierlicher Legende • Festlegung von Klassenzahl und Klassengrenzen; Kriterien Ähnlichkeit und Differenzierung Qualitative Daten • "Unique Value" Klassifikationsmethoden graphische Methoden • steam-and-leaf Diagramm (im GIT-Zusammenhang zu vernachlässigen) numerisch-statistische Methoden • Sinnklassen • Zentralwerte • Äquidistante Klassifikation • andere Intervall-orientierte Klassifikationen • Quantil-Klassifikationen • Natural Breaks Klassifikation und Visualisierung Übung: ArcView Help – "Classification methods" Visualisierung von Klassifikationen • Grau-/Farbstufen • Regeln der Farbassoziation Übung - Klassifikation mit ArcView Lösung - Klassifikation mit ArcView 7 Distanzanalyse • • Distanz als Relation zwischen Objekten – oder thematische Oberfläche ausgehend von Bezugsobjekten Distanz als Indikator bzw. Maß für die Intensität räumlicher Beziehungen im weiteren Sinn Distanzmessung (1) • • sphärische und ebene Bezugssysteme "Luftlinie" vs. real wirksame Entfernung (vgl. Straßennetz) Distanzmessung (2) • • • • • Buffer = Distanzkorridore (um Linien) bzw. Distanzzonen (um Punkte und Polygone) Distanz als sich kontinuierlich veränderndes Merkmal, als sog. thematische Oberfläche ausgehend von Bezugsobjekten "Wasserscheiden" = Grenzen der Einzugsgebiete von Bezugsobjekten Isohypsen (Isoplethen) = Linien gleicher Entfernung vom jeweils nächstgelegenen Bezugsobjekt Kriterium der geringsten Entfernung zu einem von mehreren Bezugspunkten ! Definition der Thiessen-Polygone Übung - Distanzmessung / -oberfläche Entfernungsmessung in ArcView GIS: Abstandseinheiten, "Maßband" in der Werkzeugleiste Distanzoberfläche erstellen (Extension: Spatial Analyst) Übung - Thiessen-Polygone Übung - Buffer 4.2 Analyse und Visualisation (II) Räumliche Interpolation • • • "Oberflächen", nicht flächendeckend beobachtet Einzelwerte aus Stichproben-Messungen Interpolation vs. Extrapolation • • • • Annahme einer (thematischen oder topographischen) "Oberfläche" ! Werteausprägungen kontinuierlich variierend gesuchter Punktwert einem Stützpunktes umso ähnlicher, je näher Wahl der Interpolationstechnik ! "bestmögliche Schätzung" Ergebnisse in für Oberflächen adäquaten Datenmodell (Raster, TIN, ...) repräsentieren • Beurteilung des Skalenniveaus vorliegender Daten – metrische Daten ! Berechnung gewichteter Mittelwerte – nominale Daten ! Thiessen-Polygone Arten von Interpolationstechniken: global vs. lokal / exakt vs. approximativ • Interpolationstechniken Trendoberflächen IDW ("Inverse Distance Weighting") Spline Bruchkanten weitere Techniken, z.B. Kriging Isoplethen-Interpolation Übung - Interpolation mit ArcView 8 Verschneidung - Overlay • • • "Überlagerung mehrerer Layer" (BILL) zwecks Gewinnung neuer Erkenntnisse miteinander kombiniert ! multi-thematische Analyse Voraussetzung: einheitliches räumliches Bezugssystem Raster - Verschneidung • • Gewichtete Verschneidung: Anwendung zu Eignungsbewertung, Risikoabschätzungen Matrix Overlay: Matrix aller möglichen Wertekombinationen; Vektor - Verschneidung • • • Integration von meist nur jeweils zwei Themen bei mehreren Themen: Wiederholung der Verschneidung hohe Anzahl an Schnittpunktberechnungen, Neuaufbau der Polygontopologie, Attributzusammenführung aller Themen ! sehr komplex Probleme: unabhängig voneinander entstandene Datenbestände bei in der Natur identischen Abgrenzungen nicht idente Vertices bei der Verschneidung entstehen Pseudopolygone (sliver polygons) ohne sinnvolle thematische Aussage nachträglich eliminiert oder von vornherein vermieden durch Festlegung eines Schwellwertes • • • Übung - Verschneidung mit ArcView View \ Geoprocessing Wizard Netzwerke (1) Netzwerke von linearen Verbindungen (Strassen, Leitungen oder Wasserwege) hier ausschließlich vor dem Hintergrund des Vektor-Datenmodells, auch (seltener) rasterbasierte Ansätze Fragen • Verortung von Punkten bzw. Standorten in Netzen • Distanz entlang von Netzen • Effektive Distanz in Form alternativer Masse wie Zeit, Kosten etc. • Kapazität von Netzen und Teilen davon • Analyse und Optimierung von Standorten in Netzwerken Netzwerke • Graphen, bestehend aus – Kanten – Knoten • Route – Durchgehender Pfad (Weg) zwischen zwei Punkten im Netz • Kanten wie auch Knoten sind Objekte, die mit Attributen versehen sein können • • Netzwerke (2) Positionen in Netzen • absolute Koordinate und Zuordnung zur nächstgelegenen Kante ("Falllinie") • Laufende Kilometrierung • Straßen-Adresse – separater Punkt – Kilometrierung – Bereichsadresse Bewerteter Graph • Kanten-Attribute: Länge bzw. "Kosten", z.B. Fahrzeit • Routen – Summe der Kanten-Werte • Knoten – z.B. mit Übergangszeit (z.B. Ampelzeit, Linksabbiegen u.ä.) Richtung • Jede Kante ist orientiert • Kosten je Richtung gleich oder unterschiedlich • Sperre: "Kosten"-Attribut auf "unendlichen" Wert / Sperrkode gesetzt • Berücksichtigung unterschiedlicher Abbiegerichtungen 9 Netzwerkanalyse Kürzester Weg und Tourenplanung • festgelegte Endpunkte – Start und Ziel – "Beste" Route (Kriterium: "Kosten") • Zwischenstops – fix oder optimierte Reihenfolge • Kriterien: "Beste Route" – Kapazität • hierarchischer Baum-Algorithmus Versorgungsgebiet • entspricht "Allokation" bzw. den "Thiessen-Polygonen" in der Distanzanalyse • "Sprengel" (Schulen, Wahllokale, Zählsprengel) ! Zonen, die am "halben Weg" zwischen zwei Zentren eine scharfe Grenze ziehen • wirtschaftliche Zentren ! Zonen, die sich potentiell überlappen und bis zu einem Distanz- oder Kapazitätsschwellwert von einem Zentrum ausgehend reichen Übung - Netzwerkanalyse mit ArcView (1/2) Extension: Network Analyst Lokalisieren von Adressen Berechnung kürzester Routen Oberflächenanalyse • • "Oberfläche": jede Art von räumlich kontinuierlichen Phänomenen: topographische Oberflächen / thematische Oberflächen Raster-Datenmodell vs. Vektor-Datenmodell (TIN) Oberflächenbeschreibung • • • • • • • ausgehend von Geländeoberfläche Hangneigung: Gradient einer Oberfläche in Richtung der stärksten Neigung Exposition: Richtung der steilsten Neigung Krümmung: Mulde ↔ Kuppe / konvex ↔ konkav Beleuchtung - Einstrahlung Oberflächen-Abfluss ... Übung - Oberflächenanalyse ArcView Extension: Spatial Analyst 10