Les Systèmes d`Information Géographique (SIG)

Transcription

Les Systèmes d`Information Géographique (SIG)
Les Systèmes d'Information Géographique (SIG)
I. Définitions
Un système d'information géographique possède l'ensemble des caractéristiques d'un système
d'informations appliqué à la géographie.
Françoise de Blomac, géographe, cartographe mais aussi spécialiste des nouvelles technologies le
définit de la manière suivante : « un SIG est un ensemble organisé de matériels informatiques, de
logiciels, de données géographiques et de personnel capable de saisir, stocker, mettre à jour,
manipuler, analyser et présenter toutes formes d'informations géographiquement référencées. » [1]
II. Historique
En 1884 dans le quartier de Soho à Londres, le docteur John Snow découvre les causes d'une
épidémie de choléra en superposant sur un même carte les foyers de la maladie et le lieu de puisage
de l'eau.
Cet exemple est souvent cité comme première application de l'analyse spatiale.
Néanmoins l'informatisation des données géographiques afin de faciliter cette analyse commence
réellement dans les années 60 en Afrique de l'Est où la multiplicité des cartes et la difficulté à
hiérarchiser les informations rendent la localisation des meilleurs sites pour de nouvelles
implantations forestières très difficile.
En 1991, D.J. Maguire [2] définit trois grandes périodes dans l'histoire des SIG :
• De la fin des années 50 au milieu des années 70 : création des premières cartes
informatiques
• Du milieu des années 70 au début des années 80 : diffusion des SIG dans les organismes
d'état
• A partie du début des années 80 : explosion du marché des logiciels, augmentation des
applications et des fonctionnalités des SIG, mise en réseau
On peut aujourd'hui ajouter deux grands points : la banalisation de l'informatisation des données
géographiques avec les GPS, les sites de calcul d'itinéraires et des fonctionnalités comme
GoogleMap et l'apparition des objets 3D.
III . Les composantes d'un SIG [3]
Un SIG possède cinq composantes principales : le matériel, les données, les utilisateurs, les
logiciels et les méthodes.
1. Le matériel
L'utilisation d'un SIG requiert l'utilisation d'un ou de plusieurs ordinateurs qu'ils soient autonomes
ou en réseaux. De plus, on trouve aujourd'hui de plus en plus de systèmes client-serveur qui
proposent des solutions de diffusion de cartes sur le web à partir duquel le client peut directement
faire des requêtes.
2. Les données
Les données sont indispensables au SIG. Elles peuvent être de trois types : géographiques,
attributaires ou métadonnées.
Les données géographiques sont des données localisées auxquelles on associe une forme et des
paramètres d'affichage (couleur, épaisseur du trait...). Elles peuvent être de type raster ou vecteur.
Les données attributaires caractérisent les données géographiques (nom d'une route, nombre
d'habitants dans un immeuble localisé, …). Les métadonnées décrivent directement la ressource
c'est-à-dire ici les données, ce sont « les données sur les données » comme par exemple la date
d'acquisition, le nom du propriétaire,etc.
3. Les utilisateurs
Les SIG s'adressent à des utilisateurs très différents (urbanistes, géographes, élus, militaires,
commerciaux, informaticiens...) et aujourd'hui, en particulier avec l'apparition des SIG sur Internet
n'importe qui peut être amené à utiliser un SIG.
4. Les logiciels
Les logiciels font le lien entre les données, le matériel et les utilisateurs. A partir d'une interface
graphique, l'utilisateur va interroger une base de données afin de visualiser et d'analyser ces
différentes informations.
5. Les méthodes ou savoir-faire
Différentes compétences techniques sont indispensables à la mise en œuvre et à l'exploitation des
SIG comme par exemple des connaissances en géodésie, en analyse des données, en sémiologie
graphique ou encore en traitement informatique.
IV. Les différentes fonctionnalités d'un SIG : les 5 « A » [4]
1. Abstraction
L'abstraction consiste à modéliser le problème afin de le rendre compréhensible par le plus grand
nombre possible, de faciliter sa conception ultérieure et de s'assurer de respecter certaines normes
de conception. Cette partie concerne plus particulièrement le système de gestion de base de données
(SGBD).
Différents modèles peuvent être adoptés comme les diagrammes Entités-Associations ou les
diagrammes physiques de base de données. On peut également utiliser les diagrammes SADT,
Merise ou UML.
2. Acquisition
L'acquisition concerne la récupération et la création des données. Il existe différentes sources
d'acquisition : les organismes nationaux et internationaux, les producteurs locaux, les collectivités
territoriales, les géomètres, la numérisation des cadastres ou encore la localisation du patrimoine.
Il existe différentes techniques d'acquisition (numérisation, télédétection, acquisition manuelle...)
permettant d'intégrer les données selon quatre modes différents : le mode raster, le mode vecteur, le
mode TIN et le mode MNT.
a) Le mode Raster :
Le mode raster ou mode matriciel décrit l'image sous la forme d'une matrice de pixels. Chaque
matrice représente une couche d'information.
Les données rasters peuvent être stockées de différentes manières que nous allons exposer dans
l'exemple suivant.
Voici une donnée raster en noir et blanc (les pixels valent 0 ou 1) :
La représentation matricielle de cette image se fait de la manière suivante.
0,0,0,0,1,1,1,1
0,0,0,0,1,1,0,0
0,0,0,0,0,0,1,0
0,0,0,0,0,0,0,0
1,1,1,1,1,1,1,1
1,1,0,0,1,1,1,1
0,1,0,0,1,1,1,1
0,0,1,1,1,1,1,1
Néanmoins afin d'optimiser la place du stockage de l'image, il est possible d'utiliser une
représentation « run-length » où pour chaque ligne on note la valeur de la première cellule
(1,valeur) puis celles des cellules où il y a changement accompagné de leur index (index , valeur).
1,0,5,1
1,0,5,1,7,0
1,0,7,1,8,0
1,0
1,1
1,1,3,0,5,1
1,0,2,1,3,0,5,1
1,0,3,1
Si le maillage est carré et de longueur de côté une puissance de 2, il est également possible de le
représenter en « quadtree ». (Si l'image n'est pas de la bonne forme il est possible d'ajouter des
pixels à 0 en longuer et/ou en largeur).
1er niveau :
0
1
2ème niveau :
1
0
0
1
1
3ème niveau :
0
1
1
1
0
0
0
1
0
0
0
0
1
1
0
1
1
0
0
1
1
0
0
0
1
Représentation « quadtree » :
Le mode raster est intéressant pour les réalités continues (plage de couleur, paysage...) mais de par
la taille des cellules, le rendu est souvent imprécis et de qualité esthétique médiocre, en particulier
après un zoom. La combinaison des différentes couches d'information se limite à une simple
superposition des matrices et les attributs sont faciles d'accès malgré une forte demande en mémoire
pour le stockage.
b) Le mode vecteur
Ce sont des points, des lignes, des polylignes ou des polygones qui sont déterminés par leurs
coordonnées.
Les vecteurs étant des objets mathématiques, le stockage des données est compact mais complexe
ce qui implique une forte puissance de calcul du matériel. Les images vecteurs sont précises
quelque soit les échelles. Cependant, elles ne sont pas adaptés à la représentation de réalités
continues telles que des dégradés de couleurs ou des photographies.
Ce mode de représentation induit une approche par objet qui facilite l'intégration, l'extraction, la
mise à jour et la généralisation des informations dans les bases de données ainsi que certaines
opérations mathématiques comme la translation ou la projection. Néanmoins, le croisement des
différentes couches est compliqué car il est souvent nécessaire de créer de nouvelles unités
spatiales.
c) Le mode TIN (Triangulated Irregular Network)
L'image est découpé en un maillage triangulaire dont les cellules sont de forme et de taille
différentes.
Ce mode de représentation permet de réduire le nombre de données en adaptant la taille des
triangles au discontinuités de l'image pour la représentation de réalités continues. La localisation
idéale des nœuds du réseau est malgré tout fastidieuse.
d) Le mode MNT (Modèle Numérique de Terrain)
Les points numérisés indiquent l'altitude du terrain.
3. Analyse
L'analyse spatiale se distingue selon qu'elle se base sur des données sémantiques ou des données
géométriques.
L'analyse spatiale sémantique repose sur l'étude, par des requêtes ou des calculs, de données
alphanumériques afin de décrire qualitativement ou quantitativement certaines caractéristiques
d'une région. Cette description se fait souvent de manière cartographique et elle se doit de respecter
les règles de sémiologies graphiques.
Les données qualitatives non ordonnées sont représentées par des couleurs différentes, des formes,
des différences de texture ou d'orientation. Les données qualitatives ordonnées ou quantitatives
relatives sont représentées par un dégradé d'une seule et même couleurs ou l'affichage de valeurs.
Les données quantitatives absolues sont représentés par une variation de taille.
L'analyse spatiale géométrique est l'étude des formes, des positions et des relations entre les objets
comme le calcul de distances, d'intersections ou d'exclusions par exemple. Il est alors possible de
travailler sur la topologie.
Ces analyses sont possibles grâce aux différentes fonctionnalités que proposent les logiciels de SIG.
4. Archivage
L'archivage permet de stocker les informations de manière réfléchie afin d'y accéder le plus
rapidement possible. Pour les données alphanumériques, le stockage peut être réalisé grâce aux
différents systèmes de gestion de base de données selon le modèle abstrait prédéfini. Néanmoins,
une grande partie des informations sémantiques est encore contenue dans des fichiers plats c'est-àdire des fichiers textes structurés.
Pour les images, il existe une multitude de formats de stockage qui comprennent ou non les données
sémantiques.
L'ensemble des formats d'archivage de données spatiales sera étudié dans la prochaine partie.
5. Affichage
L'affichage peut se faire sur différents supports. La plupart du temps, le SIG installé sur une
machine fixe est capable de lire un ou plusieurs formats d'images et de manipuler des bases de
données afin d'afficher sur l'écran les informations voulues.
Aujourd'hui, il devient possible de ne plus installer le logiciel directement sur sa machine et de
réaliser ses requêtes et l'affichage des résultats directement par Internet.
Que ce soit directement sur l'ordinateur ou par internet, l'affichage ne peut se faire que sur une
machine capable d'intégrer ces logiciels et ces outils assez coûteux en mémoire. Il est possible
d'imprimer sur papier ou en PDF l'affichage cartographique mais le principe des diverses couches
est perdu et le rendu est souvent très médiocre. Le GeoPDF s'inscrit dans ce contexte comme un
nouveau format d'affichage et de diffusion des données géographiques peu coûteux en mémoire,
facile à charger et à utiliser et, respectant les différentes couches d'informations. L'entreprise
TerraGo a d'ailleurs déjà mis au point des outils de génération de documents GeoPDF dans un
logiciel SIG.
Bibliographie
1: Blomac (de), F., ARC/INFO- Concept et applications en géomatique, 1994
2: Maguire, D., An overview and definition of GIS, 1991
3: , , 2010, http://www.esrifrance.fr/sig2.asp
4: Ould Ahmed Bamba, D., Nouedou, A., Djibo Amadou, G., NGangue Tchangoue, F. & Diallo, S.,
Etat de l'art sur la conception et la mise en oeuvre d'un SIG, 2005

Documents pareils