Syllabus - CMI SID

Commentaires

Transcription

Syllabus - CMI SID
Annexe au dossier du cursus CMI SID
Licence - Master en Ingénierie
Syllabus L3 et Master SID
Statistique et Informatique Décisionnelle
Université Paul Sabatier Toulouse 3
14 février 2013
1
CMI SID
I-
Université Paul Sabatier
Licence 3 Semestre 5
I-1. Concepts Fondamentaux des Bases de
I-2. Langage de Requêtes . . . . . . . . .
I-3. Programmation Avancée et Unix . .
I-4. Analyse 1 . . . . . . . . . . . . . . .
I-5. Probabilités 1 . . . . . . . . . . . . .
I-6. Algèbre linéaire . . . . . . . . . . . .
I-7. Statistique Exploratoire 1 . . . . . .
I-8. Processus et Modélisation . . . . . .
I-9. Techniques de communication . . . .
I-10. Langage R. I . . . . . . . . . . . . . .
Données
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
4
4
4
4
5
5
5
6
6
6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
7
7
7
8
8
8
8
9
9
9
9
9
9
10
III - Master 1 Semestre 7
III-1. Protection de données . . . . . . . . . .
III-2. Génie logiciel . . . . . . . . . . . . . .
III-3. Data mining . . . . . . . . . . . . . . .
III-4. Data warehouse (entrepôt de données)
III-5. Statistique Exploratoire 2 . . . . . . .
III-6. Algèbre 2 . . . . . . . . . . . . . . . . .
III-7. Analyse 2 . . . . . . . . . . . . . . . .
III-8. Optimisation Mathématique . . . . . .
III-9. Sondages . . . . . . . . . . . . . . . . .
III-10.Contrôle qualité . . . . . . . . . . . . .
III-11.Système d’information géographique .
III-12.Techniques de communication . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
10
10
11
11
11
11
11
12
12
12
13
13
IV - Master 1 Semestre 8
IV-1. Systèmes répartis et bases de données réparties . . . . . .
IV-2. Extension Objets du Relationnel . . . . . . . . . . . . . . .
IV-3. Graphes et optimisation . . . . . . . . . . . . . . . . . . .
IV-4. Normes W3C : Standards associés et XML . . . . . . . . .
IV-5. Projets tutorés : Statistique et applications Décisionnelles
IV-6. Modélisation Bayésienne . . . . . . . . . . . . . . . . . . .
IV-7. Modèles linéaires généralisés . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
13
14
14
14
15
15
II - Licence 3 Semestre 6
II-1. Optimisation de requêtes . . . .
II-2. Connexion et intégration d’outils
II-3. Concepts RI . . . . . . . . . . . .
II-4. Préparation aux bureaux d’études
II-5. Projet tutoré . . . . . . . . . . . .
II-6. Modèles linéaires . . . . . . . . .
II-7. Statistique Inférentielle . . . . . .
II-8. Etudes de cas statistiques . . . .
II-9. Plans d’expériences . . . . . . . .
II-10. Projet tutoré . . . . . . . . . . . .
II-11. Techniques de communication . .
II-12. Culture d’entreprise . . . . . . . .
II-13. Outils statistiques . . . . . . . . .
II-14. Outils statistiques . . . . . . . . .
II-15. Marketing . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2/20
CMI SID
Université Paul Sabatier
IV-8. Séries Chronologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
IV-9. Techniques de communication et conférences . . . . . . . . . . . . . . . . . . . . . . . . .
V - Master 2 Semestre 9
V-1. Environnement décisionnel : OLAP . . . . . . . . . .
V-2. Bases de données à grande échelle . . . . . . . . . . .
V-3. Indexation par le contenu Documents Audio et Vidéo
V-4. Évaluation des processus et certification . . . . . . .
V-5. Normes W3C : XML et les Bases de Données . . . .
V-6. Apprentissage Statistique . . . . . . . . . . . . . . . .
V-7. Statistiques bio-médicales . . . . . . . . . . . . . . .
V-8. Modèle linéaire gaussien général . . . . . . . . . . . .
V-9. Maı̂trise statistique des procédés . . . . . . . . . . . .
V-10. Fiabilité des systèmes . . . . . . . . . . . . . . . . . .
V-11. Fiabilité des matériaux . . . . . . . . . . . . . . . . .
V-12. Modèles statistiques pour l’information textuelle . . .
V-13. Cycle de décision en entreprise . . . . . . . . . . . . .
V-14. Techniques de communication . . . . . . . . . . . . .
V-15. Conférences thématiques . . . . . . . . . . . . . . . .
VI - Master 2 Semestre 10
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
15
15
16
16
16
16
17
17
17
18
18
18
18
18
19
19
20
20
20
3/20
CMI SID
II-1.
Université Paul Sabatier
Licence 3 Semestre 5
Concepts Fondamentaux des Bases de Données
Objectifs visés : Introduire les concepts fondamentaux des Bases de Données Relationnelles (BDR) et
présenter les principes de la conception d’une BDR.
Programme :
1. Introduction aux BD et fonctions d ?un système de gestion de bases de données
2. Modèles de données : modèle entité/association et modèle relationnel.
3. Algèbre relationnelle.
4. Dépendances fonctionnelles et normalisation d ?une relation
Fonctionnement : 18h CM, 16h TD. Un examen terminal
I-2.
Langage de Requêtes
Objectifs visés :
1. Maı̂triser les langages utilisés dans les bases de données, tant du point de vue de la définition, de
la manipulation, de l’interrogation ou du contrôle des données.
2. Méthodes, Techniques et outils des systèmes relationnels. Environnement du Système de Gestion
de Bases de Données (SGBD) Oracle.
Programme :
• Langage de Définition des Données
• Langage de Manipulation des Données
• Langage d’interrogation des Données
• Programmation PL/SQL
Fonctionnement : Cours TD TP. Contrôle continu (rendus de TP) + examen terminal
I-3.
Programmation Avancée et Unix
L’objectif de cette UE est de donner aux étudiants les connaissances théoriques et pratiques de base
concernant d’une part le système Unix, d’autre part la programmation à base d’objet et le langage Java.
L’enseignement d’Unix donne les bases pour gérer des documents (création, déplacement, recherche, accès
à distance et protection de ses fichiers) ainsi que les notions de Shell, de commande (redirection d’entrée et
de sorties, pipes), de gestion de jobs et de création de scripts. La partie programmation avancée donne les
bases de la programmation objet avec pour support le langage JAVA. Il s’articule autour de 5 chapitres :
• Chapitre 1 : Plateforme et langage Java. Installation des kits Java, compilation et exécution d’un
programme simple. Description du langage : types de données, actions élémentaires, structures de
boucles, structures conditionnelles, notion de fonctions.
• Chapitre 2 : Notion d’objet (attribut, méthode). Comment choisir et construire des objets. Utilisation d’UML pour leur représentation. Les objets dans le langage JAVA. Interaction entre objets.
• Chapitre 3 : Organisation de classes. Attributs et méthodes de classes. La spécification et la
généralisation de classes. L’héritage en langage objet et en JAVA.
• Chapitre 4 : L’encapsulation. Classification des classes java, modificateurs de portée. Concepts de
surcharge, de redéfinition et de polymorphisme.
• Chapitre 5 : Abstraction. Classes et méthodes abstraites. Interfaces et leurs utilisation.
Fonctionnement : Cours TD TP. Un contrôle terminal
I-4.
Analyse 1
Ce cours donne les bases d’analyse au calcul des probabilités. Il s’articule autour de trois chapitres :
• Chapitre 1 : suite et séries. Exemples classiques : séries géométriques, exponentielle et de Riemann.
Critères de convergence pour les séries à termes positifs.
4/20
CMI SID
Université Paul Sabatier
• Chapitre 2 : Intégrales. Intégration sur un intervalle borné d’une fonction continue par morceaux.
Calcul de primitives. Extensions aux cas d’intervalles non compacts et aux fonctions non bornées.
• Chapitre 3 : Calcul des développements limités et applications.
Fonctionnement : Cours TD. Contrôle continu trois interrogations écrites. Un contrôle terminal.
I-5.
Probabilités 1
Ce cours a pour objectifs l’acquisition des notions fondamentales de probabilités en vue des applications statistiques.
• Rappels de théorie des ensembles
• Probabilités finies :
· dénombrement et combinatoire.
· probabilités sur un ensemble fini.
· Lois de Bernoulli, binomiale, hypergéométrique.
· Probabilités conditionnelles
• Probabilités discrètes
· familles sommables
· mesures de probabilités
· variable aléatoire discrète, loi d’une variable aléatoire
· espérance, variance, moments
· Loi de Poisson
· Inégalité de Markov, de Bienaymé-Tchebychef.
• Espaces de probabilités généraux
· variable aléatoire continue
· densité, fonction de répartition
· indépendance de variables aléatoires
· espérance, moment
· lois uniforme, exponentielle, normale
· suite de variables aléatoires, convergence en probabilité
• Intervalles de confiance
· Loi des grands nombres
· Théorème de la limite centrale.
· calculs simples d’intervalle de confiance
Fonctionnement : contrôles des connaissance par un examen partiel et un examen terminal.
I-6.
Algèbre linéaire
Ce cours traite les quatre sujets suivants :
• Espaces vectoriels sur R
• Applications linéaires
• Lien avec les matrices
• Valeurs et vecteurs propres
Fonctionnement : Cours TD. Un contrôle terminal.
I-7.
Statistique Exploratoire 1
L’objectif de ce cours est de donner une introduction aux statistiques en prenant un point de vue
descriptif. En particulier, cela signifie qu’il n’est pas fait usage de la théorie des probabilités. Un des
objectifs du cours est d’introduire l’analyse en composantes principales pour les métriques usuelles.
Programme du cours :
• Moyenne pondérée, variance et leurs décompositions par groupes,
• Distribution d’une variable (histogramme, quantiles, boı̂tes à moustaches, ...),
• Observation de deux variables couplées (régression, indépendance, ...),
• Observation de plusieurs variables couplées (corrélation multiple, inertie, ...)
5/20
CMI SID
Université Paul Sabatier
• Précisions sur le calcul matriciel (diagonalisation, ...),
• Analyse en Composantes Principales.
Fonctionnement : Cet enseignement est organisé en cours de 2 heures avec la classe au complet et en
séances de TD de 2 heures par groupe. La validation se fait par un examen final unique.
I-8.
Processus et Modélisation
Cet enseignement comporte deux aspects distincts : les processus et les outils de modélisation.
Processus - On apprend ici à maı̂triser les méthodes, les outils et les techniques nécessaires à la production
de logiciel de qualité industrielle selon le cycle de vie du logiciel.
• Historique du génie logiciel, Notions et définitions internationales des concepts de bases,
• Présentation des processus de développement utilisés dans les différents domaines d’application,
• Système Qualité : Normalisation et certification de logiciel, Techniques d’Assurance et contrôle
Qualité du logiciel.
Tous les points évoqués sont illustrés par des exemples d’applications.
Outils de modélisation - On apprend ici :
• les méthodes de Modélisation, fondements et objectifs.
• les concepts UML et les règles applicables
• les méthode et Structuration d’un modèle UML
• les principaux diagrammes : diagramme de cas d’utilsiation, diagrammes de séquence, diagrammes
d’activité, disagrammes de classe
• la navigation dans un modèle
Fonctionnement : 20h CM, 14h TP. Contrôle continu (oral) et un examen terminal. écrit
I-9.
Techniques de communication
Ce cours est vise à apprendre aux étudiants les techniques de communication à l’oral dans le monde
du travail. Nous abordons les points suivants :
• Apprendre à se définir et à mettre en évidence ses atouts en vue de la rédaction d’un CV et d’une
lettre de motivation.
• Qu’est-ce que le monde du travail ? Savoir, savoir-faire, savoir-être. Valeurs, compétences, qualités.
Organigramme.
• Le Curriculum Vitae : ce qu’il faut faire / les erreurs à éviter ;
• La lettre de motivation.
Chaque point est illustré par des travaux dirigés où les étudiants prennent tour à tour un rôle actif et un
rôle critique. Fonctionnement : cours, travaux pratiques notés, examen final.
I-10.
Langage R. I
Enseignement d’un langage de programmation destiné à faciliter la récupération des informations
contenues sur les sites web. Il s’articule autour de 6 chapitres :
• Chapitre 1 : Données scalaires. Définitions, Expressions, Opérateurs, Fonctions.
• Chapitre 2 : Listes et tableaux. Définitions, Représentation, variables, Opérateurs et Fonctions.
• Chapitre 3 : Structures de contrôle : séquences, structures conditionnelles, répétitions.
• Chapitre 4 : Hachages : définition, expression, fonctions associées.
• Chapitre 5 : Expressions régulières : définitions des expressions simples et complexes, ancres, utilisation.
• Chapitre 6 : Sous-programmes : définitions, notions de visibilité de variable, utilisation.
Fonctionnement : Cours TD. Contrôle continu en TP. Un contrôle terminal.”
6/20
CMI SID
II II-1.
Université Paul Sabatier
Licence 3 Semestre 6
Optimisation de requêtes
Objectif(s) et Compétences visés : Présenter les méthodes et les techniques de base d ?optimisation de
requêtes relationnelles en un environnement centralisé. Comprendre les problèmes posés par l’administration d’un SGBD centralisé (i.e. mono-processeur)dans une perspective d’aide à la décision.
Pré-requis : Concepts fondamentaux des BD et des BD relationnelles
Programme :
• Problématique de l’optimisation de requêtes et espace de recherche.
• Architecture logicielle d’un optimiseur de requêtes relationnelles.
• Optimisation logique : règles de transformation des arbres algébriques.
• Optimisation physique : stratégies de recherche énumératives et aléatoires.
• Introduction à l’administration des SGBD
Fonctionnement : Cours (18 H), TD (14 H) et TP (8 H) . 1 contrôle terminal
II-2.
Connexion et intégration d’outils
Objectifs visés et Programmes : L’objectif de ce bureau d’études est d’asseoir les différents enseignements
vus au semestre 5, de montrer également l’implication et l’utilisation des concepts fondamentaux des BD
relationnelles dans les outils commerciaux présents dans les organisations (entreprises, administrations,
etc.). Les pré-requis sont donc : modèle Entité/association , langage SQL et PL /SQL. Le projet contient
les aspects suivants :
• Permettre aux étudiants de modéliser un système d’informations avec les concepts des modèles
Entités/ Association, de réaliser toute l’application à partir d’utilitaires proposés dans l’Atelier
Designer, d’instrumentaliser les différentes étapes de processus de développement soutenus par des
utilitaires proposés par l’Atelier.
• Intégration des Bases de Données, conception et rétro-conception, méthodes ascendante/descendante
d’intégration des BD, mise en œuvre d’intégration de BD relationnelles avec Oracle Application Server 9i. Accès à la base de données via le web.
• Mise en œuvre de l’ atelier Designer 2000.
A la fin de ce bureau d’études, un rapport projet est remis aux enseignants.
Fonctionnement : 16h CM, 10h TD, 14h TP. Projet noté.
II-3.
Concepts RI
Ce cours présente les concepts et les modèles de base pour la recherche et la sélection d’information
dans des corpus de textes.
• Chapitre 1 : Indexation de documents : notions de base et techniques
• Chapitre 2 : Modèles mathématiques de recherche d’information : booléen, vectoriel, booléen étendu,
probabiliste
• Chapitre 3 : Démarche et mesures d’évaluation de systèmes de recherche d’information
Fonctionnement : 12 H Cours, 8H TD, 8H TP. Un contrôle terminal.
II-4.
Préparation aux bureaux d’études
L’objectif de cette préparation aux bureaux d’études est de présenter la démarche de conception et
les étapes d’analyse pour la conduite du projet tutoré.
Fonctionnement : 6 H Cours, 6H TD
Contrôle de connaissances : Pas de contrôle
7/20
CMI SID
II-5.
Université Paul Sabatier
Projet tutoré
L’objectif de ce projet est d’évaluer une compilation d’enseignements dont principalement : concepts
RI, concepts BD, langages de requête, langage de RI, génie logiciel. Le projet porte sur la conception, la
mise en œuvre et l’évaluation d’un système de recherche d’information. Les principales étapes du projet
sont les suivantes :
1. Collecte de contenus textuels à partir d’une source (ex wikipédia)
2. Indexation du corpus de textes pour l’extraction de contenus (texte) et métacontenus
3. Mise en œuvre d’un module d’interrogation de l’information
4. Evaluation expérimentale de l’efficacité du système de recherche d’information
Fonctionnement : environ 30H /etudiant. Contrôle continu
II-6.
Modèles linéaires
Cet enseignement a pour objectif dans un premier temps de poser les bases du modèle linéaire gaussien,
et dans un deuxième temps de préciser les cas particuliers : régression linéaire et analyse de variance. La
pratique de ces deux types de modèles sera vue en TD et en TP sous SAS.
Fonctionnement : 7 séances de cours + 5 séances de TD + 3 séances de TP par étudiant.
II-7.
Statistique Inférentielle
L’objectif de ce cours est de donner une introduction aux statistiques en prenant un point de vue
inférentiel. C’est-à-dire que la modélisation statistique fait intervenir la notion de variable aléatoire afin
de décrire un phénomène général à partir d’observations de celui-ci. Le cours est orienté de telle façon à
introduire les outils et notions classiques comme l’estimation, les intervalles de confiance, les tests,... et
d’en donner des exemples concrets. Le langage utilisé pour les séances de travaux pratiques est le langage
R.
Programme du cours :
• Quelques rappels de théorie des probabilités (Loi des Grands Nombres, Théorème Central Limite,
...),
• Modélisation statistique et introduction à l’estimation,
• Théorèmes et Inégalités classiques (Bienaymée-Tchebitcheff, Slutsky, ...),
• Estimation statistique (biais, consistance, ...),
• Construction d’estimateurs (méthode des moments et du maximum de vraisemblance),
• Intervalles de confiance sur la moyenne et la variance,
• Tests statistiques et tests gaussiens classiques,
• Comparaison de deux échantillons gaussiens ou non-gaussiens.
Fonctionnement : Cet enseignement se décompose en cours de 2 heures avec l’effectif au complet, en TD
de 2 heures par groupe et en TP de 2 heures par groupe. La validation se fait par un examen final et,
potentiellement, au travers d’une note de contrôle continu pour les séances de TP.
II-8.
Etudes de cas statistiques
Ce cours présente quelques problèmes (et des suggestions de résolutions) rencontrés lors du traitement
de données réelles :
• Données manquantes ou incomplètes et imputation.
• Statistiques descriptive et transformations de variables.
• Mélanges de populations, ACP et recherche d’individus atypiques.
• Introductions à la modélisation, à la prédiction, à l’analyse de sensibilité et aux techniques de
rééchantillonage (bootstrap, validation croisée).
Ce cours s’appui sur un jeu de données réelles issue de la génétique humaine (étude de la variabilité du
taux de cholestérol dû à la génétique.).
Fonctionnement : Cours magistral et TP R. Evaluation basée sur un rapport de TP.
8/20
CMI SID
II-9.
Université Paul Sabatier
Plans d’expériences
Ce cours présente les bases et les principes des plans d’expériences :
• principe de qualité et du Six Sigma ;
• intérêt de l’expérimentation planifiée par rapport aux essais successifs facteur par facteur ;
• principe d’orthogonalité, calcul des effets et interactions ;
• réalisation des graphes d’effets ;
Ces principes sont mis en application pour la réalisation complète d’une expérience pour trouver les
réglages d’une catapulte afin d’atteindre une cible. On présente un exemple de traitement logiciel avec
JMP4.
Fonctionnement : Cours magistral, TP notés. Contrôle final.
II-10.
Projet tutoré
Cet enseignement détaille différentes méthodes pour analyser la qualité des données, ainsi qu’une
initiation à l’analyse de données sous R. Il s’articule autour de trois chapitres :
• Chapitre 1 : Introduction à R pour l’analyse descriptive de données.
• Chapitre 2 : Réalisation de macros R permettant d’étudier la qualité des données ( statistique
descriptives, adequation à une loi, detection des points aberrants).
• Chapitre 3 : Etude de différents jeux de données issus du laboratoire Matériaux et Procédés Assystem.
Fonctionnement : Cours TD et TP. Un contrôle terminal.
II-11.
Techniques de communication
voir le projet, section IV-4.1.
II-12.
Culture d’entreprise
Ce cours présente la définition et les différentes composantes de la culture d’entreprise : un ensemble
de valeurs partagées par les membres d’une entreprise, se manifestant par des symboles, des rites, des
mythes, des tabous, des habitudes de travail.. Il aborde ensuite l’évolution de la culture d’entreprise en
tant que variable d’action pour le management. Puis sont présentés les fonctions, les enjeux et les limites
de la culture d’entreprise.
II-13.
Outils statistiques
Ce cours, organisé en séances de travaux pratiques, a pour but d’apprendre à manipuler le logiciel
SAS. Il s’articule autour de 4 séances pratiques :
TP1 les principales procédures de SAS, importation/exportation de BDD, graphiques en haute
résolution, tests statistiques et quelques éléments de langage macro.
TP2 régression linéaire simple et multiple.
TP3 analyse en composante principale.
TP4 analyse de la variance.
Fonctionnement : Modalité d’examen : contrôle sur papier ou un projet.
II-14.
Outils statistiques
Ce cours a pour objectifs la prise en main du logiciel SPSS, la découverte des fonctionnalités et de
procéder à des analyses statistiques via le logiciel.
• récupération de fichiers
• habillage des fichiers récupérés (éditeur de données)
• transformation de données (création de variables,...)
• manipulation et transformation de fichiers (pondération, agrégation, transposition, restructuration
scission,...)
9/20
CMI SID
Université Paul Sabatier
• analyse statistique
• analyse graphique
Fonctionnement : Mode de validation : une étude de cas est à réaliser et à rendre deux semaines après la
fin du cours : la note obtenue est la note finale.
II-15.
Marketing
L’objectif de ce cours est d’introduire aux étudiants les différents concepts du marketing. Il s’organise
de la façon suivante :
• Introduction : définition et historique du marketing. Exercice noté : le marché du téléphone portable
en Inde.
• Partie 1 : Connaissance et politique produit (notion de produit, fonction du produit, cycle de vie,
AVF, image et notoriété, politiques de prix). Etudes des cas : ”Renault Logan” et ”chupa chups”
• Partie 2 : Connaissance et politique de distribution (circuits, structures et réseaux). Exercice noté :
la distribution des cartes téléphoniques au Mali.
• Partie 3 : Actions sur le marché et communication (histoire de la pub, définition, caractéristiques,
organisation). Exercice noté : étude d’une publicité coca-cola.
Les études de cas se font par groupes de 5 à 6 étudiants, et permettent de balayer les différents concepts
étudiés ; elles sont à restituer dans les trois semaines suivant le cours.
Fonctionnement : cours suivi d’exercices et études de cas. Evaluations individuelles (exercices à rendre)
et par groupe (étude de cas).
III III-1.
Master 1 Semestre 7
Protection de données
Les objectifs de ce cours sont principalement : l’étude des problèmes liés à l’intégrité des bases de
données (BD) actives puis décrire les mécanismes que fournit un système de gestion de BD (SGBD)
pour assurer la cohérence des données ; étudier les protocoles d’accès à la BD permettant d’assurer la
confidentialité des données selon un schéma défini dans les applications métiers, apprendre à écrire des
programmes d’application qui garantissent la cohérence de la BD dans un environnement concurrentiel,
étudier les mécanismes qui permettent la reprise de fonctionnement normal d’une BD après la survenue
d’une panne.
1. Chapitre 1 : Intégrité et BD actives- conception et mise en œuvre d’un système de déclencheurs
2. Chapitre 2 : Confidentalité des données : droits, roles, administration de la confidentialité, schémas
externes et vues
3. Chapitre 3 : Gestion des accès concurrents : transactions et propriétés, techniques de contrôle d’accès
concurrents
4. Chapitre 4 : Sécurité de fonctionnement : catégories de pannes, outils, techniques et algorithmes de
reprise après panne
Fonctionnement : 16 H Cours, 10H TD, 10H TP. Un contrôle continu et un contrôle terminal.
III-2.
Génie logiciel
L’objectif de ce cours est de maı̂triser les concepts, les méthodes et outils instaurés dans un environnement de développement de projet dans différents secteurs d’activités de l’industrie.
• Partie 1 : Méthodes Agiles.
• Partie 2 : Processus de développement Itératif.
• Partie 3 : Gestion de Projet : Différentes Méthodes de Modélisation
• Partie 4 : Gestion de Configuration : Intégration continue, Normes, Référentiels, Espace de développement,
Espace de Référence.
• Partie 5 : Gestion des Risques
10/20
CMI SID
Université Paul Sabatier
• Partie 6 : Définition des exigences
• Partie 7 : Métrologie : Mesure et Diagnostic qualité du logiciel
Fonctionnement : 28 H Cours, 12H TD. Un contrôle terminal et Contrôle continu oral sur les Concepts
vus en Cours
III-3.
Data mining
Ce module a pour but de familiariser les étudiants aux enjeux et principales méthodes du data mining
et du text mining. Sont abordés notamment :
• l’étude des sources d’informations stratégiques externes à l’entreprise,
• l’harmonisation des contenus,
• l’analyse via des méthodes de la statistique,
• de l’analyse de données multidimensionnelles,
• les méthodes des classifications,
• la théorie des graphes,
• la cartographie géostratégique.
Les TP sont effectués sur la plate-forme de veille stratégique ”Tétralogie”. Cet enseignement est suivi
d’un bureau d’étude réalisé en petits groupes sur un sujet scientifique et/ou technologique d’actualité.
Fonctionnement : 14 H Cours, 12H TD, 10H TP. Un contrôle terminal.
III-4.
Data warehouse (entrepôt de données)
Ce cours introduit les principes des bases de données multidimensionnelles. Il s’articule autour de
quatre parties :
• Partie 1 : Outils décisionnels. Problématique décisionnelle.
• Partie 2 : Principes de l’analyse OLAP. Représentation multidimensionnelle
• Partie 3 : Architecture de solution décisionnelle à base d’entrepôt de donnnéees. Entrepôts de
donnéees. Principes d’un ETL. Magasins de données.
• Partie 4 : Modélisation multidimensionnelle. Modélisation conceptuelle. Modélisation logique ROLAP en étoile et en flocon. Modélisation physique avec Oracle.
Les TP concernent l’apprentissage de l’outil ETL Oracle Warehouse Builder.
Fonctionnement : Cours,TD et TP. Contrôle continu sur les notions abordées en TP. Un contrôle terminal.
III-5.
Statistique Exploratoire 2
L’objectif de ce module est de donner une introduction aux méthodes de statistique descriptive multidimensionnelle. Après des rappels d’algèbre linéaire, on étudiera les méthodes factorielles classiques
basées sur la projection des données sur des espaces propres associés à la diagonalisation de matrices
estimées sur les données. Les méthodes de classification supervisée ou non supervisée feront l’objet de la
dernière partie.
Fonctionnement : Le cours est accompagné de TD et TP. Le contrôle continu consiste en la rédaction de
compte rendus de TP. Il y a un examen final.
III-6.
Algèbre 2
• Espaces euclidiens
• Projection orthogonale
• Diagonalisation des matrices symétriques
• Décomposition en valeurs singulières
Fonctionnement : 8h de CM et 6h de TD. Un contrôle terminal.
III-7.
Analyse 2
1. Formules de Taylor à l’ordre n, développements limités, applications.
11/20
CMI SID
Université Paul Sabatier
2. Intégrales multiples : formules de changement de variables, théorème de Fubini. Applications aux
probabilités.
Fonctionnement : 8h de CM et 8h de TD. Un contrôle terminal.
III-8.
Optimisation Mathématique
1. Généralités sur l’optimisation
2. Formulations et applications industrielles
3. Fonctions à une seule variable :
• propriétés des fonctions (unimodalité, convexité,. . .)
• critères d’optimalité
• méthodes de recherche sans dérivées dichotomique, section d’or
• méthodes de recherche avec dérivées (Newton-Raphson, sécante)
4. Vitesse de convergence des algorithmes
5. Fonctions de plusieurs variables :
• généralités, gradient, hessien
• critères d’optimalité
• algorithme de la plus profonde descente
• algorithme de Newton
• méthodes de quasi-Newton
• approximation numérique du gradient
6. Optimisation sous contraintes :
• généralités
• conditions de KKT
• algorithmes (principes)
• méthodes (principes) des pénalités, fonctions barrières, points intérieurs,. . .
• détail d’un algorithme (SQP)
Fonctionnement : 12h de CM, 12h de TD, et 10h de TP. La note finale finale regroupe la note d’examen
final et la note de TP.
III-9.
Sondages
L’objectif du cours est de former l’étudiant aux différentes techniques de sondage : il y a donc transmission de la théorie des sondages et de cas pratiques d’enquêtes.
Les chapitres présentés sont les suivants :
• introduction : rappel de notions et distribution d’échantillonnage
• sondage aléatoire simple
• sondage stratifié
• sondage à plusieurs degrés
• les redressements : post-stratification, estimateur par le ratio, estimateur par la régression, traitement de la non-réponse
Fonctionnement : 8H C, 4H TD, 4H TP. Un examen écrit. 3 études de cas.
III-10.
Contrôle qualité
Ce cours donne les bases de Maitrise Statistiques des Procédés et renforce les connaissances en programmation sous le logiciel R. Il s’articule autour de trois chapitres :
Chapitre 1 : Les fonctions ou macros sous R.
Chapitre 2 : Tests d’adéquation à une loi de probabilité. Exemples classiques : Test d’Anderson Darling, de Kolmogorov Smirnov. TP sous R avec des jeux de données issus du laboratoire Matériaux
et Procédés Assystem.
12/20
CMI SID
Université Paul Sabatier
Chapitre 3 : Introduction à la MSP. Les différentes cartes de contrôle. Capabilité. Diagramme de
Pareto. Application à l’aide du logiciel R. Etude d’un jeu de données de production.
Fonctionnement : 4H Cours, 4H TD et 4H TP. Un contrôle terminal.
III-11.
Système d’information géographique
L’objectif de cet enseignement est de permettre aux étudiants de réaliser des cartographies et de
maı̂tirser les concepts de base d’un SIG. Lors des différents TD, ils apprennent à gérer, consulter, créer
et valoriser l’information géographique sur le logiciel libre QGIS. Fonctionnement : 6H Cours, 4H TD.
Contrôle continu
III-12.
Techniques de communication
Nous étudions comment mener un entretien téléphonique et quelles sont les techniques d’argumentation afin de réaliser une enquête auprès de statisticiens en place. L’objectif est de découvrir les avantages
et les inconvénients du métier tout en développant un réseau professionnel propre.
Fonctionnement : cours, TD, contrôle continu des TD.
IV IV-1.
Master 1 Semestre 8
Systèmes répartis et bases de données réparties
Objectif(s) et Compétences visés :
• Introduire les concepts, les objectifs, et les caractéristiques fondamentaux des systèmes répartis.
• Présenter les principes de base de la conception des systèmes de bases de données réparties.
• Comprendre comment il est possible d’exploiter efficacement un SGBD réparti dans un contexte
d’aide à la décision.
Programme :
1. Introduction aux systèmes répartis : Bases de la conception d’un système réparti, communication
et synchronisation de processus.
2. Bases de données réparties BDR
• Introduction aux BDR : objectifs d’une BDR, fonctions d’un SGBD réparti, architecture des
schémas, schémas de placement, et dictionnaire de données.
• Conception d’une BDR : approches de conception, stratégies de fragmentation, allocation des
fragments.
• Evaluation de requêtes réparties : phases d’évaluation d’une requête répartie, localisation, et
optimisation.
Fonctionnement : 18H cours, 12H TD, 10H TP Controle terminal
IV-2.
Extension Objets du Relationnel
Ce cours aborde deux grandes notions : Unified Modeling Language (UML) pour les bases de données,
et les bases de données objet-relationnelles.
UML et bases de données : Le modèle de données objet relationnel étend principalement le modèle
relationnel à l’utilisation des mécanismes de transformations en utilisant SQL2 (utilisation pointeurs,
collections et méthodes au niveau des tables et des types). Tous les concepts de ce cours sont illustrés
avec des exemples. Le cours s’articule autour de six parties :
• Partie 1 : Compléments fondamentaux sur les diagrammes de classes ;
• Partie 2 : Intérêt d’UML pour la modélisation des bases de données ;
• Partie 3 : Différentes contraintes et cas d’héritage ;
• Partie 4 : Du schéma conceptuel le diagramme de classe UML vers le schéma relationnel ;
13/20
CMI SID
Université Paul Sabatier
• Partie 5 : Traduction des contraintes ;
• Partie 6 : du schéma relationnel logique vers le schéma physique SQL2.
Bases de données objet-relationnelles : ce cours introduit les principes des bases de données objetsrelationnelles. Il s’articule autour de cinq parties :
• Partie 1 : Introduction aux principes objets dans les bases de données ;
• Partie 2 : Création et peuplement d’une base de données objet-relationnelle, table imbriquée,
références ;
• Partie 3 : Interrogation d’une base de données objet-relationnelle, SQL étendu ;
• Partie 4 : Définition de méthodes, surcharge de méthode ;
• Partie 5 : Héritage. Redéfinition de méthode.
Les TP concernent l’apprentissage des extensions objets-relationnelles au sein du système de gestion de
bases de données Oracle.
Fonctionnement : Cours et TP. Contrôle continu sur les notions abordées en TP. Un contrôle terminal.
IV-3.
Graphes et optimisation
Ce cours dresse un rapide panorama des méthodes de recherche de solutions optimales à des problèmes
modélisés sous forme de graphe.
1. Définitions et propriétés topologiques des graphes : définitions générales, matrice d’adjacence, distance géodésique, composante connexe, nombre cyclomatique, graphes eulériens et hamiltoniens ;
2. Les arbres : Arbres couvrants extrémums, problèmes de codage optimal (Prüfer, Huffman) ;
3. Graphes orientés et pondérés : parcours, noyau d’un graphe, partition, graphes probabilistes (modèles
markoviens), chemin de longueur minimal (Dijkstra), flot maximum (Floyd et Fulkerson) ;
Fonctionnement : 8H Cours, 6 H TD, 6H TP. Contrôle continue sous forme de moyenne de comptes
rendus de TP, un contrôle terminal
IV-4.
Normes W3C : Standards associés et XML
Ce cours introduit les notions de base du standard XML, il s’articule autour de trois parties :
• Partie 1 : XML : Syntaxe du langage Document bien formé
• Partie 2 : DDT document valide
• Partie 3 : Parseurs, Schémas, XSL.
Fonctionnement : Cours et TP. Contrôle continu sur les notions abordées en cours. Un contrôle terminal.
IV-5.
Projets tutorés : Statistique et applications Décisionnelles
Cet enseignement propose aux étudiants un cadre formel de développement de projet qui montre la
connexion des deux disciplines fondamentales : la statistique et l’informatique décisionnelle, le coeur du
métier de la formation SID. Il s’agit de développer un système d’aide à la décision qui permet de faire des
analyses détaillées à partir des données textuelles issues d’une part, des bases de données scientifiques
et technologiques et d’autre part, de source d’informations hétérogènes. Ce projet est réalisé dans un
contexte client/fournisseur, un cahier des charges est fourni aux étudiants, définissant les exigences et les
contraintes à respecter. Les concepts présentés sont les suivants :
• processus de développement des systèmes d’information ;
• matérialisation et instrumentalisation de différents outils et méthodes utilisés dans chaque étape
du processus, notamment les tests et la validation pour la prise de décision.
• restructuration des données en utilisant une approche multidimensionnelle ;
• analyse des données avec l’outil Tétralogie, afin de les communiquer aux décideurs.
L’information élaborée est présentée, via une interface graphique en réseau, par des cartes factorielles,
des arbres de classification, des dessins de graphes, des cartes géostratégiques. Un document et une
présentation sont élaborés par chaque équipe et une soutenance de projet a lieu devant un jury constitué
d’industriels et d’enseignants.
Fonctionnement : 18h CM, 14h TD, 8h TP. Rapport + soutenance notés
14/20
CMI SID
IV-6.
Université Paul Sabatier
Modélisation Bayésienne
L’objectif de ce cours est de présenter, puis de mettre en oeuvre l’approche bayésienne (estimation,
tests et choix de modèles) dans des situations concrètes et variées. On envisagera ainsi différentes situations selon que le paramètre d’intérêt est un réel, un entier, ou qu’il appartient à [0, 1]. L’obtention
de l’estimation bayésienne de cette quantité pourra nécessiter l’utilisation des méthodes classiques de
simulation de Monte Carlo qui seront alors introduites à cette occasion. Trois TP (en R ou en Matlab)
seront consacrés à l’analyse statistique bayésienne de jeux de données réelles.
Fonctionnement : 16h de CM et 14h de TD.
IV-7.
Modèles linéaires généralisés
Après quelques rappels sur le modèle linéaire gaussien (Chapitre 1), on présentera le modèle linéaire
généralisé dans sa forme générale (Chapitre 2). Il s’agira de situer le modèle linéaire généralisé par rapport à la nature des données qu’il permet d’analyser, mais aussi d’introduire de nouvelles notions sur les
méthodes d’estimation et sur les tests (tels que le test du rapport de vraisemblance ou le test de Wald
par exemple).
Dans un deuxième temps, nous étudierons quelques modèles particuliers : la régression logistique permettant de modéliser une variable binaire (Chapitre 3), le modèle log-linéaire et la régression de Poisson
pour expliquer une variable de comptage (Chapitre 4). Ces modèles seront mis en œuvre sous SAS, en
mettant l’accent sur l’interprétation des résultats fournis, et sur la qualité et la validité du modèle estimé.
Fonctionnement : Cours, TD et TP. Contrôle continu par des compte-rendus de TP et un examen terminal.
IV-8.
Séries Chronologiques
Ce module a pour objectif d’introduire des techniques de modélisation statistique au travers de l’étude
de séries chronologiques. Dans un premier temps, on présentera l’analyse déterministe des séries chronologiques et de leur prédiction (régression linéaire, lissage exponentiel. . .)
Dans un second temps, quelques modèles classiques de séries chronologiques stationnaires seront
présentés (ARMA, GARCH. . .). L’étude de tels processus et de leurs indices caractéristiques permettra de présenter les techniques de prédiction.
Fonctionnement : 16h de CM et 12h de TD.
IV-9.
Techniques de communication et conférences
Pour les techniques de communication, voir ci-dessus programme de l’année. Le contenu des conférences
varie suivant les intervenants (qui ne sont pas les mêmes chaque année). Voici deux exemples :
Solutions décisionnelles : le marché. Cette conférence décrit les grands opérateurs et utilisateurs des solutions décisionnelles :
• qui utilisent des solutions décisionnelles ;
• quelles sont les fonctions métiers pour lesquelles ces solutions apportent une plus value ;
• quels sont les fournisseurs de solutions décisionnelles en termes de matériels, logiciels et ressources
humaines ;
• quels sont les postes recherchés et quels métiers et travail correspondent à ces postes.
Solutions décisionnelles : état de l’art. Les solutions décisionnelles se répartissent en trois grands domaines :
• les solutions de stockage de données, moteurs de base de données, serveurs et stockages adaptés
à les gestions des grands volumes de données ;
• les solutions de manipulation des données, entre sources de données et données d’analyses cibles,
comment exporter, modifier et charger les données à la base des actions de décision ;
• les solutions d’analyses décisionnelles, l’éventail des solutions d’analyses, les profils et besoins des
utilisateurs correspondants.
Pour chaque domaine les nouvelles solutions ou prospectives sont décrites.
15/20
CMI SID
Université Paul Sabatier
Fonctionnement : 12H C. Contrôle continu
Stage de 4-5 mois dans une entreprise ou dans une unité de recherche. Le stage est encadré par un
enseignant universitaire et un acteur de l’unité d’accueil du stage. A l’issue du stage, l’étudiant remet un
rapport et soutient son projet devant un jury composé d’enseignants universitaires et d’industriels.
VV-1.
Master 2 Semestre 9
Environnement décisionnel : OLAP
Pour la partie TD : recherche et commentaires des outils et solutions open source dans le domaine de
la BI, et, comparaison avec SAP.
Pour la partie TP Business Objects (BO) :
1. Découverte de l’outil,
2. Réalisation de requêtes à partir de la base école,
3. Présentation et analyse de données simples (chart, et pertinence),
4. Conception d’un univers depuis un fichier Accès
5. Mise en place de fonction dans la réalisation des requêtes complexes.
Évaluations :
• Partie cours : Réponse à une question de cours, Mise en situation et analyse personnelle
• Partie TP : Réalisation d’un tableau de bord avec 3 ou 4 réponses à fournir (chart, analyse, commentaires..) sur une quinzaine de lignes
V-2.
Bases de données à grande échelle
Objectif(s) et Compétences visés :
• Introduire les principaux problèmes posés et les méthodes proposées dans la conception et le
développement des systèmes de bases de données répartis à grande échelle.
• Comprendre comment il est possible d’exploiter efficacement les serveurs de BD parallèles et les
SGBD répartis à grande échelle dans un contexte d’aide à la décision.
Programme :
• Serveurs de bases de données parallèles : objectifs et parallélisation de requêtes décisionnelles
• Modèles d’allocation et de localisation des données réparties
• Évaluation et optimisation de requêtes en environnement réparti à grande échelle
• Modèles de coûts : collection dynamique des statistiques et impacts des précisions des estimations
sur les performances des requêtes.
• Systèmes d’intégration virtuelles de données : caractéristiques et problématiques et modèles d’évaluation
de requêtes décisionnelles
• Introduction aux bases données mobiles :
1. Types de mobilité dans les BD
2. Évaluation et optimisation de requêtes en environnement réparti à grande échelle
Fonctionnement : 18h CM et 12h TD. Un contrôle terminal
V-3.
Indexation par le contenu Documents Audio et Vidéo
Le cours de statistiques multimédia a pour but de présenter de nouveaux cadres applicatifs statistiques
pour les étudiants du parcours Master 2 Statistiques et Informatique Décisionnelle. Le cours se compose
d’une première partie sur l’étude de l’image suivi d’une partie axée sur le traitement de l’audio.
Image — cette partie présente les principaux mécanismes mis en œuvres pour indexer et formuler des
requêtes sur des images sans utiliser de texte.
1. Principes d’un moteur de recherche d’image par le contenu
16/20
CMI SID
Université Paul Sabatier
2. Indexation par la couleur
3. Indexation par la texture
4. Indexation par la forme
Audio — cette partie comporte principalement les aspects suivants :
1. A la découverte d’un signal aléatoire : la parole
2. Paramétrisation
3. Modélisation statistique
4. Méthodes d’évaluation et implémentations
Après une rapide introduction pour vous présenter l’objectif de cette formation, le cours se découpe
en quatre parties. Les deux premières parties sont destinées à expliquer le type de données que l’on
va devoir traiter, la troisième va exposer une méthode de modélisation. Nous finirons par une partie
expliquant comment exploiter des résultats de modélisations, les informations à stocker dans des
bases de données et quelques applications industrielles.
V-4.
Évaluation des processus et certification
Les principaux objectifs de ce cours sont les suivants :
• Approche de la qualité du logiciel sous l’aspect Qualité du Processus de Développement (modèle
CMM, standard et normes de développement, ...) et sous l’aspect Qualité Produit (Norme ISO9126,
techniques de test, ...).
• Mise en perspective avec une présentation plus spécifiques des normes (DO2167, DO178), outils
(Logiscope, ...) et techniques (revue, inspection) appliquées dans le monde aéronautique et spatial
et ses systèmes ”Safety of Life”.
• Introduction à la notion de certification du logiciel. Présentation des aspects des outils de traçabilité
des exigences mis en œuvre dans le contexte de développement logiciel pour l’ingénierie des données,
métrologie, diagnostic qualité, arbre de défaillance, méthode d’évaluation de l’arbre qualité. Processus de certification de l’environnement de développement. Exigence qualité processus de traçabilité
ISO - Normes ISO 9126.
Fonctionnement : 30h CM
V-5.
Normes W3C : XML et les Bases de Données
Ce cours consolide les techniques de stockage aux documents structurés de Type XML déjà introduites
en Master 1. Il s’articule autour de quatre axes :
• Généralités XML : XSLT et XSL-FO ;
• Xpath ;
• Xquery ;
• XML et les bases de données.
L’assimilation de tous ces outils est assurée par un projet fait en TP.
Fonctionnement : Cours et TP. Contrôle continu sur les notions abordées en cours, un contrôle terminal.
V-6.
Apprentissage Statistique
Ce cours présente les techniques récentes d’apprentissage statistique, de data-mining :
1. régression logistique
2. analyse discriminante
3. arbres de régression et de discrimination
4. réseau de neurones
5. agrégation de modèles (bagging, forêts aléatoires, boosting)
6. SVM (Séparateur à Vaste Marge ou Support Vector Machines)
17/20
CMI SID
Université Paul Sabatier
Il est illustré par des TP utilisant le logiciel R et basés sur des données réelles.
Fonctionnement : Cours - TP. L’évaluation s’effectue par la remise d’un rapport de projet, illustrant la
mise en œuvre de ces méthodes sur un nouveau jeu de données.
V-7.
Statistiques bio-médicales
Ce cours s’articule autour d’un projet d’analyse statistique sur des données biomédicales réelles. Il permet aux étudiants de revoir l’ensemble des méthodes statistiques vues pendant leur cursus, mais aussi
d’appréhender de nouveaux outils mathématiques et statistiques spécifiquement adaptées aux données
biomédicales.
Dans ce cadre, nous présenterons en particulier les méthodes d’analyse de survie pour analyser les données
censurées (méthode actuarielle, méthode de Kaplan-Meier, Modèle de Cox).
Fonctionnement : Cours et TP. Projet.
V-8.
Modèle linéaire gaussien général
Ce cours vient en complément des enseignements sur le modèle linéaire. L’objectif est de présenter
et de mettre en œuvre des nouvelles méthodes de modélisation linéaire couramment employées dans la
pratique statistique :
• Analyse de variance multidimensionnelle (MANOVA)
• Modèles à effets aléatoires et modèles mixtes
• Modèles pour données répétées
Fonctionnement : Cours et TP. Contrôle continu par des compte-rendus de TP et un examen terminal.
V-9.
Maı̂trise statistique des procédés
Ce cours donne un large panorama sur la maı̂trise statistique des procédés (MSP). Il s’agit de techniques descriptives et inférentielles pour le contrôle statistique des processus. Les points abordés sont les
suivants :
• Rappels et compléments sur la distribution gaussienne. Méthodes d’estimation des paramètres.
• Capabilités.
• Cartes de contrôles et applications.
• Plans d’échantillonnage.
Fonctionnement : Cours magistraux, TD, 3 TP. Contrôle continu : compte-rendus des TP. Un contrôle
terminal.
V-10.
Fiabilité des systèmes
Ce cours constitue une introduction à la fiabilité des systèmes. Les notions théoriques abordées sont
mises en application sur des cas d’étude réels issus du contexte aéronautique. Il s’articule en 3 étapes
principales :
• Vocabulaire et généralités sur les systèmes et la sûreté de fonctionnement ;
• Analyses qualitative : diagrammes, coupes/chemins minimaux/non minimaux,...
• Analyses quantitatives : cas général, loi exponentielle, systèmes série/parallèle,...
Fonctionnement : Cours + TD + Un contrôle terminal.
V-11.
Fiabilité des matériaux
Ce cours propose quelques outils statistiques de base pour calculer la fiabilité des matériaux. Il s’articule autour de trois parties :
• Partie 1 : Initiation aux notions élémentaires sur les matériaux : les différents types de matériaux,
les contraintes mécaniques étudiées et les essais modélisés.
• Partie 2 : Procédure de calculs de fiabilité pour les essais à ruptures. Identification d’un modèle
par la loi normale, log-normale et de Weibull. Calcul de paramètres des lois, détection des points
aberrants. Valeurs de tolérances.
18/20
CMI SID
Université Paul Sabatier
• Chapitre 3 : Modélisation mathématique d’un essai à non-ruptures et ses limites.
Fonctionnement : Cours-TD. Un contrôle terminal.
V-12.
Modèles statistiques pour l’information textuelle
Ce cours présente des modèles statistiques pour l’accès et la classification de corpus de textes. Ce
cours complète l’enseignement ”Concepts RI” assuré au semestre 6. Une partie de ce cours est assurée
par un industriel (EADS) qui présente les cadres d’application de l’analyse statistique de textes sur des
corpus de documentation avionique.
• Notions de base :
· Lois de distributions sur les textes (loi de Zipf, loi de Heap)
· Outils statistiques pour la RI : tests de significativité, analyse de corrélations, mesures de tendances et dispersion
• Modèles statistiques pour l’accès à l’information : modèle de langue, modèle d’apprentissage (learning to rank)...
• Méthodes statistiques pour la classification et catégorisation de textes : SVM, Naive Bayes, K plus
proches voisins...
Fonctionnement : 16h Cours, 12h TP. Contrôle continu sous forme de projet. Un contrôle terminal.
V-13.
Cycle de décision en entreprise
Ce module aborde les notions d’intelligence économique et de veille stratégique en les situant dans le
cycle de décision en entreprise. Une ouverture vers les nouveaux métiers et les nouvelles pratiques dans
les TIC et aussi proposée et illustrée de nombreux exemples pratiques. Il s’articule autour de deux grands
axes :
Cycle Innovation et Propriété Intellectuelle
1. Mission INPI et concepts de base
2. Comprendre la PI dans le cycle de l’innovation
• présentation des outils Pi
Signe distinctifs et marques
Dessins et modèles
Droit d’auteur
Secret de fabrique
Brevet invention
• extension internationale
• Pi et communication
3. Recherches d’antériorité : pourquoi et quelles bases de données accessibles
• Marques
• Dessins et modèles
• Brevet
4. la contrefaçon
La Propriété Intellectuelle appliquée aux logiciels
1. Comment protéger un logiciel - par le droit d’auteur - par le droit des brevets - par le droit
des dessins et modèles - par le droit des marques - par le droit commun
2. Autres aspects
• Licences ”open sources”
• droit comparé
• Business Methods
• Bases de données
Fonctionnement : Cours, examen terminal, QCM et étude de cas.
19/20
CMI SID
V-14.
Université Paul Sabatier
Techniques de communication
Ce cours aborde l’entretien d’embauche en face à face :
• l’importance de la préparation et du non verbal ;
• les techniques professionnelles relevant de l’entretien ;
• les erreurs à éviter ;
• comment suivre sa candidature.
L’objectif est de savoir préparer et mener un entretien d’embauche professionnel.
Fonctionnement : cours, TD, contrôle continu des TD.
V-15.
Conférences thématiques
Le contenu de ces conférences varie suivant les intervenants. Il s’agit essentiellement d’une sensibilisation à la recherche. Des conférenciers, issus de laboratoires de recherche privés ou universitaires
(essentiellement en provenance de l’IMT et de l’IRIT, mais aussi parfois des intervenants extérieurs suivant les opportunités) présentent des thématiques de recherche. Les étudiants apprennent à se servir des
méthodes de recherche bibliographiques, à s’approprier un sujet et à poser un regard critique dessus.
VI -
Master 2 Semestre 10
Stage long (5 mois minimum).
20/20