Gestion d`une chaˆıne de cinéma – correction
Transcription
Gestion d`une chaˆıne de cinéma – correction
Gestion d’une chaı̂ne de cinéma – correction Remarques préalables : Il est évident que l’énoncé est à lire dans sa totalité avant de commencer à résoudre l’exercice. Les réponses devront être justifiées en relation avec le problème posé et non en répétant les informations, par ailleurs très pertinentes, contenues dans le cours. Une chaı̂ne de cinéma souhaite optimiser la fréquentation de ses salles et augmenter ses parts de marché. Pour atteindre cet objectif, elle souhaite suivre de façon plus précise la fréquentation en fonction de différents critères liés au cinéma, à la salle, au film, au tarif, ... Il a été décidé de créer un entrepôt de données. Une analyse de l’existant et une étude des besoins ont permis de recueillir les éléments d’information suivants : – La chaı̂ne gère une centaine de cinémas pour un ensemble d’un millier de salles. Chaque cinéma possède une localisation géographique et la hiérarchie géographique administrative. Il y a quatre régions pour la gestion de la chaı̂ne. On souhaite mémoriser différentes informations socio-économiques sur l’environnement. En particulier, on souhaite pouvoir comparer cinémas en ville et cinémas en zone commerciale. Les cinémas diffèrent également par le niveau d’équipement : bar, salle de jeux, restaurant, ... Les salles d’un cinéma diffèrent par la taille, le nombre de sièges, le niveau de confort, le niveau d’équipement de projection, la qualité sonore, ... – On souhaite pouvoir suivre la fréquentation en fonction des heures de séance, du jour et de toute combinaison de ces unités de temps. Il y a en moyenne 5 séances par jour. Il est également important de pouvoir distinguer les jours fériés, les jours de week-end, les veilles de ces jours, les événements particuliers comme la fête du cinéma. – On souhaite pouvoir suivre la fréquentation par type de film, par type de public cible, par metteur en scène, par acteur principal, ... – On ne peut pas suivre les spectateurs individuellement car les places ne sont pas nominatives et on ne dispose pas d’informations personnelles sur les spectateurs. On ne peut disposer que du type de spectateur, les spectateurs peuvent être étudiant, jeune, chômeur ou assimilé, senior ou normal. Chaque catégorie a son propre tarif par séance. Le nombre de types de spectateur est limité à 10. Q1 Discutez du choix du grain entre salle et cinéma en précisant quelles analyses sont possibles dans un cas et pas dans l’autre. Même question pour le choix du grain entre séance et jour. Quels pourraient être les problèmes posés par un choix de grain le plus fin (par salle par séance) ? grain entre salle et cinéma Le grain cinéma n’est pas pertinent au vu des souhaits de la direction de la chaı̂ne. En effet, il ne permet pas de faire des analyses selon des critères liés à la salle et il ne permet pas de faire des analyses par film (un film est joué dans une ou plusieurs salles d’un cinéma mais, en général, pas dans toutes les salles. Le grain salle permet toutes ces analyses et toutes les analyses au niveau du cinéma sont bien sur possibles car il suffit de considérer toutes les salles d’un même cinéma. grain entre séance et jour Comme la chaı̂ne souhaite pouvoir suivre la fréquentation en fonction des heures de séance, le grain séance doit être choisi. Les analyses au niveau du jour sont possibles en regroupant toutes les séances d’une même journée. problèmes liés au grain le plus fin Un grain plus fin permet des analyses plus précises. Le problème principal est le nombre plus grand d’enregistrement. Pour notre étude, entre le grain cinéma par jour et le grain salle par séance, on a un rapport de taille de 50. En effet, il y a 5 séances par jour et le rapport entre cinéma et salle est de 10. On effectue les choix suivants : les faits sont : le prix de vente des places, le nombre de places, le prix de revient des places ; le grain est : la séance, le type de spectateur, la salle et le film. On mémorisera par exemple qu’il y a eu 25 places étudiant pour la troisième séance du 15 mai 2003 1 dans la salle 7 du cinéma chateaupolis de Lomme pour le film “Fanfan la tulipe” pour un prix de vente 125 euros et un prix de revient de 119,55 euros. Q2 On peut choisir de définir une dimension salle contenant les informations sur le cinéma ou deux dimensions salle et cinéma. Discutez de ces deux choix possibles : gestion des clés de dimension, facilité des analyses, ... une table SALLE cette table représente la dimension salle. Elle contient donc toute information utile pour des analyses en fonction de la salle (taille, confort, ...). Une salle est localisée dans un cinéma, la table va donc contenir également toutes les informations sur le cinéma dans lequel elle est située. Les redondances seront donc nombreuses (on répète les mêmes informations sur le cinéma pour toutes les salles d’un même cinéma). La gestion des clés de la table SALLE sera centralisée car un numéro de salle doit désigner de façon unique une salle précise d’un seul cinéma précis. Toutes les analyses en fonction de la salle seront faciles. Toutes les analyses en fonction du cinéma se feront en regroupant toutes les salles d’un même cinéma. une table SALLE et une table CINEMA - modèle en flocon une table SALLE, contenant les informations sur la salle, est liée à la table de faits par le numéro de SALLE. Une table CINEMA, contenant toutes les informations sur le cinéma, est liée à la table SALLE par le numéro de cinéma. Cette solution évite la redondance des informations sur le cinéma. Cette solution est déconseillée en général. une table SALLE et une table CINEMA - éclater en deux dimensions l’idée est d’éclater la dimension salle en deux tables SALLE et CINEMA. Si les salles de la chaı̂ne sont homogènes, la table SALLE correspondra à un type de salle (niveau de taille, niveau de confort, ...). Sinon, on conserve la table SALLE comme représentant une salle avec une gestion des clés centralisée. La table CINEMA est reliée à la table de faits. L’avantage est d’éviter les redondances et de faciliter les analyses (les analyses par cinéma peuvent être effectuées directement sans groupe). On effectue les choix suivants : les dimensions sont : la séance, le jour, le type de spectateur, la salle, le cinéma, le film. La table de faits est : faitsentrees(refseance, refjour, reftypespectateur, refsalle, refcinema, reffilm, nbplaces, prixventeplaces, prixrevientplaces). On aura par exemple un fait de la forme (3, 1523, 5, 7, 76, 132 455, 25, 125, 119.55) où 3 est la valeur de clé pour la troisième séance, 1523 est la valeur de clé pour le 15 mai 2003, 5 est la valeur de clé correspondant à étudiant, 7 est la valeur de clé pour la salle, 76 est la valeur de clé pour le cinéma chateaupolis de Lomme, 132 455 est la valeur de clé pour le film “Fanfan la tulipe” (le remake qui vient de sortir), 25 le nombre de places, 125 euros le prix de vente et 119,55 euros le prix de revient. Q3 Quelle est la clé primaire de la table faitsentrees ? clé primaire de la table faitsentrees est refseance + refjour + reftypespectateur + refsalle. Si la table SALLE représente un type de salle alors elle serait refseance + refjour + reftypespectateur + refsalle + refcinema. À noter que reffilm ne doit pas apparaı̂tre dans la clé. Q4 Estimez la taille de la table de faits. taille de la table de faits sur quatre ans : 4x365 jours ; pour chaque jour, mille salles, dix types de spectateur et cinq séances ; un enregistrement a une taille de 9x4 octets. Soit 4x365x1000x10x5x4x9 octets, soit environ 2,6 Gigaoctets. Q5 L’entrepôt est géré par le centre de la chaı̂ne. Discutez des questions liées à l’alimentation du magasin : rythme d’alimentation, données à transmettre, traitements à effectuer dans chaque cinéma, contraintes pour le centre. 2 alimentation de l’entrepôt – le rythme sera journalier ou hebdomadaire. A priori le rythme hebdomadaire semble suffisant car la programmation des cinémas est, en général hebdomadaire. Si les analyses doivent influer sur la programmation, un rythme journalier peut être pertinent. En effet, il s’agira d’étudier la fréquentation des premiers jours pour décider du maintien à l’affiche d’un film (ou le transfert dans une autre salle). – si le transfert est hebdomadaire, il faudra transmettre le numéro du jour en plus des informations journalières. Chaque jour, il faut transmettre le nombre de places, le prix de vente des places, le prix de revient des places pour chaque salle, chaque séance et chaque type de spectateur ainsi que le film programmé. – les calculs du nombre de places, prix de vente et prix de revient par salle, séance et type de spectateur doivent être faits au niveau du cinéma. – le centre doit gérer de façon centralisée les numéros de salle, les numéros de film. Ces informations doivent être connues des centres. Les règles de calcul du prix de revient font intervenir une partie propre au cinéma (ses frais de gestion) et venant du centre (frais de gestion de la chaı̂ne, coût des films). Q6 Décrire la dimension salle. nom du champ type numsalle entier superficiesalle entier nombresiègessalle entier tailleécran entier typeconfort integer etc Q7 Décrire la dimension cinéma. nom du champ numcinema signification clé primaire, identifie une salle de la chaı̂ne superficie en m2 nombre de sièges superficie en m2 de l’écran niveau de confort entre 1 et 5 type signification entier clé primaire, identifie un cinéma de la chaı̂ne informations descriptives texte nom du cinéma entier numéro dans la rue texte nom de rue nomcinéma numruecinéma nomruepointdevente etc informations géographiques administratives nomquartier texte nom du quartier ville texte ville du cinéma département texte département du cinéma région texte région administrative du cinéma informations géographiques internes régionchaine texte région commerciale du cinéma environnement du cinéma grandeville texte grande ville la plus proche cinémaville ? booléen vrai si cinéma situé en centre ville densitépopulation entier mesure la densité de population niveaupopulation entier niveau social de la population etc aménagement et services typecinema texte type du cinéma superficietotale réel superficie en m2 superficieespaces réel superficie en m2 hors salles existebar ? booléen vrai si un bar existe dans l’enceinte etc Q8 Décrire la dimension film. 3 nom du champ type signification numfilm entier clé primaire, identifie un film titrefilm texte titre du film en français titreoriginalfilm texte titre original du film metteurenscene texte nom du metteur en scene metteurenscene2 texte nom du second metteur en scene si existe acteurprincipal1 texte nom du premier acteur principal acteurprincipal2 texte nom du second acteur principal type film entier donne le type du film selon une codification etc Les autres dimensions sont : – séance(numséance, heuredébutséance, heurefinséance, typeséance) – jour(numjour,numérodujourdanslemois,numérodumois,année, jourférié ?, veillejourférié ?, ...) – typespectateur(numtypespectateur,typespectateur, conditions) Q9 Il a été choisi d’éclater la séance selon deux dimensions séance et jour. Critiquez ce choix. deux dimensions séance et jour Ce choix va permettre des analyses par séances indépendantes des analyses par jour. Ce choix est pertienent si les séances des cinémas de toute la chaı̂ne ont des horaires proches et la numérotation des séances est uniforme. Q10 Les faits sont-ils additifs sur toutes les dimensions ? faits additifs les faits sont additifs sur toutes les dimensions. Tout calcul de somme du nombre de tickets, des prix de vente et de revient est pertinent pour des salles, des cinémas, des films, des types de client, des sénaces et des périodes de temps. Pour valider votre modèle, il reste à montrer que les analyses souhaitées par la direction de la chaı̂ne sont réalisables. Q11 Calculer la fréquentation par cinéma et par mois calculer la somme du nombre de places avec un groupe par mois et par cinéma. Q12 Comparer les cinémas en ville avec les cinémas en zone commerciale. Comment procéder ? Le nombre de cinémas et leur capacité pouvant être différents, on comparera des fréquentation moyennes, taux de remplissage, marges, ... selon le type de cinéma. On pourra ensuite comparer ces quantités par type de film, par région, ... Q13 Comparer les fréquentations en fonction des séances. Comment procéder ? comparer les fréquentations moyennes, taux de remplissage en fonction du numéro de séance dans le jour. On a supposé que les séances avaient une numérotation identique pour les cinémas de la chaı̂ne. Q14 On vous demande une étude sur le choix de programmation des films. Que pensez-vous produire comme documents ? produire sur la dernière année, un ensemble de tableaux et graphiques significatifs montrant les des fréquentation moyennes, taux de remplissage, marges, ... selon le type de film, l’acteur principal, ... On voit que le nombre d’analyses possible est important. Les techniques de fouille de données ont pour objectif d’extraire des données des informations sur les films les plus intéressants (du point de vue de la chaı̂ne). 4