Gestion d`une chaˆıne de cinéma – correction

Transcription

Gestion d`une chaˆıne de cinéma – correction
Gestion d’une chaı̂ne de cinéma – correction
Remarques préalables : Il est évident que l’énoncé est à lire dans sa totalité avant de
commencer à résoudre l’exercice. Les réponses devront être justifiées en relation avec le problème
posé et non en répétant les informations, par ailleurs très pertinentes, contenues dans le cours.
Une chaı̂ne de cinéma souhaite optimiser la fréquentation de ses salles et augmenter ses parts
de marché. Pour atteindre cet objectif, elle souhaite suivre de façon plus précise la fréquentation
en fonction de différents critères liés au cinéma, à la salle, au film, au tarif, ... Il a été décidé de
créer un entrepôt de données.
Une analyse de l’existant et une étude des besoins ont permis de recueillir les éléments d’information suivants :
– La chaı̂ne gère une centaine de cinémas pour un ensemble d’un millier de salles. Chaque
cinéma possède une localisation géographique et la hiérarchie géographique administrative.
Il y a quatre régions pour la gestion de la chaı̂ne. On souhaite mémoriser différentes informations socio-économiques sur l’environnement. En particulier, on souhaite pouvoir comparer
cinémas en ville et cinémas en zone commerciale. Les cinémas diffèrent également par le
niveau d’équipement : bar, salle de jeux, restaurant, ... Les salles d’un cinéma diffèrent par
la taille, le nombre de sièges, le niveau de confort, le niveau d’équipement de projection, la
qualité sonore, ...
– On souhaite pouvoir suivre la fréquentation en fonction des heures de séance, du jour et
de toute combinaison de ces unités de temps. Il y a en moyenne 5 séances par jour. Il est
également important de pouvoir distinguer les jours fériés, les jours de week-end, les veilles
de ces jours, les événements particuliers comme la fête du cinéma.
– On souhaite pouvoir suivre la fréquentation par type de film, par type de public cible, par
metteur en scène, par acteur principal, ...
– On ne peut pas suivre les spectateurs individuellement car les places ne sont pas nominatives
et on ne dispose pas d’informations personnelles sur les spectateurs. On ne peut disposer
que du type de spectateur, les spectateurs peuvent être étudiant, jeune, chômeur ou assimilé,
senior ou normal. Chaque catégorie a son propre tarif par séance. Le nombre de types de
spectateur est limité à 10.
Q1 Discutez du choix du grain entre salle et cinéma en précisant quelles analyses sont possibles
dans un cas et pas dans l’autre. Même question pour le choix du grain entre séance et jour.
Quels pourraient être les problèmes posés par un choix de grain le plus fin (par salle par
séance) ?
grain entre salle et cinéma Le grain cinéma n’est pas pertinent au vu des souhaits de la direction de la chaı̂ne. En effet, il ne permet pas de faire des analyses selon des critères liés à la
salle et il ne permet pas de faire des analyses par film (un film est joué dans une ou plusieurs
salles d’un cinéma mais, en général, pas dans toutes les salles. Le grain salle permet toutes
ces analyses et toutes les analyses au niveau du cinéma sont bien sur possibles car il suffit
de considérer toutes les salles d’un même cinéma.
grain entre séance et jour Comme la chaı̂ne souhaite pouvoir suivre la fréquentation en fonction des heures de séance, le grain séance doit être choisi. Les analyses au niveau du jour
sont possibles en regroupant toutes les séances d’une même journée.
problèmes liés au grain le plus fin Un grain plus fin permet des analyses plus précises. Le
problème principal est le nombre plus grand d’enregistrement. Pour notre étude, entre le
grain cinéma par jour et le grain salle par séance, on a un rapport de taille de 50. En effet,
il y a 5 séances par jour et le rapport entre cinéma et salle est de 10.
On effectue les choix suivants :
les faits sont : le prix de vente des places, le nombre de places, le prix de revient des
places ; le grain est : la séance, le type de spectateur, la salle et le film. On mémorisera
par exemple qu’il y a eu 25 places étudiant pour la troisième séance du 15 mai 2003
1
dans la salle 7 du cinéma chateaupolis de Lomme pour le film “Fanfan la tulipe” pour
un prix de vente 125 euros et un prix de revient de 119,55 euros.
Q2 On peut choisir de définir une dimension salle contenant les informations sur le cinéma ou
deux dimensions salle et cinéma. Discutez de ces deux choix possibles : gestion des clés de
dimension, facilité des analyses, ...
une table SALLE cette table représente la dimension salle. Elle contient donc toute information
utile pour des analyses en fonction de la salle (taille, confort, ...). Une salle est localisée
dans un cinéma, la table va donc contenir également toutes les informations sur le cinéma
dans lequel elle est située. Les redondances seront donc nombreuses (on répète les mêmes
informations sur le cinéma pour toutes les salles d’un même cinéma). La gestion des clés
de la table SALLE sera centralisée car un numéro de salle doit désigner de façon unique
une salle précise d’un seul cinéma précis. Toutes les analyses en fonction de la salle seront
faciles. Toutes les analyses en fonction du cinéma se feront en regroupant toutes les salles
d’un même cinéma.
une table SALLE et une table CINEMA - modèle en flocon une table SALLE, contenant
les informations sur la salle, est liée à la table de faits par le numéro de SALLE. Une table
CINEMA, contenant toutes les informations sur le cinéma, est liée à la table SALLE par le
numéro de cinéma. Cette solution évite la redondance des informations sur le cinéma. Cette
solution est déconseillée en général.
une table SALLE et une table CINEMA - éclater en deux dimensions l’idée est d’éclater
la dimension salle en deux tables SALLE et CINEMA. Si les salles de la chaı̂ne sont homogènes, la table SALLE correspondra à un type de salle (niveau de taille, niveau de confort,
...). Sinon, on conserve la table SALLE comme représentant une salle avec une gestion des
clés centralisée. La table CINEMA est reliée à la table de faits. L’avantage est d’éviter
les redondances et de faciliter les analyses (les analyses par cinéma peuvent être effectuées
directement sans groupe).
On effectue les choix suivants :
les dimensions sont : la séance, le jour, le type de spectateur, la salle, le cinéma,
le film. La table de faits est : faitsentrees(refseance, refjour, reftypespectateur,
refsalle, refcinema, reffilm, nbplaces, prixventeplaces, prixrevientplaces). On aura par
exemple un fait de la forme (3, 1523, 5, 7, 76, 132 455, 25, 125, 119.55) où 3 est la
valeur de clé pour la troisième séance, 1523 est la valeur de clé pour le 15 mai 2003,
5 est la valeur de clé correspondant à étudiant, 7 est la valeur de clé pour la salle, 76
est la valeur de clé pour le cinéma chateaupolis de Lomme, 132 455 est la valeur de clé
pour le film “Fanfan la tulipe” (le remake qui vient de sortir), 25 le nombre de places,
125 euros le prix de vente et 119,55 euros le prix de revient.
Q3 Quelle est la clé primaire de la table faitsentrees ?
clé primaire de la table faitsentrees est refseance + refjour + reftypespectateur + refsalle. Si la table SALLE représente un type de salle alors elle serait refseance + refjour
+ reftypespectateur + refsalle + refcinema. À noter que reffilm ne doit pas apparaı̂tre
dans la clé.
Q4 Estimez la taille de la table de faits.
taille de la table de faits sur quatre ans : 4x365 jours ; pour chaque jour, mille salles, dix
types de spectateur et cinq séances ; un enregistrement a une taille de 9x4 octets. Soit
4x365x1000x10x5x4x9 octets, soit environ 2,6 Gigaoctets.
Q5 L’entrepôt est géré par le centre de la chaı̂ne. Discutez des questions liées à l’alimentation
du magasin : rythme d’alimentation, données à transmettre, traitements à effectuer dans
chaque cinéma, contraintes pour le centre.
2
alimentation de l’entrepôt – le rythme sera journalier ou hebdomadaire. A priori le
rythme hebdomadaire semble suffisant car la programmation des cinémas est, en
général hebdomadaire. Si les analyses doivent influer sur la programmation, un rythme
journalier peut être pertinent. En effet, il s’agira d’étudier la fréquentation des premiers jours pour décider du maintien à l’affiche d’un film (ou le transfert dans une
autre salle).
– si le transfert est hebdomadaire, il faudra transmettre le numéro du jour en plus
des informations journalières. Chaque jour, il faut transmettre le nombre de places,
le prix de vente des places, le prix de revient des places pour chaque salle, chaque
séance et chaque type de spectateur ainsi que le film programmé.
– les calculs du nombre de places, prix de vente et prix de revient par salle, séance et
type de spectateur doivent être faits au niveau du cinéma.
– le centre doit gérer de façon centralisée les numéros de salle, les numéros de film. Ces
informations doivent être connues des centres. Les règles de calcul du prix de revient
font intervenir une partie propre au cinéma (ses frais de gestion) et venant du centre
(frais de gestion de la chaı̂ne, coût des films).
Q6 Décrire la dimension salle.
nom du champ type
numsalle entier
superficiesalle entier
nombresiègessalle entier
tailleécran entier
typeconfort integer
etc
Q7 Décrire la dimension cinéma.
nom du champ
numcinema
signification
clé primaire, identifie une salle de la chaı̂ne
superficie en m2
nombre de sièges
superficie en m2 de l’écran
niveau de confort entre 1 et 5
type
signification
entier
clé primaire, identifie un cinéma de la chaı̂ne
informations descriptives
texte
nom du cinéma
entier
numéro dans la rue
texte
nom de rue
nomcinéma
numruecinéma
nomruepointdevente
etc
informations géographiques administratives
nomquartier texte
nom du quartier
ville texte
ville du cinéma
département texte
département du cinéma
région texte
région administrative du cinéma
informations géographiques internes
régionchaine texte
région commerciale du cinéma
environnement du cinéma
grandeville texte
grande ville la plus proche
cinémaville ? booléen vrai si cinéma situé en centre ville
densitépopulation entier
mesure la densité de population
niveaupopulation entier
niveau social de la population
etc
aménagement et services
typecinema texte
type du cinéma
superficietotale réel
superficie en m2
superficieespaces réel
superficie en m2 hors salles
existebar ? booléen vrai si un bar existe dans l’enceinte
etc
Q8 Décrire la dimension film.
3
nom du champ type
signification
numfilm entier clé primaire, identifie un film
titrefilm texte titre du film en français
titreoriginalfilm texte titre original du film
metteurenscene texte nom du metteur en scene
metteurenscene2 texte nom du second metteur en scene si existe
acteurprincipal1 texte nom du premier acteur principal
acteurprincipal2 texte nom du second acteur principal
type film entier donne le type du film selon une codification
etc
Les autres dimensions sont :
– séance(numséance, heuredébutséance, heurefinséance, typeséance)
– jour(numjour,numérodujourdanslemois,numérodumois,année, jourférié ?, veillejourférié ?,
...)
– typespectateur(numtypespectateur,typespectateur, conditions)
Q9 Il a été choisi d’éclater la séance selon deux dimensions séance et jour. Critiquez ce
choix.
deux dimensions séance et jour Ce choix va permettre des analyses par séances indépendantes
des analyses par jour. Ce choix est pertienent si les séances des cinémas de toute la
chaı̂ne ont des horaires proches et la numérotation des séances est uniforme.
Q10 Les faits sont-ils additifs sur toutes les dimensions ?
faits additifs les faits sont additifs sur toutes les dimensions. Tout calcul de somme du nombre
de tickets, des prix de vente et de revient est pertinent pour des salles, des cinémas, des
films, des types de client, des sénaces et des périodes de temps.
Pour valider votre modèle, il reste à montrer que les analyses souhaitées par la direction de la
chaı̂ne sont réalisables.
Q11 Calculer la fréquentation par cinéma et par mois
calculer la somme du nombre de places avec un groupe par mois et par cinéma.
Q12 Comparer les cinémas en ville avec les cinémas en zone commerciale. Comment procéder ?
Le nombre de cinémas et leur capacité pouvant être différents, on comparera des fréquentation
moyennes, taux de remplissage, marges, ... selon le type de cinéma. On pourra ensuite
comparer ces quantités par type de film, par région, ...
Q13 Comparer les fréquentations en fonction des séances. Comment procéder ?
comparer les fréquentations moyennes, taux de remplissage en fonction du numéro de séance
dans le jour. On a supposé que les séances avaient une numérotation identique pour les
cinémas de la chaı̂ne.
Q14 On vous demande une étude sur le choix de programmation des films. Que pensez-vous
produire comme documents ?
produire sur la dernière année, un ensemble de tableaux et graphiques significatifs montrant
les des fréquentation moyennes, taux de remplissage, marges, ... selon le type de film,
l’acteur principal, ... On voit que le nombre d’analyses possible est important. Les techniques de fouille de données ont pour objectif d’extraire des données des informations
sur les films les plus intéressants (du point de vue de la chaı̂ne).
4

Documents pareils