CODAGE EN FORMAT CDA : SHAZAM

Transcription

CODAGE EN FORMAT CDA : SHAZAM
CI2 Comportement des systèmes numériques
CODAGE EN FORMAT CDA : SHAZAM
Problémat
ique
Comment identifier une musique à partir d’un échantillon ?
Mise en
situation
Vous lancez l’application Shazam à partir de votre téléphone. Quand l’application est ouverte, vous lancez
l’enregistrement du morceau en pointant votre téléphone (coté microphone !) vers la source sonore (enceinte
acoustique en général).
Une dizaine de seconde plus tard, un affichage vous annonce que le morceau est « tagué ». Si vous êtes connecté à
l’internet (ou 3G), Shazam recherche alors le morceau dans sa base de donnée à partir de l’échantillon enregistré. Si
vous n’êtes pas connecté, le morceau est gardé en mémoire dans votre téléphone intelligent et la recherche pourra
alors être lancée lors de la prochaine connexion.
Si le morceau est trop bruité ou indisponible dans la base de donnée Shazam, vous recevez un message vous le
signalant. Sinon c’est gagné : vous voyez s’afficher la photo de l’album dont est issu le morceau, le nom des
interprètes, le nom du compositeur, l’année de sortie, la maison de disque.
Shazam possède une banque de donnée regroupant 11 millions de morceau de musique de 3 minutes chacun (durée
référence retenue).
Chacun des 11 millions de morceau musicaux est codé selon une clef de reconnaissance appelée « empreinte du
morceau ». L’empreinte totale du morceau est réalisée à partir de 10 empreintes élémentaires par seconde. Le
principe de codage et de détermination des empreintes élémentaires n’est pas divulgué car breveté par la société.
Ces empreintes élémentaires sont issues du spectrogramme du morceau musical. Un spectrogramme est le
diagramme temps/fréquence. Elles sont déterminées à « certains points clef » du morceau musical : selon l’intensité
sonore, la répétabilité de ces points, etc. On y code la fréquence, l’intensité instantanée relative, la phase, l’instant
relatif, etc. Une empreinte élémentaire est codée sur 32 bits.
Questions
L’encodage numérique au format CDA (CD Audio), se fait avec une quantification N=16 bits, et une période
d’échantillonnage Te = 22,7 s, soit un découpage 44100 fois par seconde (appelée fréquence
d’échantillonnage, Fe=44100 Hz = 1/Te).
Q1 Combien de place mémoire (en kO) occupe 1 seconde de signal audio stéréo, numérisé de la
sorte ? Même question pour un morceau de musique de 3 minutes.
Q2 Déduire la durée de signal audio stéréo encodé en format CDA, sur un CD de 800 MO.
Q3 Combien de bits et sont « gravés » sur le CD ?
Mise en évidence du problème
Q4 Quelle est la durée musicale totale enregistrée dans la banque de donnée ? Utilisez une unité appropriée.
Q5 Exposez simplement le (gros) problème qui se pose pour la reconnaissance musicale.
Q6 Quel espace mémoire occupe 3 minutes de signal audio encodé au format CDA (Compact Disc Audio) ? Déduire la place
mémoire qu’occupent 11 millions de morceaux musicaux au format CDA.
Espace mémoire occupée par la base de données.
Q7 Combien d’empreintes élémentaires sont archivées dans la base de données ?
Q8 Calculez en Gigaoctets (Go) l’espace mémoire occupé dans la base de données Shazam par l’ensemble des empreintes
musicales. Qu’en pensez-vous ? Déduisez l’intérêt d’une reconnaissance audiophonique à partir d’empreintes plutôt
qu’avec un échantillon continu complet.
Echantillon prélevé (Durée de prélèvement référence de 10 s)
Q9 Combien d’empreintes élémentaires différentes, 32 bits permettent-ils de coder ? En comparant avec le nombre
d’empreintes élémentaires contenues dans la base de donnée : en moyenne, dans combien de morceaux de musique
différents peut se retrouver une même empreinte élémentaire ?
Le problème suivant à résoudre est que l’échantillon de morceau enregistré par l’utilisateur est bruité (bruit = signal parasite
perturbant l’information). Cela à cause du bruit environnant lors de l’enregistrement. C’est pour cela que Shazam compare bien plus
qu’une seule empreinte enregistrée avec les empreintes de sa base de données.
Q10 Combien d’empreintes élémentaires comporte l’échantillon sonore enregistré ? Quel espace mémoire occupe cet
échantillon ?
Q11 Vu le nombre d’empreintes de l’échantillon enregistré, combien de morceaux de musique sont « candidats » après
comparaison avec la base de donnée ?
EPILOGUE
l’algorithme de détermination des empreintes est suffisamment élaboré et caractérise le morceau de manière suffisamment fidèle
pour qu’on démontre la probabilité suivante : la probabilité pour que l’un des 400 morceaux suspectés à cause d'une empreinte
bruitée corresponde à l'un des 5 morceaux identifiés par une empreinte correcte (au morceau réel quoi) n’est que de 0,00004 (1
chance sur 25000) ! Ainsi si deux empreintes seulement correspondent à un même morceau, le morceau est le BON !
Denis Guérin
crédits : D Jolivet
1/1
TSI Eiffel Dijon

Documents pareils