LA VOIP

Transcription

LA VOIP
COURS VOIP
I. LA VOIP- LES FONDAMENTAUX
I.A. Introduction
La voix sur IP (Voice over IP) est une technologie de communication vocale en pleine
émergence. Elle fait partie d'un tournant dans le monde de la communication. En effet, la
convergence du triple play (voix, données et vidéo) fait partie des enjeux principaux des
acteurs de la télécommunication aujourd'hui.
Plus récemment l'Internet s'est étendu partiellement dans l'Intranet de chaque organisation,
voyant le trafic total basé sur un transport réseau de paquets IP surpasser le trafic traditionnel
du réseau voix (réseau à commutation de circuits). Il devenait clair que dans le sillage de cette
avancée technologique, les opérateurs, entreprises ou organisations et fournisseurs devaient,
pour bénéficier de l'avantage du transport unique IP, introduire de nouveaux services voix
et vidéo. Ce fût en 1996 la naissance de la première version voix sur IP appelée H323. Issu
de l'organisation de standardisation européenne ITU-T sur la base de la signalisation voix
RNIS (Q931), ce standard a maintenant donné suite à de nombreuses évolutions, quelques
nouveaux standards prenant d'autres orientations technologiques.
Pour être plus précis et néanmoins schématique, le signal numérique obtenu par numérisation
de la voix est découpé en paquets qui sont transmis sur un réseau IP vers une application qui
se chargera de la transformation inverse (des paquets vers la voix).
Au lieu de disposer à la fois d'un réseau informatique et d'un réseau téléphonique commuté
(RTC), l'entreprise peux donc, grâce à la VoIP, tout fusionner sur un même réseau.
Ca par du fait que la téléphonie devient de la "data". Les nouvelles capacités des réseaux à
haut débit devraient permettre de transférer de manière fiable des données en temps réel.
Ainsi, les applications de vidéo ou audioconférence ou de téléphonie vont envahir le monde
IP qui, jusqu'alors, ne pouvait raisonnablement pas supporter ce genre d'applications (temps
de réponse important, jigue-jitter, Cos-Qos,...). Jusque vers le milieu des années 90, les
organismes de normalisation ont tenté de transmettre les données de manière toujours plus
efficace sur des réseaux conçus pour la téléphonie.
A partir de cette date, il y a eu changement. C'est sur les réseaux de données, que l'on s'est
évertué à convoyer la parole. Il a donc fallu développer des algorithmes de codage audio
plus tolérants et introduire des mécanismes de contrôle de la qualité de service dans les
réseaux de données. Faire basculer différents types de données sur un même réseau permet en
plus, de simplifier son administration.
MASTER
18/05/2012
Page 1 - 33
I.B. Base Téléphonique
I.B.1. Principe du RTC
Le réseau téléphonique public (RTPC, Réseau Téléphonique Public Commuté ou simplement
RTC – PSTN (Public Switched Telephone Network) a essentiellement pour objet le transfert
de la voix. Le transport des données n'y est autorisé, en France, que depuis 1964. Utilisant le
principe de la commutation de circuits, il met en relation deux abonnés à travers une liaison
dédiée pendant tout l'échange.
Avant la convergence des réseaux
Annexe 1
Après la convergence des réseaux
Annexe 2
MASTER
18/05/2012
Page 2 - 33
I.C. La bande passante
La bande passante mesure une plage de fréquence contenue dans un signal.La fréquence est
mesurée en Hertz, ce qui simplifie le nombre d’ondulations par seconde.La plupart des sons
que vous entendez, y compris le son humain, sont composés de plusieurs ondulations
combinées. Actuellement, on supporte des fréquences entre 300 et 3400 Hz.
20.000 Hz
8.500 Hz
4.000 Hz
Phone(Téléphone)
Speech(Parole)
Hearing(Ecoute)
300 Hz
40 Hz
20 Hz
Numérisation de la voix se fait en plusieurs étapes :
I.D. Le lissage de la voix
La recommandation G711 de l’IUT-T définit les spécificités du traitement du signal de la
parole applicable au réseau téléphonique numérique. Ainsi d’après le théorème de Shannon, la
fréquence d’échantillonnage pour cheminer les 4 KHz du spectre en fréquence de la parole
(bande passante de 300 à 3400Hz) doit être de 8 KHz minimum. Cela correspond donc à un
échantillonnage toutes les 125 Microsecondes.
Chaque échantillon étant codé sur 8 bits, le début numérique équivalent à une conversation
téléphonique est de 64 Kbit/s.
I.E. Echantillonnage
Cela consiste à transformer un signal analogique (continu) en signal numérique, en capturant
des valeurs à intervalle de temps régulier (touts les 125 Microsecondes=1/8000).
Il est nécessaire de faire cette étape afin que le signal soit traité par l’autocommutateur
numérique. (Théorème de Nyguist)
I.F. Quantification
Cela consiste attribuer une valeur à une grandeur physique, prise dans un ensemble de
valeurs, dans le but de numériser une information analogique pour la traiter par
l’autocommutateur numérique
MASTER
18/05/2012
Page 3 - 33
I.G. Architecture des Switches Publiques
Annexe 3
On distingue :
Zone à Autonomie d'Acheminement (ZAA), cette zone, la plus basse de la
hiérarchie, comporte un ou plusieurs Commutateurs à Autonomie d'Acheminement
(CAA) qui eux-mêmes desservent des Commutateurs Locaux (CL). Les
commutateurs locaux ne sont que de simples concentrateurs de lignes auxquels sont
raccordés les abonnés finals. La ZAA (Zone à Autonomie d'Acheminement) est un
réseau étoilé, elle constitue le réseau de desserte;
Zone de Transit Secondaire (ZTS), cette zone comporte des Commutateurs de
Transit Secondaires (CTS). Il n'y a pas d'abonnés reliés aux CTS (Commutateurs de
Transit Secondaires). Ils assurent le brassage des circuits lorsqu'un CAA
(Commutateur à Autonomie d'Acheminement) ne peut atteindre le CAA destinataire
directement (réseau imparfaitement maillé);
Zone de Transit Principal (ZTP), cette zone assure la commutation des liaisons
longues distances. Chaque ZTP (Zone de Transit Principal) comprend un
Commutateur de Transit Principal (CTP), L'un des commutateurs de transit principal
(CTP) est relié au commutateur international de transit.
I.H. l’accès de base (S0/T0 : BRI : Basic Rate Input)
L’accès de base est composé d’une ligne numérique (2 fils métalliques) se terminant chez le
client, sur une TNR (Terminaison numérique de réseau)
Il permet d’établir 2 communications simultanées à 64 Kbits/s, canaux B, et d’utiliser un
canal à 16 Kbits/s, canal D, pour la signalisation
Coté réseau public, cet accès est donné par une interface T0, coté abonné par une interface S0.
T0=2canaux B + 1 canal D
2 ITs pour la voix + 1 It pour la canal D
=
2 ITs * 64Kbs + 16 Kbs
=
144Kbs
(La synchronisation se fait au moment de l’appel)
MASTER
18/05/2012
Page 4 - 33
I.I. l’accès primaire (E1/T2 : PRI : Primaire Rate Input)
L’accès primaire est composé de deux supports numériques(deux paires métalliques) se
terminant sur la terminaison numérique de ligne(TNL) qui offre la possibilité d’établir 30
communications simultanées à 64 Kbit/s, canaux B et d’utiliser un canal à 64 Kbit/s, canal D,
pour la signalisation.
30 Canaux B à 64 Kbit/s
1 canal D à 64 Kbit/s
30 ITs pour la voix + 1 It pour la canal D
=
30 ITs * 64Kbs + 1 IT 64 Kbs
=
2Mb/s
MASTER
18/05/2012
Page 5 - 33
I. LA VOIX SUR IP (VOIP)
Suite à l’explosion de la bande passante sur les réseaux IP et à l’évènement du haut débit chez
les particuliers, de nouvelles techniques de communications sont apparues ces dernières
années. L’une les plus en vogue actuellement, est ce que l’on appelle « Voix sur IP ».
I.J. Les enjeux
Réduction des coûts d’appel
Dans le cas d’une communication via IP, il n’est facturé en termes de téléphonie que la
transition sur les réseaux téléphoniques classiques. Ainsi que vous appeliez votre voisin ou
bien un client à l’autre bout du monde, il ne vous en coûtera que le prix d’une communication
locale. Ces solutions s’avèrent donc beaucoup plus avantageuses si vos appels téléphoniques
se font sur longue distance.
Mutualisation des réseaux, simplification de l’architecture
Le réseau téléphonique d’une entreprise qui a choisi la Voix sur IP est dorénavant géré
comme un réseau informatique. Il n’existe plus un réseau téléphonique et un réseau
informatique mais belle et bien, un système d’information dans sa globalité qui s’avère bien
plus facile à gérer
Convergence voix données
Les solutions de Messageries Unifiées (UM) facilitent l’interactivité avec l’usager. Les
téléphones peuvent maintenant appeler les Ordinateur et les ordinateurs appeler des
téléphones. Les communications (surtout nomades) s’en trouveront facilitées. La messagerie
comportera en plus des emails des messages enregistrés, la vidéo conférence se généralisera
également.
I.K. Généralités
Qu’appelle t’on voix sur IP ?
Le terme générique VoIP (Voice Over Internet Protocole) est souvent utilisé dans son
sens le plus général pour désigner toutes les solutions permettant le transport de la
parole sur un réseau IP.
On peut distinguer :
la voix sur IP : transport de la parole sur un réseau IP de type privé
(intranet/extranet).
la téléphonie sur IP : en plus de la parole, des fonctions téléphoniques
(signalisation, fax, multi appel) sur IP sont rajoutées.
MASTER
18/05/2012
Page 6 - 33
Il existe trois grandes familles de Voix sur IP
De poste informatique à poste informatique : Cela nécessite que les deux
interlocuteurs soient équipés informatiquement et dialoguent en utilisant de simples
applications genre « NetMeeting », « Skype » « GnomeMeeting » utilisant pour cela
un simple micro et des hauts parleurs. Ce genre de communication est gratuite
exception faite du coût du logiciel.
De Poste informatique à téléphone (ou vice-versa) : Cela nécessite la mise en œuvre
d’une passerelle soit au départ de l’appel soit a l’arrivée afin de faire transiter la
communication d’un réseau IP à un réseau téléphonique. L’appel est taxé uniquement
pour la traversée du réseau téléphonique. Ainsi, pour les appels internationaux, plus la
proportion du segment IP est grande, plus l’économie réalisée ne sera importante.
De téléphone à téléphone : Lorsque l’appelant et l’appelé sont tous les deux sur
téléphone, le réseau de transport devient transparent, cela nécessite la mise en œuvre
de plusieurs passerelles. La tarification dépend de l’opérateur, s’il s’agit d’un réseau
privé, c’est gratuit.
I.L. Les différentes architectures
Intérêt : Visio Conférence, les ordinateurs se connaissent par leurs adresses IP
MASTER
18/05/2012
Page 7 - 33
Intérêt : remplacement d’une ligne louée de type RNIS par une architecture réseau assurant
une qualité de service. Les téléphones classiques ne peuvent contacter les ordinateurs,
l’architecture téléphonique est globalement préservée
MASTER
18/05/2012
Page 8 - 33
Intérêts : la configuration ne se borne pas à l’interconnexion de PBX, tous les éléments
peuvent se contacter. Le réseau IP doit pouvoir supporter un certain niveau de qualité de
service
On peut séparer en deux parties la Voip
Le SIG PATH
Layer 2
IP
Transport
Session
IP
TCP
H323
Chemin de signalisation
Le MEDIA PATH
Layer 2
IP
Transport
Session
IP
UDP
RTP
Codec
Chemin data
II. STANDARDS VOIP
II.A.
Protocole H323
H323 est une suite protocolaire définissant un ensemble d’applications multimédias qui
s’appuient sur une infrastructure en mode paquet.
V1
V2
V3
V4
Approuvé en 1996
Approuvé en janvier 1998
Approuvé en octobre 1999
Approuvé en 2005
Attention : ces versions ne sont pas compatibles entre elles.
II.B.
Composant H323
L'infrastructure H.323 repose sur quatre briques principales : les terminaux, les Gateways, les
Gatekeepers, et les MCU (Multipoint Control Units).
Annexe 4
MASTER
18/05/2012
Page 9 - 33
Les terminaux : Représente un téléphone IP raccordé directement au réseau Ethernet de
l’entreprise ou alors un PC multimédia sur lequel est installé une application compatible
H 323.
Les passerelles (GW : Gateway) : Elles assurent l’interconnexion entre un réseau IP et le
réseau Téléphonique, ce dernier pouvant être soit le réseau téléphonique public, soit un Pabx
d’entreprise.
Elles assurent la correspondance de la signalisation et des signaux de contrôle et la cohésion
entre les médias.
Pour ce faire elles implémentent les fonctions suivantes :
Transcodage audio (compression – décompression)
Modulation et démodulation (fax)
Suppression d’échos
Suppression des silences et de contrôle d’appels.
Annexe 5
Les portiers (GK : GateKeeper) : ils sont des éléments optionnels dans une solution H 323.
Ils ont pour rôle de réaliser la traduction d’adresse (numéro de téléphone – adresse IP) et la
gestion des autorisations.
Donne ou non la permission d’effectuer un appel
De limiter la bande passante
De gérer le trafic sur le LAN
MASTER
18/05/2012
Page 10 - 33
Annexe 6
Les unités de contrôle multipoint (MCU : Multipoint Control Unit) : Référence au
protocole T 120 qui permet aux clients de se connecter aux sessions de conférences de
données. Les ponts de conférences permettant le service de conférence entre plusieurs
terminaux H.323.
Dans un contexte de téléphonie sur IP, la signalisation a pour objectif de réaliser les
fonctions suivantes :
Recherche et traduction d'adresses : Sur la base du numéro de téléphone du
destinataire, il s'agit de trouver son adresse IP (appel téléphone. PC) ou l'adresse IP de
la passerelle desservant le destinataire. Cette fonction est prise en charge par le
Gatekeeper
Contrôle d'appel : L'équipement terminal (« endpoint » = terminal H.323 ou
passerelle) situé à l'origine de l'appel établit une connexion avec l'équipement de
destination et échange avec lui les informations nécessaires à l'établissement de
l'appel. Dans le cas d'une passerelle, cette fonction implique également de supporter la
signalisation propre à l'équipement téléphonique à laquelle elle est raccordée
(signalisation analogique, Q.931, etc.) et de traduire cette signalisation dans le format
défini dans H.323. Le contrôle d'appel est pris en charge soit par les équipements
terminaux soit par le Gatekeeper. Dans ce cas, tous les messages de signalisation sont
routés via le Gatekeeper, ce dernier jouant alors un rôle similaire à celui d'un PBX
II.C.
H 323 Standard Chapeau
Annexe 7
ITU - H 323
H 225
Protocole type RNIS
Mise en place de l’appel
(Q931)
RAS
H 245
Négociations
Capacités du terminal
Port
Sélection des codecs
RTP
MASTER
18/05/2012
Média channel
Page 11 - 33
H 323 est un système de communication multimédia en mode paquet où le réseau ne peut pas
fournir de QoS.
C’est une extension du standard H 320, utilisé pour la vidéoconférence sur des réseaux
commutés.
Dans le standard H 323 sont compris H 225, H 245 et IETF RTP
II.D.
H323 adapté à IP
MEDIA PATH
Vidéo I/O
Equipement
Vidéo Codec
H261 H263
Audio I/O
Equipement
Audio Codec
G711, G722
G723,G723.1
G728, G729
User Data
Application
T120
RTP
UDP
RTCP
H225
Système
Control
H245
Control
IP
Layer
TCP
Call Control
H225
RAS
Control H225
UDP
SIG PATH
MASTER
18/05/2012
Page 12 - 33
II.E.
H323 dans le modèle OSI
Pour le contrôle et la signalisation : H 225, H245, Q931, RTCP
Pour la voix : G 711, G 722, G 723, G 726, G728, G729
Pour la vidéo : H 261, H 263, H 263+H 264
Pour les données : T 123, T 124, T 125
II.F.
Composant Mcu H 323
MCU
IP Network
MCU
MASTER
MC
Comment est
établi le flux
conférence
H 225
MP
Traitement
du flux
conférence
RTP
18/05/2012
H 245
RTCP
Page 13 - 33
Annexe 8
Les MCUs ont deux composantes. La composante qui contrôle le H225/H 245 est appelée le
contrôleur multipoint (MC – Multipoint Contrôleur).
La composante qui réalise la fonction de mixage est le processeur Multipoint (MP –
Multipoint Processor). Un MP est une composante optionnelle du MCU
Puisque les conférences H 323 peuvent intégrer de la voix, de la vidéo et des données T 120,
les MPs les plus puissants peuvent réaliser les trois. Il est aussi possible d’avoir un MP
uniquement voix ou un MP voix et vidéo.
II.G.
Les phases de communication
La communication s’effectue en 4 phases
1
Etablissement de l’appel
Q931/H225/RAS
2
Négociation des capacités
H245
3
Envoie du flux audio- video
4
Appel terminé
SIG PATH
RTP / RTCP
MEDIA PATH
Nota : La première porte ouverte et la dernière fermée
Annexe 9
II.H.
MASTER
Exemple d'un échange protocolaire H.323
18/05/2012
Page 14 - 33
La première phase se sert du protocole H.225/RAS. Le terminal qui lance l'établissement
d'appel (setup) requiert, au préalable, l'autorisation de la part du Gatekeeper. Ensuite, par
l'intermédiaire du protocole Q.931, il ouvre la connexion vers le partenaire. Le partenaire doit
également demander son admission au Gatekeeper, avant de confirmer l'établissement de
connexion. Lorsque les deux terminaux ont achevé la phase de connexion, une phase
d'échange de paramètres, basée sur H.245, se déroule. Aussitôt que le canal logique est
disponible, la communication audio et vidéo peut débuter. Elle utilise les protocoles RTP
(Real Time Protocol) et RTCP (Real Time Control Protocol).
Annexe 10
MASTER
18/05/2012
Page 15 - 33
III. PROTOCOLES RTP ET RTCP
III.A.
Architecture RTP
RTP (Real-time transport protocol) est conçu pour transporter des données en temps réel telles
que la voix ou la vidéo.
Plus généralement, RTP permet :
D'identifier le type de l'information transportée
D'ajouter des marqueurs temporels et des numéros de séquence l'information
transporte
De contrôler l'arrivée à destination des paquets.
De plus, RTP peut être véhiculé par des paquets multicast afin d'acheminer des conversations
vers des destinataires multiples.
III.B.
Commutation par paquets
Lors d’un transfert d’informations sur un réseau IP, ces informations sont découpées en
paquets qui peuvent suivre des chemins différents de l’émetteur vers le destinataire. Cela
s’appelle la commutation par paquets qui s’oppose à la commutation par circuits (un circuit
physique ou logique relie l’émetteur au destinataire).
Découper les données en paquets permet de multiplexer le flux. Les paquets provenant de
plusieurs sources différentes sont mélangés sur le réseau afin de pouvoir offrir plusieurs
connections sur un seul lien.
Le principal inconvénient du multiplexage est la gigue qu’il peut engendrer. Si tous les
créneaux créés par le multiplexage sont occupés, la source doit attendre qu’un de ces créneaux
soit libre. Dans le cadre d’une application comme la VoIP, cette attente se traduit par un
retard baptisé gigue (jitter en anglais).
Ce délai peut être variable mais doit être faible pour garantir une bonne qualité dans une
conversation VoIP. Lorsque la gigue devient trop importante, les conversations deviennent
hachées voire inintelligible. Les protocoles utilisés pour le transport de la VoIP se doivent
donc de prévoir et corriger cette gigue.
Le RTP (pour Real Time Protocole) dispose d’un mécanisme pour palier à ce défaut.
Annexe 11
Comme RTP est transporté sur UDP, aucun destinataire final ne sait si les paquets sont
délivrés. RTCP résout ce problème en fournissant des informations de contrôle sous forme de
rapport RTCP au destinataire. RTCP fourni également des informations sur l’émetteur, telles
que son nom, son numéro de téléphone…
MASTER
18/05/2012
Page 16 - 33
Annexe 12
Voice
Voice
RTP
Station 1
Station2
RTCP
H 323, SIP, Client
III.C.
QoS
Report
QoS
Report
H 323, SIP, Client
Numéro de ports RTP
Les ports RTP et RTCP sont consécutifs. Les numéros de ports sont généralement affectés
dynamiquement. Si aucun port RTP n’est affecté, les ports 5004 pour RTP et 5005 pour
RTCP le sont par défaut.
RTP ne sélectionne pas lui-même les ports RTP à utiliser pour mettre en place la session RTP.
Un protocole de signalisation comme H 323, SIP ou MGCP (Media Gateway Control
Protocol) est utilisé pour sélectionner les ports RTP et RTCP.
Port RTP : 16384 32768
Port RTCP : Port RTP +1
Station 1
Even
Port
Even
Port
RTP
Station2
RTCP
H 323, SIP, Client
Odd port
Odd port
H 323, SIP, Client
Annexe 12
MASTER
18/05/2012
Page 17 - 33
RTP supporte les conférences Unicast, Multicast et Mixer-controlled. Puisque RTP peut
fournir un identificateur de source contributive, il est possible d’identifier l’émetteur quand il
parle.
C’est intéressant dans une conférence téléphonique où vous parler avec plusieurs personnes et
vous ne savez pas qui vous parle.
Si vous avez besoin d’identifier la personne qui à parlé. RTP peut apporter une aide dans cette
situation car le champ « source contributive »identifiera celui qui a parlé.
III.D.
L’Entête RTP
Le protocole RTP utilise le protocole UDP pour le transport de données. Il rajoute à ce
protocole basique des fonctionnalités temporelles dédiées aux transmissions temps réelles.
On trouve notamment dans l’entête des informations sur le type de média transportés, le
séquencement et la synchronisation des datagrammes.
De telle façon, le récepteur peut déduire de ces informations la gigue produite par le transfert
et la corriger par l’usage de tampons.
Le récepteur peut aussi repérer les paquets arrivant dans le désordre et bien les replacer dans
le tampon.
L’en-tête RTP comporte les informations suivantes :
<--------------------------- 32 bits --------------------------->
V=2 P X
CC
M
PT
Sequence number
Timestamp
Identifiant de la source de synchronisation (SSRC)
Identifiants de la source de contribution (CSRC)
Le champ Version V de 2 bits de longueur indique la version du protocole (V=2)
Le champ padding P : 1 bit, si P est égal à 1, le paquet contient des octets
additionnels de bourrage (padding) pour finir le dernier paquet.
Le champ extension X : 1 bit, si X=1 l’en-tête est suivie d’un paquet d’extension
Le champ CSRC count CC : 4 bits, contient le nombre de CSRC qui suivent
l’entête
Le champ marker M : 1 bit, son interprétation est définie par un profil
d’application (profile)
Le champ payload type PT : 7 bits, ce champ identifie le type du payload (audio,
vidéo, image, texte, html, etc.)
Le champ séquence number : 16 bits, sa valeur initiale est aléatoire et il
s’incrémente de 1 à chaque paquet envoyé, il peut servir à détecter des paquets
perdus
Le champ timestamp : 32 bits, reflète l’instant où le premier octet du paquet RTP
à été échantillonné. Cet instant doit être dérivé d’une horloge qui augmente de
MASTER
18/05/2012
Page 18 - 33
façon monotone et linéaire dans le temps pour permettre la synchronisation et le
calcul de la gigue à la destination.
Le champ SSRC : 32 bits, identifie de manière unique la source, sa valeur est
choisie de manière aléatoire par l’application. Le SRRC est aussi lié aux rapports
RTCP qui sont générés périodiquement avec cette partie particulière.
Le champ CSRC : 32 bits, identifie les sources contribuant.
Annexe 14-15-16-17
IV. LE PROTOCOLE RTCP
RTCP (RTP Control Protocol) est conçu pour surveiller la qualité de service et transmettre
des informations sur les participants d’une session
Le protocole RTCP est complémentaire du protocole RTP dans le sens où il ne sers qu’à
transmettre à intervalles des paquets de contrôle contenant des statistiques et des informations
sur la session ouverte.
On peut notamment l’utiliser pour avertir de conditions de trafic réseau dégradées. Pendant
une session, tous les participants émettent des paquets RTCP. Les statistiques circulent sous
forme de rapports :
Les SR (Sender Report - rapport d’émetteur) et les RR (Receivers Report - rapport de
récepteur) contiennent par exemple le nombre de paquets envoyés depuis le début de la
session ou encore le nombre d’octets déjà envoyés ainsi que le taux de pertes.
V. COMPRESSION DE LA VOIX
Le transport de la voix sur un réseau IP nécessite au préalable tout ou une partie des étapes
suivantes :
Numérisation : dans le cas où les signaux téléphoniques à transmettre sont sous forme
analogique, ces derniers doivent d'abord être convertis sous forme numérique suivant
le format PCM (Pulse Code Modulation) à 64 Kbps. Si l'interface téléphonique est
numérique (accès RNIS, par exemple), cette fonction est omise.
Compression : le signal numérique PCM à 64 Kbps est compressé selon l'un des
formats de codec (compression / décompression) puis inséré dans des paquets IP. La
MASTER
18/05/2012
Page 19 - 33
fonction de codec est le plus souvent réalisée par un DSP (Digital Signal Processor).
Selon la bande passante à disposition, le signal voix peut également être transporté
dans son format originel à 64 Kbps.
Décompression : côté réception, les informations reçues sont décompressées .il est
nécessaire pour cela d'utiliser le même codec que pour la compression- puis
reconverties dans le format approprié pour le destinataire (analogique, PCM 64Kbps,
etc.).
L'objectif d'un codec est d'obtenir une bonne qualité de voix avec un débit et un délai de
compression le plus faibles possibles. Le coût du DSP est lié à la complexité du codec utilisé.
Le Tableau ci-dessous présente les caractéristiques des principaux codecs standards de l'UIT.
Les codecs les plus souvent mis en œuvre dans les solutions VoIP sont G.711, G.729 et
G.723.1.
V.A.
Le MOS (Mean Opinion Score)
La qualité d'un codec est mesurée de façon subjective en laboratoire par une population test
de personnes. Ces dernières écoutent tout un ensemble de conversations compressées selon les
différents Code.
Qualité de la parole
Excellente
Bonne
Correcte
Pauvre
Insuffisante
Score
5
4
3
2
1
Tableau de différents codecs Audio :
Codec
G.711
G.722
G.723
G.726
G.727
G.728
G.729
Bit Rate (Kbps)
64
48, 56 et 64
5,3 et 6,4
16, 24, 32, et 40
16-40
16
8
G.711 pour la voix (téléphonie standard ou RNIS, et VoIP),
•
Échantillonnage : 8000 Hz pour une bande passante du téléphone entre 300 et 3400 Hz
MASTER
18/05/2012
Page 20 - 33
•
•
Bande passante sur le réseau : 64 ou 56 kbit/s
Type de codage : MIC (Modulation d'impulsion codée)
Elle est la base de transport de la voix sur le numérique et continue d'être utilisée pour le
transport de la voix avec peu de compression, par exemple sur ISDN ou sur des réseaux
locaux IP. Elle sera peu utilisée sur des réseaux étendus comme Internet de part l'utilisation
importante de bande passante.
G.722 pour la voix large-bande
G.722 est une norme de compression audio de l'UIT-T. Apparentée à la famille des
recommandation G.7xx, G.722 concerne le transport de la voix en qualité "téléphonique".
Recommandation concernant les protocoles H.320 et H323 sur l'encodage audio pour la
téléphonie et la visioconférence.
•
•
Débits : 65 Kbps
Gammes de fréquences : 50 à 7000 Hz.
Tombée en désuétude, cette norme est à éviter dans de nouvelles implémentations. Il est
cependant toujours utilisé par certains opérateurs dans leurs offres voix sur accès haut débit
sur le marché résidentiel (ex. l'opérateur français Orange). Il impose généralement aux
abonnés d'acquérir un téléphone spécifique (ex. Live-Phone chez Orange), conçu pour la
bande élargie. La qualité audio large bande n'est en fait réellement disponible qu'entre lignes
IP natives, et non pour les appels Lignes IP - Ligne RTC.
G.723 pour la voix (VoIP)
G.726 pour la voix (téléphonie satellite, et VoIP), basé sur ADPCM
G.729 pour la voix (téléphonie de qualité, visionconférence, et VoIP)
Le codec G.729 est moins consommateur en bande passante que G.711. Il est utilisé pour
obtenir une téléphonie de qualité.
Le codec G.729 est :
•
•
Supporté par la plupart des PABX IP
Utilisé pour le codage de la partie audio d'une visioconférence,
Différents codecs Vidéo :
H.261 est une recommandation de compression vidéo de l'UIT-T. Elle fut notamment
popularisée par la console de jeu Playstation de Sony, qui l'intégra entièrement dans son
moteur de décompression de données. Les travaux sur la norme H.261 ont ultérieurement
servi de base à la norme MPEG.
H.263 est une recommandation concernant la norme de codage vidéo développée par l’UIT-T
Q.6/SG16.
MASTER
18/05/2012
Page 21 - 33
À l’origine, H.263 a été développé pour la transmission de la vidéo sur des lignes à très bas
débits, pour des applications de visiophonie via le réseau téléphonique commuté de type
H.324. Elle a ensuite été intégrée dans les protocoles de visioconférence sur IP du type H.323.
Au début d’une communication vidéo entre deux terminaux équipés de ce codec, ils
échangent leurs caractéristiques grâce au protocole H.245 et choisissent les modes de H.263
qu’ils utiliseront lors de la communication.
H.264 pour la visioconférence sur IP
Ce nouveau codec de compression vidéo est une évolution logique du MPEG4. L'H264
devrait améliorer le taux de compression tout en proposant une meilleure qualité d'affichage.
L'H264 devrait ainsi offrir un taux de compression de 2 à 3 fois plus élevé que le MPEG-2 et
de 1.5 à 2 fois plus élevé que le MPEG-4.
V.B.
LE QOS
Latence
La maîtrise du délai de transmission est un élément essentiel pour bénéficier d'un véritable
mode conversationnel et minimiser la perception d'écho (similaire aux désagréments causés
par les conversations par satellites, désormais largement remplacés par les câbles pour ce type
d'usage).
Or la durée de traversée d'un réseau IP dépend de nombreux facteurs:
Le débit de transmission sur chaque lien
Le nombre d'éléments réseaux traversés
Le temps de traversée de chaque élément, qui est lui même fonction de la puissance et
la charge de ce dernier, du temps de mise en file d'attente des paquets, et du temps
d'accès en sortie de l'élément
Le délai de propagation de l'information, qui est non négligeable si on communique à
l'opposé de la terre. Une transmission par fibre optique, à l'opposé de la terre, dure
environ 70 ms.
Noter que le temps de transport de l'information n'est pas le seul facteur responsable de la
durée totale de traitement de la parole. Le temps de codage et la mise en paquet de la voix
contribuent aussi de manière importante à ce délai.
Il est important de rappeler que sur les réseaux IP actuels (sans mécanismes de garantie de
qualité de service), chaque paquet IP « fait sont chemin » indépendamment des paquets qui le
précèdent ou le suivent: c'est ce qu'on appelle grossièrement le « Best effort » pour signifier
que le réseau ne contrôle rien. Ce fonctionnement est fondamentalement différent de celui du
réseau téléphonique où un circuit est établi pendant toute la durée de la communication.
MASTER
18/05/2012
Page 22 - 33
Les chiffres suivants (tirés de la recommandation UIT-T G114) sont donnés à titre indicatif
pour préciser les classes de qualité et d'interactivité en fonction du retard de transmission dans
une conversation téléphonique. Ces chiffres concernent le délai total de traitement, et pas
uniquement le temps de transmission de l'information sur le réseau.
Classe n°
1
2
3
4
Délai
0 à 150 ms
150 à 300 ms
300 à 700 ms
Au delà de 700
ms
Commentaires
Acceptable pour la plupart des conversations
Acceptable pour des communications faiblement interactives
Devient pratiquement une communication half duplex
Inutilisable sans une bonne pratique de la conversation half
duplex
En conclusion, on considère généralement que la limite supérieure "acceptable" , pour une
communication téléphonique, se situe entre 150 et 200 ms par sens de transmission (en
considérant à la fois le traitement de la voix et le délai d'acheminement).
VI. SIP
Session Initiation Protocol est un protocole normalisé et standardisé par IETF qui a été conçu
pour établir, modifier et terminer des sessions multimédia.
SIP n’est donc pas seulement destiné à la VoIP mais aussi à de nombreuses autres
applications telles que la visiophonie, la messagerie instantanée, la réalité virtuelle ou même
les jeux vidéo.
Il se charge de l'authentification et de la localisation des multiples participants.
Il se charge également de la négociation sur les types de média utilisables par les différents
participants en encapsulant des messages SDP (Session Description Protocol).
SIP ne transporte pas les données échangées durant la session comme la voix ou la vidéo.
SIP étant indépendant de la transmission des données, tout type de données et de protocoles
peut être utilisé pour cet échange.Cependant le protocole RTP (Real-time Transport Protocol)
assure le plus souvent les sessions audio et vidéo.
MASTER
18/05/2012
Page 23 - 33
SIP remplace progressivement H.323 et s’appui sur le protocole TCP/IP. Il peut aussi bien
utiliser TCP qu’UDP.
H.323 a été un protocole pionnier de la téléphonie sur IP, émanant des instances du monde
des télécommunications (UIT ou ITU). SIP, de conception un peu plus récente, vient du
monde de l'Internet (IETF) et s'intègre sans doute un peu mieux sur les réseaux IP.
VI.A.
Fonctionnement
SIP partage de nombreuses similitudes avec le protocole HTTP comme le codage en ASCII et
les codes de réponse.
Le client envoie des requêtes au serveur, qui lui renvoie une réponse. Les méthodes de base
sont :
INVITE permet à un client de demander une nouvelle session
ACK confirme l'établissement de la session
CANCEL annule un INVITE en suspens
BYE termine une session en cours
Les codes de réponse sont similaires à HTTP.
•
•
•
100 Trying
200 OK
404 Not Found
Annexe 18
VI.B.
SIP et les autres protocoles
But
Ces protocoles émettent un
appel de l’appelant vers
l’appelé d’un autre réseau
L’appelant (tél ou PC)
sonne
L’appelant décroche
L’appelant ou l’appelé
raccroche
MASTER
ISDN- Q931
H 323
SIP
MGCP
SETUP
SETUP
INVITE
ADD
ALERTING
ALERTING
180
NODIFY
CONNECT
DISCONNECT
CONNECT
RELEASE
200
BYE
NOTIFY
SUBTRACT
18/05/2012
Page 24 - 33
L’appelant ou l’appelé
confirme la fin de l’appel
Code spécifique à SIP : 180
VI.C.
RELEASE
COMPLETE
TCP ACK
200
ACK
RINGING
Les phases de communication de SIP
IETF SIP
ITU H 323
SIP
SDP
RTP
RTCP
H 225, RAS
H 245
RTP
RTCP
Annexe 19
SIP : Session Initiation Protocol ; RFC 3261
SDP : Session Description Protocol ; RFC 2327
Il fournit la description d’une session, c'est-à-dire les paramètres utilisés dans une
communication SIP
RTP : Real Time Transport Protocol ; RFC 1889
RTSP : Real Time Streaming Protocol ; RFC 2326
Il permet de contrôler la diffusion de flux multimédia en temps réel
VI.D.
Les entités SIP
User Agent :
Serveur Registrar :
Les Users agents SIP s’enregistrent avec leur réseau initial en envoyant le message
REGISTER
Serveur Proxy :
Il assure que la demande a bien été envoyée vers la plus proche entité.
Handles registrations
Implémente call-routing policies
Gére l’authnetigication et l’autorisation des accès
Serveur Redirect :
Il accepte les demandes SIP
Il oriente les demandes pour la destination finale en leur indiquant leur location
(adresse IP ou par nom)
Location serveur :
MASTER
18/05/2012
Page 25 - 33
Il contient la table d’allocation de routage pour diriger le User vers le bon serveur pour
trouver le média
Annexe 20
VI.E.
Les Users Agents
Les User Agents désignent les agents que l'on retrouve dans les téléphones SIP, les softphones
(logiciels de téléphonie sur IP) des ordinateurs et PDA ou les passerelles SIP.
En théorie, on peut établir des sessions directement entre deux User Agents, deux téléphones
par exemple. Mais cela nécessite de connaître l'adresse IP du destinataire.
Cela n'est pas l'idéal car une adresse IP peut ne pas être publique (derrière un NAT) ou
changer et elle est bien plus compliquée à retenir qu'une URI (Uniform Resource Identifier).
Les User Agents peuvent donc s'enregistrer auprès de Registrars pour signaler leur
emplacement courant, c’est-à-dire leur adresse IP.
Un agent joue habituellement à la fois le rôle de client et serveur. C’est-à-dire qu'il peut aussi
bien envoyer des requêtes, que répondre à celles qu'il reçoit.
VI.F.
Serveur Registrar
Le Registrar est un serveur qui gère les requêtes REGISTER envoyées par les Users Agents
pour signaler leur emplacement courant. Ces requêtes contiennent donc une adresse IP,
associée à une URI, qui seront stockées dans une base de données.
Les URI SIP sont très similaires dans leur forme à des adresses email :
sip:[email protected] (Uniform ressource indicators)
Généralement, des mécanismes d'authentification permettent d'éviter que quiconque puisse
s'enregistrer avec n'importe quelle URI.
MASTER
18/05/2012
Page 26 - 33
Annexe 21
VI.G.
SIP –URI
Un SIP URI est un système d’adressage SIP pour appeler une autre personne via SIP.
En d’autres termes, un SIP URI est le numéro de téléphone SIP d’un utilisateur.
Le SIP URI ressemble à une adresse email et se présente sous le format suivant :
SIP URI = sip:x@y:Port
x=nom d’utilisateur et y=hôte (domaine ou IP)
Exemples :
sip:[email protected]
sip:[email protected]
sip:[email protected]
VI.H.
Serveur Proxy
Un Proxy SIP sert d'intermédiaire entre deux User Agents qui ne connaissent pas leurs
emplacements respectifs (adresse IP).
En effet, l'association URI-Adresse IP a été stockée préalablement dans une base de données
par un Registrar. Le Proxy peut donc interroger cette base de données pour diriger les
messages vers le destinataire.
VI.I.
Session SIP à travers un Proxy
Le Proxy se contente de relayer uniquement les messages SIP pour établir, contrôler et
terminer la session.
MASTER
18/05/2012
Page 27 - 33
Une fois la session établie, les données, par exemple un flux RTP pour la VoIP, ne transitent
pas par le serveur Proxy. Elles sont échangées directement entre les User Agents.
Interprétation des codes :
100 TRYING
Tentative d’appel en cours
180 RINGING
la poste de l’appelé est en train de sonner
200 OK
Message de succès, la requête a été reçue, comprise et acceptée par le serveur
Annexe 22
Déroulement d’un Appel basique :
Poste A
Poste B
Message Invite le poste
+ SDP poste A
180 Ringing
200 OK + SDP poste B
ACK
MASTER
Flux RTP
18/05/2012
Page 28 - 33
BYE
200 OK
ACK
VI.J.
Aspects du marché
Le SIP a maintenant été adopté par tous les grands acteurs de l'industrie en tant que protocole
de choix pour l'évolution des réseaux. Tendance clairement établie à l'échelle mondiale depuis
2003-2004.
•
•
•
•
•
Retenu par les acteurs du marché de la visioconférence
(TANDBERG,CODIAN,POLYCOM) pour assurer des niveaux de convergence avec
des acteurs comme Microsoft (OCS), IBM, Cisco.
Retenu par AOL, Yahoo, Microsoft, Wanadoo, Orange, Iliad, etc.
Retenu par Microsoft pour MSN et Microsoft Office Live Communication Server
(LCS / OCS)
Retenu par tous les grands fournisseurs traditionnels de PABX: Alcatel-Lucent,Nortel,
Cisco, huawei, Ericsson, Siemens, etc.
Retenu dans les architectures Voix sur IP de convergence fixe mobile où les services
de présence sont une exigence forte.
MASTER
18/05/2012
Page 29 - 33
VII.
MGCP
Les protocoles SIP et H.323 ont la particularité d’être des protocoles architecturés en mode
peer to peer, cela signifie que chaque terminal est indépendant et est donc capable de gérer
directement les appels et les services associés.
Les terminaux SIP/H.323 ont donc la particularité d’être autonome tout comme le sont les
terminaux ISDN dans un réseau TDM.
Cependant en regardant les tendances et attentes des entreprises en matière de
télécommunication on constate que très peu de ces terminaux autonomes (ISDN) sont utilisés
dans un réseau.
La plupart des postes téléphoniques clients sont des postes simples (analogiques) n’assurant
que les fonctions d’appels de bases et qui sont eux-mêmes contrôlés par commutateur (ex :
PABX) pour la gestion des services spécifiques des appels.
Ainsi il était important d’avoir un protocole VoIP capable de fonctionner de la même façon
afin de pouvoir laisser le contrôle des fonctionnalités à l’operateur et délivrer que les services
de base (appel, décroché, raccroché) coté abonné.
MGCP (Media Gateway Control Protocol), se différencie donc de SIP et H.323 par son
architecture CLIENT / SERVEUR ou plus précisément Maitre /esclave.
Ainsi la gestion des services d’appels est centralisée et assuré coté maitre tandis que les
terminaux coté clients ne gèrent que les fonctionnalités basiques d’appels et vont recevoir les
instructions du maitre.
Ce type de fonctionnement est très utile dans un environnement où l’opérateur désire garder le
contrôle des services sur l’abonné (ce dernier a en effet qu’un poste uniquement capable de
recevoir les instructions de l’opérateur).Ex : un abonné résidentiel, offre de service de classe 5
ou type IPCENTREX (cf partie application).
VII.A.
Architecture du protocole MGCP
L’architecture du protocole MGCP repose donc sur 2 entités :
Les terminaux MGCP situés coté client sont des passerelles chargé de recevoir et rapporter
les instructions du contrôleur central (call agent).
Le Call agent est le « chef d’orchestre » du réseau MGCP, il va se charger de commander les
fournir des instructions aux passerelles MGCP.
Le call agent et les terminaux vont communiquer via des échanges de transactions en utilisant
le port UDP 2727 (call agent) et 2427 (terminaux).
Les flux voix sont gérés également par le protocole RTP/RTCP comme en SIP et H.323
MASTER
18/05/2012
Page 30 - 33
Il est important de préciser que MGCP est un protocole dédié a l’interconnexion des
terminaux IP et PSTN, ainsi au sein du cœur de réseau, il est tout a fait possible d’utiliser les
protocoles H.323 ou SIP pour les interconnexions, MGCP n’intervenant que sur la bordure du
cœur de réseau.
MASTER
18/05/2012
Page 31 - 33
VII.B.
L'avenir de MGCP.
MGCP se différencie essentiellement de SIP et H.323 par une réelle architecture client
serveur, qui permet de centraliser les services et contrôles coté opérateurs.
Ce protocole est donc destinés aux opérateurs souhaitant garantir un contrôle des terminaux et
dont le fonctionnement serait totalement transparent coté abonné.
Sa robustesse de fonctionnement (MGCP est moins bugué que SIP du fait que les
fonctionnalités de ce protocoles aient étés bien étudiés) et ses caractéristiques ont fait que de
nos jours la quasi-totalité des offres de téléphonie sur internet destinés aux particuliers sont
basés sur ce protocole (offre triple-play et box des FAI Français.).
Le succès et l’engouement des offres de téléphonie illimitées obligent donc les FAI à
concevoir une offre similaire que leur concurrents et donc à investir dans une architecture
similaire.
MGCP est aussi au cœur des infrastructures IPCENTREX (cf. chapitres applications) bien
que très récemment, des solutions CENTREX ont vu le jour basées sur le protocole SIP.
Contrairement à H.323, MGCP souffre moins de la concurrence de SIP et a encore de beau
jours devant lui notamment grâce au formidable essor des offres de dégroupages vendu par les
FAI Français.
MASTER
18/05/2012
Page 32 - 33

Documents pareils