LA VOIP
Transcription
LA VOIP
COURS VOIP I. LA VOIP- LES FONDAMENTAUX I.A. Introduction La voix sur IP (Voice over IP) est une technologie de communication vocale en pleine émergence. Elle fait partie d'un tournant dans le monde de la communication. En effet, la convergence du triple play (voix, données et vidéo) fait partie des enjeux principaux des acteurs de la télécommunication aujourd'hui. Plus récemment l'Internet s'est étendu partiellement dans l'Intranet de chaque organisation, voyant le trafic total basé sur un transport réseau de paquets IP surpasser le trafic traditionnel du réseau voix (réseau à commutation de circuits). Il devenait clair que dans le sillage de cette avancée technologique, les opérateurs, entreprises ou organisations et fournisseurs devaient, pour bénéficier de l'avantage du transport unique IP, introduire de nouveaux services voix et vidéo. Ce fût en 1996 la naissance de la première version voix sur IP appelée H323. Issu de l'organisation de standardisation européenne ITU-T sur la base de la signalisation voix RNIS (Q931), ce standard a maintenant donné suite à de nombreuses évolutions, quelques nouveaux standards prenant d'autres orientations technologiques. Pour être plus précis et néanmoins schématique, le signal numérique obtenu par numérisation de la voix est découpé en paquets qui sont transmis sur un réseau IP vers une application qui se chargera de la transformation inverse (des paquets vers la voix). Au lieu de disposer à la fois d'un réseau informatique et d'un réseau téléphonique commuté (RTC), l'entreprise peux donc, grâce à la VoIP, tout fusionner sur un même réseau. Ca par du fait que la téléphonie devient de la "data". Les nouvelles capacités des réseaux à haut débit devraient permettre de transférer de manière fiable des données en temps réel. Ainsi, les applications de vidéo ou audioconférence ou de téléphonie vont envahir le monde IP qui, jusqu'alors, ne pouvait raisonnablement pas supporter ce genre d'applications (temps de réponse important, jigue-jitter, Cos-Qos,...). Jusque vers le milieu des années 90, les organismes de normalisation ont tenté de transmettre les données de manière toujours plus efficace sur des réseaux conçus pour la téléphonie. A partir de cette date, il y a eu changement. C'est sur les réseaux de données, que l'on s'est évertué à convoyer la parole. Il a donc fallu développer des algorithmes de codage audio plus tolérants et introduire des mécanismes de contrôle de la qualité de service dans les réseaux de données. Faire basculer différents types de données sur un même réseau permet en plus, de simplifier son administration. MASTER 18/05/2012 Page 1 - 33 I.B. Base Téléphonique I.B.1. Principe du RTC Le réseau téléphonique public (RTPC, Réseau Téléphonique Public Commuté ou simplement RTC – PSTN (Public Switched Telephone Network) a essentiellement pour objet le transfert de la voix. Le transport des données n'y est autorisé, en France, que depuis 1964. Utilisant le principe de la commutation de circuits, il met en relation deux abonnés à travers une liaison dédiée pendant tout l'échange. Avant la convergence des réseaux Annexe 1 Après la convergence des réseaux Annexe 2 MASTER 18/05/2012 Page 2 - 33 I.C. La bande passante La bande passante mesure une plage de fréquence contenue dans un signal.La fréquence est mesurée en Hertz, ce qui simplifie le nombre d’ondulations par seconde.La plupart des sons que vous entendez, y compris le son humain, sont composés de plusieurs ondulations combinées. Actuellement, on supporte des fréquences entre 300 et 3400 Hz. 20.000 Hz 8.500 Hz 4.000 Hz Phone(Téléphone) Speech(Parole) Hearing(Ecoute) 300 Hz 40 Hz 20 Hz Numérisation de la voix se fait en plusieurs étapes : I.D. Le lissage de la voix La recommandation G711 de l’IUT-T définit les spécificités du traitement du signal de la parole applicable au réseau téléphonique numérique. Ainsi d’après le théorème de Shannon, la fréquence d’échantillonnage pour cheminer les 4 KHz du spectre en fréquence de la parole (bande passante de 300 à 3400Hz) doit être de 8 KHz minimum. Cela correspond donc à un échantillonnage toutes les 125 Microsecondes. Chaque échantillon étant codé sur 8 bits, le début numérique équivalent à une conversation téléphonique est de 64 Kbit/s. I.E. Echantillonnage Cela consiste à transformer un signal analogique (continu) en signal numérique, en capturant des valeurs à intervalle de temps régulier (touts les 125 Microsecondes=1/8000). Il est nécessaire de faire cette étape afin que le signal soit traité par l’autocommutateur numérique. (Théorème de Nyguist) I.F. Quantification Cela consiste attribuer une valeur à une grandeur physique, prise dans un ensemble de valeurs, dans le but de numériser une information analogique pour la traiter par l’autocommutateur numérique MASTER 18/05/2012 Page 3 - 33 I.G. Architecture des Switches Publiques Annexe 3 On distingue : Zone à Autonomie d'Acheminement (ZAA), cette zone, la plus basse de la hiérarchie, comporte un ou plusieurs Commutateurs à Autonomie d'Acheminement (CAA) qui eux-mêmes desservent des Commutateurs Locaux (CL). Les commutateurs locaux ne sont que de simples concentrateurs de lignes auxquels sont raccordés les abonnés finals. La ZAA (Zone à Autonomie d'Acheminement) est un réseau étoilé, elle constitue le réseau de desserte; Zone de Transit Secondaire (ZTS), cette zone comporte des Commutateurs de Transit Secondaires (CTS). Il n'y a pas d'abonnés reliés aux CTS (Commutateurs de Transit Secondaires). Ils assurent le brassage des circuits lorsqu'un CAA (Commutateur à Autonomie d'Acheminement) ne peut atteindre le CAA destinataire directement (réseau imparfaitement maillé); Zone de Transit Principal (ZTP), cette zone assure la commutation des liaisons longues distances. Chaque ZTP (Zone de Transit Principal) comprend un Commutateur de Transit Principal (CTP), L'un des commutateurs de transit principal (CTP) est relié au commutateur international de transit. I.H. l’accès de base (S0/T0 : BRI : Basic Rate Input) L’accès de base est composé d’une ligne numérique (2 fils métalliques) se terminant chez le client, sur une TNR (Terminaison numérique de réseau) Il permet d’établir 2 communications simultanées à 64 Kbits/s, canaux B, et d’utiliser un canal à 16 Kbits/s, canal D, pour la signalisation Coté réseau public, cet accès est donné par une interface T0, coté abonné par une interface S0. T0=2canaux B + 1 canal D 2 ITs pour la voix + 1 It pour la canal D = 2 ITs * 64Kbs + 16 Kbs = 144Kbs (La synchronisation se fait au moment de l’appel) MASTER 18/05/2012 Page 4 - 33 I.I. l’accès primaire (E1/T2 : PRI : Primaire Rate Input) L’accès primaire est composé de deux supports numériques(deux paires métalliques) se terminant sur la terminaison numérique de ligne(TNL) qui offre la possibilité d’établir 30 communications simultanées à 64 Kbit/s, canaux B et d’utiliser un canal à 64 Kbit/s, canal D, pour la signalisation. 30 Canaux B à 64 Kbit/s 1 canal D à 64 Kbit/s 30 ITs pour la voix + 1 It pour la canal D = 30 ITs * 64Kbs + 1 IT 64 Kbs = 2Mb/s MASTER 18/05/2012 Page 5 - 33 I. LA VOIX SUR IP (VOIP) Suite à l’explosion de la bande passante sur les réseaux IP et à l’évènement du haut débit chez les particuliers, de nouvelles techniques de communications sont apparues ces dernières années. L’une les plus en vogue actuellement, est ce que l’on appelle « Voix sur IP ». I.J. Les enjeux Réduction des coûts d’appel Dans le cas d’une communication via IP, il n’est facturé en termes de téléphonie que la transition sur les réseaux téléphoniques classiques. Ainsi que vous appeliez votre voisin ou bien un client à l’autre bout du monde, il ne vous en coûtera que le prix d’une communication locale. Ces solutions s’avèrent donc beaucoup plus avantageuses si vos appels téléphoniques se font sur longue distance. Mutualisation des réseaux, simplification de l’architecture Le réseau téléphonique d’une entreprise qui a choisi la Voix sur IP est dorénavant géré comme un réseau informatique. Il n’existe plus un réseau téléphonique et un réseau informatique mais belle et bien, un système d’information dans sa globalité qui s’avère bien plus facile à gérer Convergence voix données Les solutions de Messageries Unifiées (UM) facilitent l’interactivité avec l’usager. Les téléphones peuvent maintenant appeler les Ordinateur et les ordinateurs appeler des téléphones. Les communications (surtout nomades) s’en trouveront facilitées. La messagerie comportera en plus des emails des messages enregistrés, la vidéo conférence se généralisera également. I.K. Généralités Qu’appelle t’on voix sur IP ? Le terme générique VoIP (Voice Over Internet Protocole) est souvent utilisé dans son sens le plus général pour désigner toutes les solutions permettant le transport de la parole sur un réseau IP. On peut distinguer : la voix sur IP : transport de la parole sur un réseau IP de type privé (intranet/extranet). la téléphonie sur IP : en plus de la parole, des fonctions téléphoniques (signalisation, fax, multi appel) sur IP sont rajoutées. MASTER 18/05/2012 Page 6 - 33 Il existe trois grandes familles de Voix sur IP De poste informatique à poste informatique : Cela nécessite que les deux interlocuteurs soient équipés informatiquement et dialoguent en utilisant de simples applications genre « NetMeeting », « Skype » « GnomeMeeting » utilisant pour cela un simple micro et des hauts parleurs. Ce genre de communication est gratuite exception faite du coût du logiciel. De Poste informatique à téléphone (ou vice-versa) : Cela nécessite la mise en œuvre d’une passerelle soit au départ de l’appel soit a l’arrivée afin de faire transiter la communication d’un réseau IP à un réseau téléphonique. L’appel est taxé uniquement pour la traversée du réseau téléphonique. Ainsi, pour les appels internationaux, plus la proportion du segment IP est grande, plus l’économie réalisée ne sera importante. De téléphone à téléphone : Lorsque l’appelant et l’appelé sont tous les deux sur téléphone, le réseau de transport devient transparent, cela nécessite la mise en œuvre de plusieurs passerelles. La tarification dépend de l’opérateur, s’il s’agit d’un réseau privé, c’est gratuit. I.L. Les différentes architectures Intérêt : Visio Conférence, les ordinateurs se connaissent par leurs adresses IP MASTER 18/05/2012 Page 7 - 33 Intérêt : remplacement d’une ligne louée de type RNIS par une architecture réseau assurant une qualité de service. Les téléphones classiques ne peuvent contacter les ordinateurs, l’architecture téléphonique est globalement préservée MASTER 18/05/2012 Page 8 - 33 Intérêts : la configuration ne se borne pas à l’interconnexion de PBX, tous les éléments peuvent se contacter. Le réseau IP doit pouvoir supporter un certain niveau de qualité de service On peut séparer en deux parties la Voip Le SIG PATH Layer 2 IP Transport Session IP TCP H323 Chemin de signalisation Le MEDIA PATH Layer 2 IP Transport Session IP UDP RTP Codec Chemin data II. STANDARDS VOIP II.A. Protocole H323 H323 est une suite protocolaire définissant un ensemble d’applications multimédias qui s’appuient sur une infrastructure en mode paquet. V1 V2 V3 V4 Approuvé en 1996 Approuvé en janvier 1998 Approuvé en octobre 1999 Approuvé en 2005 Attention : ces versions ne sont pas compatibles entre elles. II.B. Composant H323 L'infrastructure H.323 repose sur quatre briques principales : les terminaux, les Gateways, les Gatekeepers, et les MCU (Multipoint Control Units). Annexe 4 MASTER 18/05/2012 Page 9 - 33 Les terminaux : Représente un téléphone IP raccordé directement au réseau Ethernet de l’entreprise ou alors un PC multimédia sur lequel est installé une application compatible H 323. Les passerelles (GW : Gateway) : Elles assurent l’interconnexion entre un réseau IP et le réseau Téléphonique, ce dernier pouvant être soit le réseau téléphonique public, soit un Pabx d’entreprise. Elles assurent la correspondance de la signalisation et des signaux de contrôle et la cohésion entre les médias. Pour ce faire elles implémentent les fonctions suivantes : Transcodage audio (compression – décompression) Modulation et démodulation (fax) Suppression d’échos Suppression des silences et de contrôle d’appels. Annexe 5 Les portiers (GK : GateKeeper) : ils sont des éléments optionnels dans une solution H 323. Ils ont pour rôle de réaliser la traduction d’adresse (numéro de téléphone – adresse IP) et la gestion des autorisations. Donne ou non la permission d’effectuer un appel De limiter la bande passante De gérer le trafic sur le LAN MASTER 18/05/2012 Page 10 - 33 Annexe 6 Les unités de contrôle multipoint (MCU : Multipoint Control Unit) : Référence au protocole T 120 qui permet aux clients de se connecter aux sessions de conférences de données. Les ponts de conférences permettant le service de conférence entre plusieurs terminaux H.323. Dans un contexte de téléphonie sur IP, la signalisation a pour objectif de réaliser les fonctions suivantes : Recherche et traduction d'adresses : Sur la base du numéro de téléphone du destinataire, il s'agit de trouver son adresse IP (appel téléphone. PC) ou l'adresse IP de la passerelle desservant le destinataire. Cette fonction est prise en charge par le Gatekeeper Contrôle d'appel : L'équipement terminal (« endpoint » = terminal H.323 ou passerelle) situé à l'origine de l'appel établit une connexion avec l'équipement de destination et échange avec lui les informations nécessaires à l'établissement de l'appel. Dans le cas d'une passerelle, cette fonction implique également de supporter la signalisation propre à l'équipement téléphonique à laquelle elle est raccordée (signalisation analogique, Q.931, etc.) et de traduire cette signalisation dans le format défini dans H.323. Le contrôle d'appel est pris en charge soit par les équipements terminaux soit par le Gatekeeper. Dans ce cas, tous les messages de signalisation sont routés via le Gatekeeper, ce dernier jouant alors un rôle similaire à celui d'un PBX II.C. H 323 Standard Chapeau Annexe 7 ITU - H 323 H 225 Protocole type RNIS Mise en place de l’appel (Q931) RAS H 245 Négociations Capacités du terminal Port Sélection des codecs RTP MASTER 18/05/2012 Média channel Page 11 - 33 H 323 est un système de communication multimédia en mode paquet où le réseau ne peut pas fournir de QoS. C’est une extension du standard H 320, utilisé pour la vidéoconférence sur des réseaux commutés. Dans le standard H 323 sont compris H 225, H 245 et IETF RTP II.D. H323 adapté à IP MEDIA PATH Vidéo I/O Equipement Vidéo Codec H261 H263 Audio I/O Equipement Audio Codec G711, G722 G723,G723.1 G728, G729 User Data Application T120 RTP UDP RTCP H225 Système Control H245 Control IP Layer TCP Call Control H225 RAS Control H225 UDP SIG PATH MASTER 18/05/2012 Page 12 - 33 II.E. H323 dans le modèle OSI Pour le contrôle et la signalisation : H 225, H245, Q931, RTCP Pour la voix : G 711, G 722, G 723, G 726, G728, G729 Pour la vidéo : H 261, H 263, H 263+H 264 Pour les données : T 123, T 124, T 125 II.F. Composant Mcu H 323 MCU IP Network MCU MASTER MC Comment est établi le flux conférence H 225 MP Traitement du flux conférence RTP 18/05/2012 H 245 RTCP Page 13 - 33 Annexe 8 Les MCUs ont deux composantes. La composante qui contrôle le H225/H 245 est appelée le contrôleur multipoint (MC – Multipoint Contrôleur). La composante qui réalise la fonction de mixage est le processeur Multipoint (MP – Multipoint Processor). Un MP est une composante optionnelle du MCU Puisque les conférences H 323 peuvent intégrer de la voix, de la vidéo et des données T 120, les MPs les plus puissants peuvent réaliser les trois. Il est aussi possible d’avoir un MP uniquement voix ou un MP voix et vidéo. II.G. Les phases de communication La communication s’effectue en 4 phases 1 Etablissement de l’appel Q931/H225/RAS 2 Négociation des capacités H245 3 Envoie du flux audio- video 4 Appel terminé SIG PATH RTP / RTCP MEDIA PATH Nota : La première porte ouverte et la dernière fermée Annexe 9 II.H. MASTER Exemple d'un échange protocolaire H.323 18/05/2012 Page 14 - 33 La première phase se sert du protocole H.225/RAS. Le terminal qui lance l'établissement d'appel (setup) requiert, au préalable, l'autorisation de la part du Gatekeeper. Ensuite, par l'intermédiaire du protocole Q.931, il ouvre la connexion vers le partenaire. Le partenaire doit également demander son admission au Gatekeeper, avant de confirmer l'établissement de connexion. Lorsque les deux terminaux ont achevé la phase de connexion, une phase d'échange de paramètres, basée sur H.245, se déroule. Aussitôt que le canal logique est disponible, la communication audio et vidéo peut débuter. Elle utilise les protocoles RTP (Real Time Protocol) et RTCP (Real Time Control Protocol). Annexe 10 MASTER 18/05/2012 Page 15 - 33 III. PROTOCOLES RTP ET RTCP III.A. Architecture RTP RTP (Real-time transport protocol) est conçu pour transporter des données en temps réel telles que la voix ou la vidéo. Plus généralement, RTP permet : D'identifier le type de l'information transportée D'ajouter des marqueurs temporels et des numéros de séquence l'information transporte De contrôler l'arrivée à destination des paquets. De plus, RTP peut être véhiculé par des paquets multicast afin d'acheminer des conversations vers des destinataires multiples. III.B. Commutation par paquets Lors d’un transfert d’informations sur un réseau IP, ces informations sont découpées en paquets qui peuvent suivre des chemins différents de l’émetteur vers le destinataire. Cela s’appelle la commutation par paquets qui s’oppose à la commutation par circuits (un circuit physique ou logique relie l’émetteur au destinataire). Découper les données en paquets permet de multiplexer le flux. Les paquets provenant de plusieurs sources différentes sont mélangés sur le réseau afin de pouvoir offrir plusieurs connections sur un seul lien. Le principal inconvénient du multiplexage est la gigue qu’il peut engendrer. Si tous les créneaux créés par le multiplexage sont occupés, la source doit attendre qu’un de ces créneaux soit libre. Dans le cadre d’une application comme la VoIP, cette attente se traduit par un retard baptisé gigue (jitter en anglais). Ce délai peut être variable mais doit être faible pour garantir une bonne qualité dans une conversation VoIP. Lorsque la gigue devient trop importante, les conversations deviennent hachées voire inintelligible. Les protocoles utilisés pour le transport de la VoIP se doivent donc de prévoir et corriger cette gigue. Le RTP (pour Real Time Protocole) dispose d’un mécanisme pour palier à ce défaut. Annexe 11 Comme RTP est transporté sur UDP, aucun destinataire final ne sait si les paquets sont délivrés. RTCP résout ce problème en fournissant des informations de contrôle sous forme de rapport RTCP au destinataire. RTCP fourni également des informations sur l’émetteur, telles que son nom, son numéro de téléphone… MASTER 18/05/2012 Page 16 - 33 Annexe 12 Voice Voice RTP Station 1 Station2 RTCP H 323, SIP, Client III.C. QoS Report QoS Report H 323, SIP, Client Numéro de ports RTP Les ports RTP et RTCP sont consécutifs. Les numéros de ports sont généralement affectés dynamiquement. Si aucun port RTP n’est affecté, les ports 5004 pour RTP et 5005 pour RTCP le sont par défaut. RTP ne sélectionne pas lui-même les ports RTP à utiliser pour mettre en place la session RTP. Un protocole de signalisation comme H 323, SIP ou MGCP (Media Gateway Control Protocol) est utilisé pour sélectionner les ports RTP et RTCP. Port RTP : 16384 32768 Port RTCP : Port RTP +1 Station 1 Even Port Even Port RTP Station2 RTCP H 323, SIP, Client Odd port Odd port H 323, SIP, Client Annexe 12 MASTER 18/05/2012 Page 17 - 33 RTP supporte les conférences Unicast, Multicast et Mixer-controlled. Puisque RTP peut fournir un identificateur de source contributive, il est possible d’identifier l’émetteur quand il parle. C’est intéressant dans une conférence téléphonique où vous parler avec plusieurs personnes et vous ne savez pas qui vous parle. Si vous avez besoin d’identifier la personne qui à parlé. RTP peut apporter une aide dans cette situation car le champ « source contributive »identifiera celui qui a parlé. III.D. L’Entête RTP Le protocole RTP utilise le protocole UDP pour le transport de données. Il rajoute à ce protocole basique des fonctionnalités temporelles dédiées aux transmissions temps réelles. On trouve notamment dans l’entête des informations sur le type de média transportés, le séquencement et la synchronisation des datagrammes. De telle façon, le récepteur peut déduire de ces informations la gigue produite par le transfert et la corriger par l’usage de tampons. Le récepteur peut aussi repérer les paquets arrivant dans le désordre et bien les replacer dans le tampon. L’en-tête RTP comporte les informations suivantes : <--------------------------- 32 bits ---------------------------> V=2 P X CC M PT Sequence number Timestamp Identifiant de la source de synchronisation (SSRC) Identifiants de la source de contribution (CSRC) Le champ Version V de 2 bits de longueur indique la version du protocole (V=2) Le champ padding P : 1 bit, si P est égal à 1, le paquet contient des octets additionnels de bourrage (padding) pour finir le dernier paquet. Le champ extension X : 1 bit, si X=1 l’en-tête est suivie d’un paquet d’extension Le champ CSRC count CC : 4 bits, contient le nombre de CSRC qui suivent l’entête Le champ marker M : 1 bit, son interprétation est définie par un profil d’application (profile) Le champ payload type PT : 7 bits, ce champ identifie le type du payload (audio, vidéo, image, texte, html, etc.) Le champ séquence number : 16 bits, sa valeur initiale est aléatoire et il s’incrémente de 1 à chaque paquet envoyé, il peut servir à détecter des paquets perdus Le champ timestamp : 32 bits, reflète l’instant où le premier octet du paquet RTP à été échantillonné. Cet instant doit être dérivé d’une horloge qui augmente de MASTER 18/05/2012 Page 18 - 33 façon monotone et linéaire dans le temps pour permettre la synchronisation et le calcul de la gigue à la destination. Le champ SSRC : 32 bits, identifie de manière unique la source, sa valeur est choisie de manière aléatoire par l’application. Le SRRC est aussi lié aux rapports RTCP qui sont générés périodiquement avec cette partie particulière. Le champ CSRC : 32 bits, identifie les sources contribuant. Annexe 14-15-16-17 IV. LE PROTOCOLE RTCP RTCP (RTP Control Protocol) est conçu pour surveiller la qualité de service et transmettre des informations sur les participants d’une session Le protocole RTCP est complémentaire du protocole RTP dans le sens où il ne sers qu’à transmettre à intervalles des paquets de contrôle contenant des statistiques et des informations sur la session ouverte. On peut notamment l’utiliser pour avertir de conditions de trafic réseau dégradées. Pendant une session, tous les participants émettent des paquets RTCP. Les statistiques circulent sous forme de rapports : Les SR (Sender Report - rapport d’émetteur) et les RR (Receivers Report - rapport de récepteur) contiennent par exemple le nombre de paquets envoyés depuis le début de la session ou encore le nombre d’octets déjà envoyés ainsi que le taux de pertes. V. COMPRESSION DE LA VOIX Le transport de la voix sur un réseau IP nécessite au préalable tout ou une partie des étapes suivantes : Numérisation : dans le cas où les signaux téléphoniques à transmettre sont sous forme analogique, ces derniers doivent d'abord être convertis sous forme numérique suivant le format PCM (Pulse Code Modulation) à 64 Kbps. Si l'interface téléphonique est numérique (accès RNIS, par exemple), cette fonction est omise. Compression : le signal numérique PCM à 64 Kbps est compressé selon l'un des formats de codec (compression / décompression) puis inséré dans des paquets IP. La MASTER 18/05/2012 Page 19 - 33 fonction de codec est le plus souvent réalisée par un DSP (Digital Signal Processor). Selon la bande passante à disposition, le signal voix peut également être transporté dans son format originel à 64 Kbps. Décompression : côté réception, les informations reçues sont décompressées .il est nécessaire pour cela d'utiliser le même codec que pour la compression- puis reconverties dans le format approprié pour le destinataire (analogique, PCM 64Kbps, etc.). L'objectif d'un codec est d'obtenir une bonne qualité de voix avec un débit et un délai de compression le plus faibles possibles. Le coût du DSP est lié à la complexité du codec utilisé. Le Tableau ci-dessous présente les caractéristiques des principaux codecs standards de l'UIT. Les codecs les plus souvent mis en œuvre dans les solutions VoIP sont G.711, G.729 et G.723.1. V.A. Le MOS (Mean Opinion Score) La qualité d'un codec est mesurée de façon subjective en laboratoire par une population test de personnes. Ces dernières écoutent tout un ensemble de conversations compressées selon les différents Code. Qualité de la parole Excellente Bonne Correcte Pauvre Insuffisante Score 5 4 3 2 1 Tableau de différents codecs Audio : Codec G.711 G.722 G.723 G.726 G.727 G.728 G.729 Bit Rate (Kbps) 64 48, 56 et 64 5,3 et 6,4 16, 24, 32, et 40 16-40 16 8 G.711 pour la voix (téléphonie standard ou RNIS, et VoIP), • Échantillonnage : 8000 Hz pour une bande passante du téléphone entre 300 et 3400 Hz MASTER 18/05/2012 Page 20 - 33 • • Bande passante sur le réseau : 64 ou 56 kbit/s Type de codage : MIC (Modulation d'impulsion codée) Elle est la base de transport de la voix sur le numérique et continue d'être utilisée pour le transport de la voix avec peu de compression, par exemple sur ISDN ou sur des réseaux locaux IP. Elle sera peu utilisée sur des réseaux étendus comme Internet de part l'utilisation importante de bande passante. G.722 pour la voix large-bande G.722 est une norme de compression audio de l'UIT-T. Apparentée à la famille des recommandation G.7xx, G.722 concerne le transport de la voix en qualité "téléphonique". Recommandation concernant les protocoles H.320 et H323 sur l'encodage audio pour la téléphonie et la visioconférence. • • Débits : 65 Kbps Gammes de fréquences : 50 à 7000 Hz. Tombée en désuétude, cette norme est à éviter dans de nouvelles implémentations. Il est cependant toujours utilisé par certains opérateurs dans leurs offres voix sur accès haut débit sur le marché résidentiel (ex. l'opérateur français Orange). Il impose généralement aux abonnés d'acquérir un téléphone spécifique (ex. Live-Phone chez Orange), conçu pour la bande élargie. La qualité audio large bande n'est en fait réellement disponible qu'entre lignes IP natives, et non pour les appels Lignes IP - Ligne RTC. G.723 pour la voix (VoIP) G.726 pour la voix (téléphonie satellite, et VoIP), basé sur ADPCM G.729 pour la voix (téléphonie de qualité, visionconférence, et VoIP) Le codec G.729 est moins consommateur en bande passante que G.711. Il est utilisé pour obtenir une téléphonie de qualité. Le codec G.729 est : • • Supporté par la plupart des PABX IP Utilisé pour le codage de la partie audio d'une visioconférence, Différents codecs Vidéo : H.261 est une recommandation de compression vidéo de l'UIT-T. Elle fut notamment popularisée par la console de jeu Playstation de Sony, qui l'intégra entièrement dans son moteur de décompression de données. Les travaux sur la norme H.261 ont ultérieurement servi de base à la norme MPEG. H.263 est une recommandation concernant la norme de codage vidéo développée par l’UIT-T Q.6/SG16. MASTER 18/05/2012 Page 21 - 33 À l’origine, H.263 a été développé pour la transmission de la vidéo sur des lignes à très bas débits, pour des applications de visiophonie via le réseau téléphonique commuté de type H.324. Elle a ensuite été intégrée dans les protocoles de visioconférence sur IP du type H.323. Au début d’une communication vidéo entre deux terminaux équipés de ce codec, ils échangent leurs caractéristiques grâce au protocole H.245 et choisissent les modes de H.263 qu’ils utiliseront lors de la communication. H.264 pour la visioconférence sur IP Ce nouveau codec de compression vidéo est une évolution logique du MPEG4. L'H264 devrait améliorer le taux de compression tout en proposant une meilleure qualité d'affichage. L'H264 devrait ainsi offrir un taux de compression de 2 à 3 fois plus élevé que le MPEG-2 et de 1.5 à 2 fois plus élevé que le MPEG-4. V.B. LE QOS Latence La maîtrise du délai de transmission est un élément essentiel pour bénéficier d'un véritable mode conversationnel et minimiser la perception d'écho (similaire aux désagréments causés par les conversations par satellites, désormais largement remplacés par les câbles pour ce type d'usage). Or la durée de traversée d'un réseau IP dépend de nombreux facteurs: Le débit de transmission sur chaque lien Le nombre d'éléments réseaux traversés Le temps de traversée de chaque élément, qui est lui même fonction de la puissance et la charge de ce dernier, du temps de mise en file d'attente des paquets, et du temps d'accès en sortie de l'élément Le délai de propagation de l'information, qui est non négligeable si on communique à l'opposé de la terre. Une transmission par fibre optique, à l'opposé de la terre, dure environ 70 ms. Noter que le temps de transport de l'information n'est pas le seul facteur responsable de la durée totale de traitement de la parole. Le temps de codage et la mise en paquet de la voix contribuent aussi de manière importante à ce délai. Il est important de rappeler que sur les réseaux IP actuels (sans mécanismes de garantie de qualité de service), chaque paquet IP « fait sont chemin » indépendamment des paquets qui le précèdent ou le suivent: c'est ce qu'on appelle grossièrement le « Best effort » pour signifier que le réseau ne contrôle rien. Ce fonctionnement est fondamentalement différent de celui du réseau téléphonique où un circuit est établi pendant toute la durée de la communication. MASTER 18/05/2012 Page 22 - 33 Les chiffres suivants (tirés de la recommandation UIT-T G114) sont donnés à titre indicatif pour préciser les classes de qualité et d'interactivité en fonction du retard de transmission dans une conversation téléphonique. Ces chiffres concernent le délai total de traitement, et pas uniquement le temps de transmission de l'information sur le réseau. Classe n° 1 2 3 4 Délai 0 à 150 ms 150 à 300 ms 300 à 700 ms Au delà de 700 ms Commentaires Acceptable pour la plupart des conversations Acceptable pour des communications faiblement interactives Devient pratiquement une communication half duplex Inutilisable sans une bonne pratique de la conversation half duplex En conclusion, on considère généralement que la limite supérieure "acceptable" , pour une communication téléphonique, se situe entre 150 et 200 ms par sens de transmission (en considérant à la fois le traitement de la voix et le délai d'acheminement). VI. SIP Session Initiation Protocol est un protocole normalisé et standardisé par IETF qui a été conçu pour établir, modifier et terminer des sessions multimédia. SIP n’est donc pas seulement destiné à la VoIP mais aussi à de nombreuses autres applications telles que la visiophonie, la messagerie instantanée, la réalité virtuelle ou même les jeux vidéo. Il se charge de l'authentification et de la localisation des multiples participants. Il se charge également de la négociation sur les types de média utilisables par les différents participants en encapsulant des messages SDP (Session Description Protocol). SIP ne transporte pas les données échangées durant la session comme la voix ou la vidéo. SIP étant indépendant de la transmission des données, tout type de données et de protocoles peut être utilisé pour cet échange.Cependant le protocole RTP (Real-time Transport Protocol) assure le plus souvent les sessions audio et vidéo. MASTER 18/05/2012 Page 23 - 33 SIP remplace progressivement H.323 et s’appui sur le protocole TCP/IP. Il peut aussi bien utiliser TCP qu’UDP. H.323 a été un protocole pionnier de la téléphonie sur IP, émanant des instances du monde des télécommunications (UIT ou ITU). SIP, de conception un peu plus récente, vient du monde de l'Internet (IETF) et s'intègre sans doute un peu mieux sur les réseaux IP. VI.A. Fonctionnement SIP partage de nombreuses similitudes avec le protocole HTTP comme le codage en ASCII et les codes de réponse. Le client envoie des requêtes au serveur, qui lui renvoie une réponse. Les méthodes de base sont : INVITE permet à un client de demander une nouvelle session ACK confirme l'établissement de la session CANCEL annule un INVITE en suspens BYE termine une session en cours Les codes de réponse sont similaires à HTTP. • • • 100 Trying 200 OK 404 Not Found Annexe 18 VI.B. SIP et les autres protocoles But Ces protocoles émettent un appel de l’appelant vers l’appelé d’un autre réseau L’appelant (tél ou PC) sonne L’appelant décroche L’appelant ou l’appelé raccroche MASTER ISDN- Q931 H 323 SIP MGCP SETUP SETUP INVITE ADD ALERTING ALERTING 180 NODIFY CONNECT DISCONNECT CONNECT RELEASE 200 BYE NOTIFY SUBTRACT 18/05/2012 Page 24 - 33 L’appelant ou l’appelé confirme la fin de l’appel Code spécifique à SIP : 180 VI.C. RELEASE COMPLETE TCP ACK 200 ACK RINGING Les phases de communication de SIP IETF SIP ITU H 323 SIP SDP RTP RTCP H 225, RAS H 245 RTP RTCP Annexe 19 SIP : Session Initiation Protocol ; RFC 3261 SDP : Session Description Protocol ; RFC 2327 Il fournit la description d’une session, c'est-à-dire les paramètres utilisés dans une communication SIP RTP : Real Time Transport Protocol ; RFC 1889 RTSP : Real Time Streaming Protocol ; RFC 2326 Il permet de contrôler la diffusion de flux multimédia en temps réel VI.D. Les entités SIP User Agent : Serveur Registrar : Les Users agents SIP s’enregistrent avec leur réseau initial en envoyant le message REGISTER Serveur Proxy : Il assure que la demande a bien été envoyée vers la plus proche entité. Handles registrations Implémente call-routing policies Gére l’authnetigication et l’autorisation des accès Serveur Redirect : Il accepte les demandes SIP Il oriente les demandes pour la destination finale en leur indiquant leur location (adresse IP ou par nom) Location serveur : MASTER 18/05/2012 Page 25 - 33 Il contient la table d’allocation de routage pour diriger le User vers le bon serveur pour trouver le média Annexe 20 VI.E. Les Users Agents Les User Agents désignent les agents que l'on retrouve dans les téléphones SIP, les softphones (logiciels de téléphonie sur IP) des ordinateurs et PDA ou les passerelles SIP. En théorie, on peut établir des sessions directement entre deux User Agents, deux téléphones par exemple. Mais cela nécessite de connaître l'adresse IP du destinataire. Cela n'est pas l'idéal car une adresse IP peut ne pas être publique (derrière un NAT) ou changer et elle est bien plus compliquée à retenir qu'une URI (Uniform Resource Identifier). Les User Agents peuvent donc s'enregistrer auprès de Registrars pour signaler leur emplacement courant, c’est-à-dire leur adresse IP. Un agent joue habituellement à la fois le rôle de client et serveur. C’est-à-dire qu'il peut aussi bien envoyer des requêtes, que répondre à celles qu'il reçoit. VI.F. Serveur Registrar Le Registrar est un serveur qui gère les requêtes REGISTER envoyées par les Users Agents pour signaler leur emplacement courant. Ces requêtes contiennent donc une adresse IP, associée à une URI, qui seront stockées dans une base de données. Les URI SIP sont très similaires dans leur forme à des adresses email : sip:[email protected] (Uniform ressource indicators) Généralement, des mécanismes d'authentification permettent d'éviter que quiconque puisse s'enregistrer avec n'importe quelle URI. MASTER 18/05/2012 Page 26 - 33 Annexe 21 VI.G. SIP –URI Un SIP URI est un système d’adressage SIP pour appeler une autre personne via SIP. En d’autres termes, un SIP URI est le numéro de téléphone SIP d’un utilisateur. Le SIP URI ressemble à une adresse email et se présente sous le format suivant : SIP URI = sip:x@y:Port x=nom d’utilisateur et y=hôte (domaine ou IP) Exemples : sip:[email protected] sip:[email protected] sip:[email protected] VI.H. Serveur Proxy Un Proxy SIP sert d'intermédiaire entre deux User Agents qui ne connaissent pas leurs emplacements respectifs (adresse IP). En effet, l'association URI-Adresse IP a été stockée préalablement dans une base de données par un Registrar. Le Proxy peut donc interroger cette base de données pour diriger les messages vers le destinataire. VI.I. Session SIP à travers un Proxy Le Proxy se contente de relayer uniquement les messages SIP pour établir, contrôler et terminer la session. MASTER 18/05/2012 Page 27 - 33 Une fois la session établie, les données, par exemple un flux RTP pour la VoIP, ne transitent pas par le serveur Proxy. Elles sont échangées directement entre les User Agents. Interprétation des codes : 100 TRYING Tentative d’appel en cours 180 RINGING la poste de l’appelé est en train de sonner 200 OK Message de succès, la requête a été reçue, comprise et acceptée par le serveur Annexe 22 Déroulement d’un Appel basique : Poste A Poste B Message Invite le poste + SDP poste A 180 Ringing 200 OK + SDP poste B ACK MASTER Flux RTP 18/05/2012 Page 28 - 33 BYE 200 OK ACK VI.J. Aspects du marché Le SIP a maintenant été adopté par tous les grands acteurs de l'industrie en tant que protocole de choix pour l'évolution des réseaux. Tendance clairement établie à l'échelle mondiale depuis 2003-2004. • • • • • Retenu par les acteurs du marché de la visioconférence (TANDBERG,CODIAN,POLYCOM) pour assurer des niveaux de convergence avec des acteurs comme Microsoft (OCS), IBM, Cisco. Retenu par AOL, Yahoo, Microsoft, Wanadoo, Orange, Iliad, etc. Retenu par Microsoft pour MSN et Microsoft Office Live Communication Server (LCS / OCS) Retenu par tous les grands fournisseurs traditionnels de PABX: Alcatel-Lucent,Nortel, Cisco, huawei, Ericsson, Siemens, etc. Retenu dans les architectures Voix sur IP de convergence fixe mobile où les services de présence sont une exigence forte. MASTER 18/05/2012 Page 29 - 33 VII. MGCP Les protocoles SIP et H.323 ont la particularité d’être des protocoles architecturés en mode peer to peer, cela signifie que chaque terminal est indépendant et est donc capable de gérer directement les appels et les services associés. Les terminaux SIP/H.323 ont donc la particularité d’être autonome tout comme le sont les terminaux ISDN dans un réseau TDM. Cependant en regardant les tendances et attentes des entreprises en matière de télécommunication on constate que très peu de ces terminaux autonomes (ISDN) sont utilisés dans un réseau. La plupart des postes téléphoniques clients sont des postes simples (analogiques) n’assurant que les fonctions d’appels de bases et qui sont eux-mêmes contrôlés par commutateur (ex : PABX) pour la gestion des services spécifiques des appels. Ainsi il était important d’avoir un protocole VoIP capable de fonctionner de la même façon afin de pouvoir laisser le contrôle des fonctionnalités à l’operateur et délivrer que les services de base (appel, décroché, raccroché) coté abonné. MGCP (Media Gateway Control Protocol), se différencie donc de SIP et H.323 par son architecture CLIENT / SERVEUR ou plus précisément Maitre /esclave. Ainsi la gestion des services d’appels est centralisée et assuré coté maitre tandis que les terminaux coté clients ne gèrent que les fonctionnalités basiques d’appels et vont recevoir les instructions du maitre. Ce type de fonctionnement est très utile dans un environnement où l’opérateur désire garder le contrôle des services sur l’abonné (ce dernier a en effet qu’un poste uniquement capable de recevoir les instructions de l’opérateur).Ex : un abonné résidentiel, offre de service de classe 5 ou type IPCENTREX (cf partie application). VII.A. Architecture du protocole MGCP L’architecture du protocole MGCP repose donc sur 2 entités : Les terminaux MGCP situés coté client sont des passerelles chargé de recevoir et rapporter les instructions du contrôleur central (call agent). Le Call agent est le « chef d’orchestre » du réseau MGCP, il va se charger de commander les fournir des instructions aux passerelles MGCP. Le call agent et les terminaux vont communiquer via des échanges de transactions en utilisant le port UDP 2727 (call agent) et 2427 (terminaux). Les flux voix sont gérés également par le protocole RTP/RTCP comme en SIP et H.323 MASTER 18/05/2012 Page 30 - 33 Il est important de préciser que MGCP est un protocole dédié a l’interconnexion des terminaux IP et PSTN, ainsi au sein du cœur de réseau, il est tout a fait possible d’utiliser les protocoles H.323 ou SIP pour les interconnexions, MGCP n’intervenant que sur la bordure du cœur de réseau. MASTER 18/05/2012 Page 31 - 33 VII.B. L'avenir de MGCP. MGCP se différencie essentiellement de SIP et H.323 par une réelle architecture client serveur, qui permet de centraliser les services et contrôles coté opérateurs. Ce protocole est donc destinés aux opérateurs souhaitant garantir un contrôle des terminaux et dont le fonctionnement serait totalement transparent coté abonné. Sa robustesse de fonctionnement (MGCP est moins bugué que SIP du fait que les fonctionnalités de ce protocoles aient étés bien étudiés) et ses caractéristiques ont fait que de nos jours la quasi-totalité des offres de téléphonie sur internet destinés aux particuliers sont basés sur ce protocole (offre triple-play et box des FAI Français.). Le succès et l’engouement des offres de téléphonie illimitées obligent donc les FAI à concevoir une offre similaire que leur concurrents et donc à investir dans une architecture similaire. MGCP est aussi au cœur des infrastructures IPCENTREX (cf. chapitres applications) bien que très récemment, des solutions CENTREX ont vu le jour basées sur le protocole SIP. Contrairement à H.323, MGCP souffre moins de la concurrence de SIP et a encore de beau jours devant lui notamment grâce au formidable essor des offres de dégroupages vendu par les FAI Français. MASTER 18/05/2012 Page 32 - 33