Loquendo ASR

Transcription

Loquendo ASR
Loquendo ASR
AUTOMATIC SPEECH RECOGNITION
Loquendo ASR est un logiciel de reconnaissance
de dernière génération pour applications vocales.
Il est indépendant du locuteur et reconnaît de
manière fiable un vaste vocabulaire de la parole
continue, même dans les environnements les
plus bruyants comme les sans fils.
Loquendo ASR est actuellement utilisé dans des
services qui gèrent des millions d’appels chaque jour comme les pages blanches entièrement
automatisées, les portails vocaux et les applications-automobiles.
Loquendo est le seul fournisseur de technologies vocales qui offre une ligne complète de produits pour serveurs, téléphones mobiles, PC et
dispositifs embarqués garantissant la même variété de langues et les mêmes prestations dans
tous ces environnements.
Vos Avantages…
Loquendo ASR offre aux intégrateurs la possibilité de créer des
services qui soient conviviaux et aussi complexes qu’ils le désirent
en termes de dimensions du vocabulaire, flexibilité de l’interaction
et nombre de langues. Loquendo ASR satisfait pleinement les
conditions de chaque scénario d’application – même si complexe.
•
Ample Dictionnaire & Reconnaissance Flexible – reconnaît
jusqu’à un million de mots ; supporte la parole continue et les
mots isolés.
•
Reconnaissance Vocale Très Précise – grâce à l’intégration
de réseaux neuronaux et modèles markoviens cachés et aux
unités acoustiques et phonétiques formés sur un large corps
vocal.
Ample Support des Standards – optimisé pour les applications
VoiceXML; conforme aux standards pour les grammaires W3C
SRGS 1.0 et SISR 1.0.
Transcripteurs Phonétiques de Haute Précision – spécialisés
pour chaque langue (le même qui est utilisé par Loquendo
TTS).
•
•
•
•
•
Haute Efficacité – des conditions de puissance informatique basses permettent le travail simultané de plusieurs
canaux de reconnaissance même en présence de petits et grands dictionnaires.
Rapide introduction de nouvelles langues – grâce à la méthodologie utilisée qui peut être rapidement étendue
à n’importe quelle autre et ajustée à notre large gamme de langues.
Supporte la technologie Loquendo de Vérification du Locuteur (Loquendo Speaker Verification).
www.loquendo.com
Une Technologie Simple et à la fois Puissante…
Un ensemble de fonctions simples et puissantes qui garantissent une technologie de reconnaissance vocale
vraiment solide et permettant:
• Une capacité barge-in sophistiquée pour garantir une réactivité et robustesse élevée aux bruits et aux voix de
fond.
• Une nouvelle méthode brevetée pour augmenter la capacité de reconnaissance dans les situations bruyantes.
• Un mécanisme flexible de rejection qui identifie toutes les expressions linguistiques qui ne sont pas acceptables à
l’intérieur d’un domaine spécifique.
• Une gestion du débit du dialogue qui est atteint au travers de valeur de confidence pour chacune des hypothèses
Nbest restituées – sur une base phrase par phrase & mot par mot.
• Définition de règles Garbage pour déterminer et gérer les séquences de dialogue non modelées par la
grammaire.
Un Speech Assistant Toolkit sophistiqué garantit la définition rapide et efficace des Objets de Reconnaissance
(ROs) et Paquets de Reconnaissance tels que Grammar ROs et Language Modeling ROs. Dans les situations non
“prévisibles”, les ROs peuvent être créés, stockés et effacés dynamiquement ( “on the fly”).
Une réduction importante de la mémoire utilisée: Les ROs peuvent être aussi bien permanents (et par conséquent
partagés par tous les canaux de reconnaissance) et dynamiques (c’est-à-dire chargés en temps réel quand ils servent
et relâchés après l’utilisation).
Loquendo ASR fournit aussi:
• Une bibliothèque réutilisable de grammaires intégrée (Re-usable built-in grammar library) pour chaque
langue (par ex. date, heure, monnaie, numéros de téléphone, etc.).
• La segmentation phonétique (phonetic segmentation) qui inclut la représentation phonétique et les
synchronisations de chaque phonème dans la phrase. Cette segmentation est souvent une condition fondamentale,
surtout dans les animations de personnages virtuels.
o
d
n
N
IO
T
NI
Outils de Mise au Point des Services Vocaux (ASR)
G
C CO
I
Loquendo ASR fournit aux utilisateurs une série d’outils qui analyse automatiquement les donAT E
M HR
nées
récoltées par les applications réelles pour augmenter les prestations du service et de manière
TO EC
particulière:
U
A PE
• Apprentissage phonétique (Phonetic Learning) – qui analyse automatiquement les données
S
e
u
q
Lo SR
A
•
pour identifier les expressions fréquemment utilisées qui n’ont pas été couvertes ainsi que les
variantes de prononciation afin d’améliorer la grammaire de reconnaissance vocale.
Adaptation du Modèle Acoustique (Acoustic Model Adaptation) – améliore les prestations
de reconnaissance à l’aide de matériel audio enregistré sur place (environnement, locuteur,
adaptation canal) où une application vocale est utilisée dans un contexte particulier.
Loquendo ASR – Spécifications Techniques
Caractéristiques générales
•
•
•
•
Technologie de Base
Intégration de Réseaux Neuronaux et Modèles Markoviens, unités acoustique et phonétique
formées avec un ample corpus vocal
Modalités Configurables de
Reconnaissance
•
•
•
Basées sur Grammaire
Reconnaissance Vocale Continue avec Modèles Statistiques du langage
Décodage Phonétique Libre ou Forcé
Spécial
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Décodage N-Best
Valeur de Confidence au niveau phrase et mot
Sensibilité du Voice detector
Optimisation des fonctionnalités Barge-In
Speech Complete/Incomplete Timeout
Règles Garbage (pour gérer les séquences de dialogue non modelées par la
grammaire)
Gestion rapide de la compilation de grammaire on the fly
Bibliothèque réutilisable de grammaires intégrées
Grammaires multilingues
Grammaires personnalisables à la voix de l’utilisateur
Gestion Langue Naturelle (Natural Language Processing)
Optimisé pour applications VoiceXML
Vérification du locuteur (Loquendo Speaker Verification)
Word spotting plug-in
Outils pour la mise au point des
Services Vocaux
•
•
Phonetic Learning (Apprentissage phonétique)
Acoustic Model Adaptation (Adaptation Modèle Acoustique)
Langues supportées
Anglais Américain, Anglais Britannique, Anglais Australien, Français, Français Canadien,
Espagnol Américain, Argentin, Chilien, Mexicain, Castillan, Catalan, Valencien,
Galicien, Hollandais, Allemand, Grec, Italien, Polonais, Portugais, Brésilien, Suédois,
Finnois, Danois, Norvégien, Russe, Turc, Arabe*, Roumain*, Japonais*, Anglais Indien*
(* et développement)
Grammaires
•
•
Plateformes supportées
MS Windows (7, XP, Vista, Server 2003, Server 2008**), Red Hat Enterprise Linux (3, 4, 5**),
SUSE Linux 10, 11**, CentOS 5.2
** également disponible pour version 64 bits
JSGF (Java Speech Grammar Format)
W3C SRGS 1.0 (XML et ABNF Form) + SISR 1.0
Interfaces
•
•
•
•
Loquendo API (C/C++)
Loquendo API (.NET e C#)
Loquendo API (Java)
Support de la Source Audio Intel Dialogic (Windows)
CPU
•
•
Reconnaissance de Chiffres Connectés: 80 canaux sur une CPU Intel Pentium 3.2 GHz
Grammaire avec 10,000 mots: 20 canaux sur une CPU Intel Pentium IV 3.2 GHz
Mémoire utilisée
•
•
15 MB par langue partagée parmi les canaux
Quelques MB par canal selon la tâche de reconnaissance (par ex. 5 MB pour
Reconnaissance de Chiffres Connectés, 15 MB pour une grammaire de 10.000 mots)
Pour mieux connaître les possibilités de Loquendo ASR, visitez le site www.loquendo.com
© 2010 - Loquendo. Tous droits réservés. Le logo Loquendo est une marque déposée par Loquendo. Toutes les autres marques sont la propriété de leurs
propriétaires. Les informations de cette brochure peuvent être modifiées sans préavis.
Loquendo - Turin
Via Arrigo Olivetti, 6
10148 Turin - Italie
tel. +39 011 2913111 - fax +39 011 2913199
www.loquendo.com [email protected]
Loquendo - Paris
68, rue du Faubourg Saint Honoré
75008 Paris - France
tel. +33 (0)1 53436218 - fax +33 (0)1 53436300
Gaea Zelie Vilage - Sales Area Manager
[email protected]
LOQ
LOQ -- A4
A4 -- JUL
SEP2009
2010
Indépendant du Locuteur
Dictionnaire ouvert
Robustesse au Bruit (par ex. en voiture, sans fil, etc.)
Optimisé pour Conversation Téléphonique