De nouveaux outils pour créer des modèles de prévision
Transcription
De nouveaux outils pour créer des modèles de prévision
PASW® Neural Networks 18 – Spécifications De nouveaux outils pour créer des modèles de prévision Votre organisation doit identifier les modèles et les miser les risques d’erreur et produire des prévisions précis- connexions dans l’environnement complexe et changeant es. Vous définissez les conditions sous lesquelles le réseau dans lequel vous travaillez afin de prendre des décisions « apprend » et vous avez la possibilité de contrôler précisé- plus judicieuses pour chaque problème. Vous utilisez sans ment les règles d’arrêt d’apprentissage et l’architecture du doute PASW® Statistics Base* et un ou plusieurs modules réseau ou de laisser la procédure choisir automatiquement complémentaires pour vous aider dans cette tâche. Si c’est la meilleure architecture à votre place. Vous pouvez associer le cas, vous savez quelle puissance et quelle polyvalence PASW Neural Network avec d’autres procédures statistiques vous avez à portée de main. Mais vous pouvez faire pour bénéficier d’une vision plus détaillée dans un certains encore plus. Vous pouvez explorer les modèles les plus nombres de domaines. Dans le cas des études de marché, sophistiqués avec PASW Neural Networks*. Ce module par exemple, vous pouvez créer des profils de clients et vous permet de découvrir les relations les plus complexes découvrir leurs préférences. Si votre marketing s’appuie sur qui existent au sein de vos données et de générer des des bases de données, vous pouvez segmenter votre base modèles de prévision plus performants. de clients afin d’optimiser les campagnes marketing. Les procédures de PASW Neural Networks complètent les Dans le cadre d’une analyse financière, vous pouvez statistiques plus traditionnelles de PASW Statistics Base utiliser PASW Neural Networks pour analyser la solvabilité et de ses modules. Découvrez de nouvelles associations des prospects et détecter les fraudes possibles. En analyse dans vos données avec PASW Neural Networks, puis opérationnelle, ce nouvel outil permet de gérer les flux confirmez leur signification avec les techniques statistiques de trésorerie et d’améliorer la planification logistique. traditionnelles. PASW Neural Networks est disponible sous Les applications scientifiques et médicales proposent des forme d’application cliente autonome, mais une version fonctions de prévision des coûts de traitement, d’analyse serveur est également disponible pour de meilleures de résultats médicaux et d’estimation de la durée d’un performances. séjour hospitalier. Pourquoi utiliser un réseau de neurones ? Contrôlez le processus du début à la fin Un réseau de neurones est un ensemble d’outils de modé- Avec PASW Neural Networks, vous avez le choix entre la lisation de données non linéaires composé de couches procédure Perceptron multicouches (MLP) et la procédure d’entrée et de sortie, et d’une ou de deux couches mas- de fonctions à base radiale (RBF). quées. Les connexions entre les neurones de chaque couche comprennent des pondérations associées qui sont ajustées Ces deux procédures sont des techniques d’apprentissage itérativement par l’algorithme d’apprentissage pour mini- supervisées, c’est-à-dire qu’elles établissent les relations impliquées par les données. Elles utilisent toutes les deux des architectures d’anticipation, ce qui signifie que les don- * PASW Neural Networks et PASW Statistics Base, anciennement nommés SPSS Neural Networks et SPSS Statistics Base, font partie de la gamme Predictive Analytics Software de SPSS Inc. nées se déplacent dans une seule direction : elles partent des noeuds d’entrée et atteignent les noeuds de sortie en passant par la couche masquée. Vous choisirez la procédure en fonction du type de données dont vous disposez ainsi que Une plus grande valeur ajoutée grâce à la collaboration du niveau de complexité que vous cherchez à découvrir. Si la Pour partager et réutiliser efficacement les ressources, procédure MLP est capable d’identifier des relations plus com- protégez-les conformément aux exigences de conformité plexes, la procédure RBF est généralement plus rapide. internes et externes et publiez les résultats de manière à ce qu’un plus grand nombre d’utilisateurs professionnels Dans ces deux approches, vous répartissez vos données puisse les voir et interagir avec. Pourquoi ne pas enrichir en échantillons d’apprentissage, de test et de validation. votre logiciel PASW Statistics avec PASW® Collaboration Le groupe d’apprentissage est utilisé pour estimer les and Deployment Services (anciennement SPSS Predictive paramètres du réseau. L’échantillon de test est utilisé pour Enterprise Services™) ? Vous trouverez des informations éviter le surapprentissage. L’échantillon de validation est complémentaires sur ces précieuses fonctionnalités dans employé pour évaluer de façon indépendante le réseau final la brochure « Collaboration », téléchargeable sur le site qui est appliqué à l’ensemble du groupe de données et à www.spss.com/fr/software/deployment/cds. toutes les nouvelles données. Vous spécifiez les variables dépendantes, qui peuvent être des variables continues, des variables qualitatives, ou une combinaison des deux. Si une variable dépendante possède un niveau de mesure d’échelle, alors le réseau neuronal prédit des valeurs continues qui sont des approximations de la valeur « véritable » d’une fonction continue des données d’entrée. Si une variable dépendante est qualitative, alors le réseau neuronal est utilisé pour classer les observations dans la « meilleure » catégorie d’après les prédicteurs d’entrée. Vous ajustez la procédure en choisissant la manière dont le groupe de données est partitionné, le type d’architecture que vous voulez et les ressources de calcul qui seront attribuées à l’analyse. Vous pouvez enfin choisir d’afficher les résultats sous forme de tableaux ou de diagrammes, d’enregistrer des Dans un réseau MLP comme celui représenté ici, les données vont de la couche d’entrée à la couche de sortie en passant par une ou plusieurs couches cachées. variables temporaires facultatives dans le groupe de données actif et d’exporter les modèles sous forme de fichiers XML pour évaluer des données ultérieures. Chaque module de la famille PASW Statistics peut maintenant être installé et exécuté séparément ou en conjonction avec tout autre module. PASW Statistics Base n’est plus nécessaire dans chaque cas car des fonctionnalités telles que l’accès et la gestion des données de même que la création de diagrammes ont été ajoutées à tous les modules. Vous bénéficiez ainsi d’une plus grande flexibilité pour l’installation et l’utilisation de cette application polyvalente. PASW Statistics Base est toujours disponible et reste à la base de beaucoup de déploiements, car il contient des procédures et des tests statistiques fondamentaux pour beaucoup d’analyses. Dans la boîte de dialogue Perceptron multicouches (MLP), vous sélectionnez les variables que vous voulez inclure dans votre modèle. Fonctions Perceptron multicouches (MLP) La procédure MLP ajuste un type particulier de réseau de neurones nommé perceptron multicouches. Le perceptron multicouches est une méthode supervisée qui utilise une architecture d’anticipation. Il peut présenter plusieurs couches masquées. Vous spécifiez une ou plusieurs variables dépendantes, qui peuvent être des variables d’échelle, des variables qualitatives, ou la combinaison des deux. Si une variable dépendante possède un niveau de mesure d’échelle, alors le réseau neuronal prédit des valeurs continues qui sont des approximations de la valeur « véritable » d’une fonction continue des données d’entrée. Si une variable dépendante est qualitative, alors le réseau de neurones est utilisé pour classer les observations dans la « meilleure » catégorie d’après les variables indépendantes d’entrée. ■ Predicteurs – Facteurs – Covariables ■ La sous-commande EXCEPT liste toutes les variables que la procédure MLP doit exclure des listes de facteurs ou de covariables sur la ligne de commande. Cette souscommande est utile si les listes de facteurs ou de covariables contiennent un grand nombre de variables. ■ La sous-commande RESCALE permet d’échelonner les covariables ou les variables dépendant de l’échelle. –Variable dépendante (si d’échelle) : standardisée, normalisée, ajustée normalisée, ou aucune option –Covariables : standardisée, normalisée, ajustée normalisée, ou aucune option La sous-commande PARTITION indique la méthode de partitionnement de l’ensemble de données actif en échantillons d’exploration, de test et de confirmation. L’échantillon d’exploration comprend les enregistrements de données utilisés pour former le réseau de neurones. L’échantillon de test est un ensemble d’enregistrements de données indépendant utilisé pour identifier une erreur de prévision au cours de l’exploration afin d’empêcher un surapprentissage. L’échantillon de confirmation est un autre ensemble d’enregistrements de données indépendant utilisé pour évaluer le réseau de neurones final. Vous pouvez spécifier : –Le nombre relatif d’observations dans le groupe de données actif à affecter aléatoirement à l’échantillon d’exploration –Le nombre relatif d’observations dans le groupe de données actif à affecter aléatoirement à l’échantillon de test –Le nombre relatif d’observations dans le groupe de données actif à affecter aléatoirement à l’échantillon de confirmation –Une variable qui affecte chaque observation du groupe de données actif à l’échantillon d’exploration, de test ou de confirmation ■ La sous-commande ARCHITECTURE est utilisée pour spécifier l’architecture du réseau de neurones. Vous pouvez spécifier : –S’il faut utiliser la sélection automatique de l’architecture ou si l’automatisation n’est pas utilisée –Le nombre de couches cachées dans le réseau de neurones –La fonction d’activation à utiliser pour toutes les unités des couches cachées (tangente hyperbolique ou sigmoïde) –La fonction d’activation à utiliser pour toutes les unités de la couche de sortie (Identité, Tangente hyperbolique, sigmoïde ou Softmax) ■ Fonctions susceptibles de changer en fonction de la version finale du produit. La sous-commande CRITERIA spécifie les paramètres de calcul et de ressource de la procédure MLP. Vous pouvez spécifier le type d’exploration, qui détermine la manière dont le réseau de neurones traite les enregistrements de données d’exploration : apprentissage par lots, apprentissage en ligne, apprentissage par mini-lots. Vous pouvez également spécifier : –Le nombre d’enregistrements d’apprentissage par mini-lot (si c’est la méthode sélectionnée pour l’apprentissage) –Le nombre maximum de cas à enregistrer en mémoire lorsque l’architecture automatique et/ou l’apprentissage par mini-lots sont appliqués. –L’algorithme d’optimisation utilisé pour déterminer les pondérations synaptiques : Méthode du gradient, Gradient conjugué échelonné. –Le taux d’apprentissage initial pour l’algorithme d’optimisation par méthode du gradient –La limite inférieure du taux d’apprentissage lorsque la méthode du gradient est utilisée avec un apprentissage en ligne ou par mini-lots –Le taux de vitesse pour l’algorithme descendant de gradient d’optimisation –Le lambda initial, pour l’algorithme d’optimisation par gradient conjugué échelonné –Le sigma initial, pour l’algorithme d’optimisation par gradient conjugué échelonné –L’intervalle [a0−a, a0+a] au sein duquel les vecteurs de pondération sont générés aléatoirement en cas d’utilisation d’un algorithme recuit simulé ■ La sous-commande STOPPINGRULES spécifie les règles qui déterminent le moment où l’apprentissage du réseau de neurones doit être arrêté. Vous pouvez spécifier : –Le nombre d’étapes n à autoriser avant de rechercher une baisse des erreurs de prédiction –Le nombre maximum d’itérations autorisées –La modification relative du rapport d’erreur d’apprentissage. –Le critère du ratio d’erreurs d’apprentissage ■ La sous-commande MISSING vous permet d’indiquer si les valeurs manquantes utilisateur de variables catégoriques (c’est-à-dire, les facteurs et les variables dépendantes qualitatives) sont traitées comme des valeurs valides. ■ La sous-commande PRINT indique le résultat tabulaire à afficher et peut être utilisée pour demander une analyse de sensibilité. Vous pouvez afficher : –Le tableau de résumé du traitement de l’observation –Des informations sur le réseau de neurones, y compris les variables dépendantes, le nombre d’unités d’entrée et de sortie, le nombre de couches et d’unités cachées, et les fonctions d’activation –Un résumé des résultats du réseau de neurones, comprenant l’erreur globale moyenne, la règle d’arrêt utilisée pour interrompre l’apprentissage et la durée d’apprentissage –Un tableau de classification pour chaque variable dépendante qualitative –Les pondérations synaptiques, c’està-dire les estimations de coefficient, depuis la couche i-1 unité j, jusqu’à la couche i unité k –Une analyse de sensibilité, qui calcule l’importante de chaque prédicteur dans la détermination du réseau de neurones ■ La sous-commande PLOT permet de spécifier le résultat graphique à afficher. Vous pouvez afficher : –Un diagramme de réseau –Un graphique de valeur prédite contre valeur observée pour chaque variable dépendante –Un graphique de résidu contre valeur prédite pour chaque variable dépendante d’échelle –Courbe Receiver Operating Characteristic (ROC) pour chaque variable qualitative dépendante. Cela affiche également un tableau indiquant l’aire qui se trouve sous chaque courbe. –Les graphiques de gains cumulatifs de chaque variable qualitative dépendante –Les graphiques de lift de chaque variable qualitative dépendante ■ La sous-commande SAVE écrit les variables temporaires facultatives dans le groupe de données actif Vous pouvez enregistrer : – La valeur ou la catégorie prévue. – La pseudo-probabilité prévue ■ La sous-commande OUTFILE enregistre des fichiers au format XML qui contiennent les pondérations synaptiques ■ Fonctions à base radiale (RBF) La procédure RBF ajuste un réseau de neurones avec fonctions à base radiale, qui est un réseau d’apprentissage supervisé d’anticipation possédant une couche d’entrée, une couche cachée appelée couche de fonction à base radiale et une couche de sortie. La couche cachée transforme les vecteurs d’entrée en fonctions à base radiale. Tout comme la procédure MLP, la procédure RBF réalise des opérations de prévision et de classification. Fonctions susceptibles de changer en fonction de la version finale du produit. Pour en savoir plus, visitez le site www.spss.com. Pour les sites SPSS et les numéros de téléphone, consultez www.spss.com/worldwide. SPSS est une marque déposée et les autres produits SPSS Inc. cités sont des marques commerciales de SPSS Inc. Tous les autres noms sont des marques commerciales de leurs propriétaires respectifs. © 2009 SPSS Inc. Tous droits réservés. SN18SPC-0709-FR La procédure RBF forme le réseau en deux étapes : 1.La procédure détermine les fonctions à base radiale à l’aide de méthodes de classification. Le centre et la largeur de chaque fonction à base radiale sont déterminés. 2. La procédure estime les pondérations synaptiques d’après les fonctions à base radiale. La fonction d’erreur « somme des carrés », avec fonction d’activation d’identité pour la couche cachée, est utilisée pour les opérations de prévision et de classification. Une régression des moindres carrés ordinaire est utilisée pour réduire l’erreur de somme des carrés. En raison de cette approche d’apprentissage en deux étapes, les réseaux RBF sont généralement formés bien plus rapidement que les réseaux MLP. Les sous-commandes répertoriées pour la procédure MLP permettent de réaliser des fonctions similaires pour la procédure RBF, avec les exceptions suivantes : ■ Avec la sous-commande ARCHITECTURE, les utilisateurs peuvent spécifier la fonction à base radiale gaussienne utilisée dans la couche masquée : RBF normalisée ou RBF ordinaire ■ Avec la sous-commande CRITERIA, les utilisateurs peuvent spécifier les paramètres de calcul des procédures RBF, en indiquant la quantité de chevauchement parmi les unités cachées Configuration requise ■ La configuration requise varie selon les plates-formes. Pour plus d’informations, consultez la page www.spss.com/fr/ statistics.