5 variables extra-financières
Transcription
5 variables extra-financières
Projet FUI « Reference Value » : Valoriser les actifs immatériels Michel BERA & Christian Y. ROBERT CNAM & Université Lyon 1 Colloque SCOR/Institut des Actuaires «Actuariat et Data Science » 26 novembre 2015 La commande « Reference Value » et l’approche • Commande : • Abaisser le coût du calcul de la Reference Value pour un acteur économique • Mettre en place la modélisation sur les acteurs de l’ESS (ex : Mutuelles, PMI) • Gérer les valeurs manquantes (imputation multiple) • Approche : • Utilisation de la Data Science et des Big Data » • Les Big Data sont des toutes petites Data, mais elles proviennent en partie du monde des Big Data traditionnelles Les écueils habituels • Recueillir les données : • « pas vu, pas pris » : certains acteurs de l’ESS n’ont pas envie d’être « modélisés », et ne communiquent pas facilement leurs données • Certains membres du consortium n’ont pas envie d’être « ubérisés » par la data science du projet • Trouver la « lingua franca » du projet : • Difficultés de langage entre les membres du consortium sur leurs domaines d’expertise respectifs • Apaiser les antagonismes d’approche de gestion de l’aléatoire • Quali vs Quanti, Probabilistes vs statisticiens, « data driven » vs « hypothesis driven », bayésiens vs vapnikiens vs … L’approche initiale proposée par le Cnam/CEDRIC • Définir un ensemble central de « piliers » (ex : 20) parmi les acteurs d’un domaine de l’ESS • Choisir au hasard des acteurs « sondes complémentaires » (ex : 20) dans le même domaine pour étalonner le bruit statistique • Recueillir des « Big Data » du monde de l’Internet (Web, Twitter, FB : mots clés et statistique du text mining) pour compléter et stabiliser la géométrie de l’espace des données • Construire l’imputation multiple (données manquantes) et le modèle de score global robuste « le moins mauvais » compte tenu de l’information recueillie Ce qui a été accompli • Trouver un juste chemin où les « qualis » du consortium ont tiré expérience des remontées des calculs du « quanti », et notamment la réduction de dimension, apport significatif de l’approche statistique • Mettre en place une approche acceptable sur un domaine de l’ESS, avec 350 PME-PMIs • Construire et réduire un jeu de données (mots de texte) relié à ce domaine • Finaliser pour répondre à la demande initiale un modèle pragmatique de base, « pratique et pas cher », en sélectionnant 5 variables extrafinancières, et 6 variables financières Les variables retenues en final • 5 variables extra-financières : • • • • • L’investissement en R&D, L’âge du DG, La dynamique du marché, Le budget de formation, L’âge de la marque • 6 variables financières : • • • • • • Le chiffre d’affaires (ou ventes), Les fonds propres, Le résultat net, Le résultat d’exploitation, Les dettes à long terme, Les charges financières • 9 ratios couramment rencontrés en analyse financière (ex : fonds propres sur chiffre d’affaires) Les résultats (1) • L’erreur τ est mesurée par un « coefficient d’indétermination crossvalidé » , c’est-à-dire le rapport entre une « moyenne quadratique d’erreur » et la « variance de la variable expliquée », ces rapports étant toujours calculés avec cross-validation. • Des trois indicateurs Economiques (ER), Financiers (FR) et Immatériel (IR), l’effort de modélisation porte sur l’IR, les deux premiers étant calculés directement par Valquant. • L’outil statistique de calcul de score est la ridge regression, linéaire ou quadratique (avec réduction de variables) • L’outil d’imputation multiple est l’approche par analyse factorielle itérative suivie de projection sur les premiers facteurs Les résultats (2) • Le très petit nombre de données du fichier appelle à une grande prudence en matière de robustesse • On trouve comme erreur sur l’IR • En linéaire : τ=30% • En quadratique : τ=10% • Une estimation de la robustesse par bootstrap confirme l’instabilité des résultats : l’erreur dans l’approche quadratique + réduction reste inférieure à 20% dans 98% des cas.