5 variables extra-financières

Transcription

5 variables extra-financières
Projet FUI « Reference Value » :
Valoriser les actifs immatériels
Michel BERA & Christian Y. ROBERT
CNAM & Université Lyon 1
Colloque SCOR/Institut des Actuaires «Actuariat et Data Science »
26 novembre 2015
La commande « Reference Value » et
l’approche
• Commande :
• Abaisser le coût du calcul de la Reference Value pour un acteur économique
• Mettre en place la modélisation sur les acteurs de l’ESS (ex : Mutuelles, PMI)
• Gérer les valeurs manquantes (imputation multiple)
• Approche :
• Utilisation de la Data Science et des Big Data »
• Les Big Data sont des toutes petites Data, mais elles proviennent en partie du
monde des Big Data traditionnelles
Les écueils habituels
• Recueillir les données :
• « pas vu, pas pris » : certains acteurs de l’ESS n’ont pas envie d’être
« modélisés », et ne communiquent pas facilement leurs données
• Certains membres du consortium n’ont pas envie d’être « ubérisés » par la
data science du projet
• Trouver la « lingua franca » du projet :
• Difficultés de langage entre les membres du consortium sur leurs domaines
d’expertise respectifs
• Apaiser les antagonismes d’approche de gestion de l’aléatoire
• Quali vs Quanti, Probabilistes vs statisticiens, « data driven » vs « hypothesis
driven », bayésiens vs vapnikiens vs …
L’approche initiale proposée par le
Cnam/CEDRIC
• Définir un ensemble central de « piliers » (ex : 20) parmi les acteurs
d’un domaine de l’ESS
• Choisir au hasard des acteurs « sondes complémentaires » (ex : 20)
dans le même domaine pour étalonner le bruit statistique
• Recueillir des « Big Data » du monde de l’Internet (Web, Twitter, FB :
mots clés et statistique du text mining) pour compléter et stabiliser la
géométrie de l’espace des données
• Construire l’imputation multiple (données manquantes) et le modèle
de score global robuste « le moins mauvais » compte tenu de
l’information recueillie
Ce qui a été accompli
• Trouver un juste chemin où les « qualis » du consortium ont tiré
expérience des remontées des calculs du « quanti », et notamment la
réduction de dimension, apport significatif de l’approche statistique
• Mettre en place une approche acceptable sur un domaine de l’ESS,
avec 350 PME-PMIs
• Construire et réduire un jeu de données (mots de texte) relié à ce
domaine
• Finaliser pour répondre à la demande initiale un modèle pragmatique
de base, « pratique et pas cher », en sélectionnant 5 variables extrafinancières, et 6 variables financières
Les variables retenues en final
• 5 variables extra-financières :
•
•
•
•
•
L’investissement en R&D,
L’âge du DG,
La dynamique du marché,
Le budget de formation,
L’âge de la marque
• 6 variables financières :
•
•
•
•
•
•
Le chiffre d’affaires (ou ventes),
Les fonds propres,
Le résultat net,
Le résultat d’exploitation,
Les dettes à long terme,
Les charges financières
• 9 ratios couramment rencontrés en analyse financière (ex : fonds propres sur chiffre d’affaires)
Les résultats (1)
• L’erreur τ est mesurée par un « coefficient d’indétermination crossvalidé » , c’est-à-dire le rapport entre une « moyenne quadratique
d’erreur » et la « variance de la variable expliquée », ces rapports
étant toujours calculés avec cross-validation.
• Des trois indicateurs Economiques (ER), Financiers (FR) et Immatériel
(IR), l’effort de modélisation porte sur l’IR, les deux premiers étant
calculés directement par Valquant.
• L’outil statistique de calcul de score est la ridge regression, linéaire ou
quadratique (avec réduction de variables)
• L’outil d’imputation multiple est l’approche par analyse factorielle
itérative suivie de projection sur les premiers facteurs
Les résultats (2)
• Le très petit nombre de données du fichier appelle à une grande
prudence en matière de robustesse
• On trouve comme erreur sur l’IR
• En linéaire : τ=30%
• En quadratique : τ=10%
• Une estimation de la robustesse par bootstrap confirme l’instabilité
des résultats : l’erreur dans l’approche quadratique + réduction reste
inférieure à 20% dans 98% des cas.

Documents pareils