Méthodes pour l`analyse des données fonctionnelles
Transcription
Méthodes pour l`analyse des données fonctionnelles
Méthodes pour l’analyse des données fonctionnelles Cristian P REDA Polytech’ Lille Université des Sciences et Technologies de Lille, France Méthodes pour l’analyse des données fonctionnelles – p.1/44 Google : - chemometrics : - functional+ data : - functional + data + chemometrics : 1050000 70900000 17300 Méthodes pour l’analyse des données fonctionnelles – p.2/44 Données fonctionnelles Exemples : 0.8 70 0.4 60 0.0 50 −0.4 40 −0.8 30 −1.2 20 −1.6 10 −2.0 0 0 400 800 1200 1600 2000 2400 2800 3200 3600 0 Indice d’action boursière 10 20 30 40 50 Marche : angle du genou 3.0 2.6 200 2.8 300 X(t) X(l) 400 3.2 500 3.4 Données spectrométriques 0 100 200 300 400 time Pétrissage: résistance de la pâte 850 900 950 1000 1050 long. d’onde (l) Données spectrométriques Méthodes pour l’analyse des données fonctionnelles – p.3/44 Variable fonctionnelle et donnée fonctionnelle Définition [Ferraty et Vieu (2006)] : Une variable aléatoire est dite fonctionnelle si ses valeurs sont dans un espace de dimension infinie. Une observation d’une variable fonctionnelle est appelée donnée fonctionnelle X = {Xt : t ∈ T }, Xt : Ω → R - T ⊆ R : courbe - T ⊆ R2 : image Méthodes pour l’analyse des données fonctionnelles – p.4/44 “Tableau” des données : En pratique, une donnée fonctionnelle est observée dans un nombre fini d’instants : 0 = t0 < t1 < . . . < tk = T : {(t0 , Xt0 ), (t1 , Xt1 ), . . . , (tk , Xtk )}. X 0 t1 T time Méthodes pour l’analyse des données fonctionnelles – p.5/44 Caractère “fonctionnel” de la courbe : • interpolation : linéaire, spline, ... 500 300 400 X(t) 600 700 • lissage si les données sont observées avec erreurs 0 100 200 300 400 temps Lissage utilisant une base de fonctions (B-splines cubiques) Méthodes pour l’analyse des données fonctionnelles – p.6/44 100 200 300 300 400 X(t) 500 400 X(t) 500 600 600 700 700 Exemples : - lissage : 0 100 200 300 400 0 temps 100 200 300 400 temps - interpolation : 2.0 2.5 3.0 3.5 X(l) 4.0 4.5 5.0 5.5 Données spectrométriques 850 900 950 1000 1050 long. d’onde (l) Méthodes pour l’analyse des données fonctionnelles – p.7/44 Données fonctionnelles qualitatives Deville (1982) Xt ∈ {"Single", "Married", "Divorced", "Widowed"} 15 Divorced 11111111111111111111111111 0000000000000000000000 00001111111 0000000 00000000000000000000001111 1111111111111111111111 00001111111 0000000 00000000000000000000001111 1111111111111111111111 00001111111 0000000 00000000000000000000001111 1111111111111111111111 00001111111 0000000 0000000000000000000000 1111111111111111111111 0000 1111 0000000 1111111 Married Single 1111111111111111111111 Married 0000000000000000000000 00001111111 1111 0000000 00000000000000000000001111 1111111111111111111111 00001111111 0000000 00000000000000000000001111 1111111111111111111111 00001111111 0000000 00000000000000000000001111 1111111111111111111111 00001111111 0000000 00000000000000000000001111 1111111111111111111111 00001111111 0000000 0000000000000000000000351111 1111111111111111111111 0000381111111 000000045 111111111 000000000 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 22 time Evolution de l’état civil des femmes de 15 à 45 ans. - E = {1, 2, . . . m} = espace d’états, - (Ω, A, P ), X = {Xt : t ∈ [0, T ]}, Xt : Ω → E (processus Méthodes pour l’analyse des données fonctionnelles – p.8/44 de sauts). Mèthodes pour les données fonctionnelles Deville (1974) Saporta (1981) Ramsay et Silverman (1997, 2002, 2005) Ferraty et Vieu (2006) - Analyses factorielles - Modèles de régression - Classification Méthodes pour l’analyse des données fonctionnelles – p.9/44 Exemples : Données ACP Vecteur de dimension finie Données fonctionnelles X = (X1 , X2 , . . . Xp ) X = {Xt }t∈[0,T ] Matrice de cov. V : ∈ Mp×p (R) Opérateur de cov. C de noyau C(t,s) f.p. : u = (u1 , . . . , up ) ∈ Rp : V u = λu c.p. : ξ = u1 X1 + . . . + up Xp Régression linéaire E(Y |X = (x1 , . . . , xp )) : P β0 + pi=1 βi xi Z f.p. : u : T → R : C(t, s)u(s)ds = u(t) T R c.p. : ξ = T u(t)Xt dt E(Y |X = {x(t), t ∈ T }) : Z β0 + β(t)x(t)dt T Méthodes pour l’analyse des données fonctionnelles – p.10/44 ACP des données fonctionnelles {Xt : t ∈ [0, T ]} : - E(Xt2 ) < ∞, - L2 -continu, - ∀ω ∈ Ω : (Xt (ω))t∈[0,T ] ∈ L2 ([0, T ]), - E(Xt ) = 0, ∀t ∈ [0, T ]. C : L2 ([0, T ]) → L2 ([0, T ]), C f 7−→ g, g(t) = Z 0 T C(t, s)f (s)ds, ∀t ∈ [0, T ], C(t, s) = Cov(Xt Xs ), ∀s, t ∈ [0, T ]. C : autoadjoint, positif, compact et de trace finie. Méthodes pour l’analyse des données fonctionnelles – p.11/44 {λ1 ≥ λ2 ≥ . . .}, {fi }i≥1 : - λi ≥ 0, - lim λi = 0, i→∞ (fi |fj ) = δi,j . ∞ X i=1 Cfi = λi fi , λi < ∞ Z ξi = 0 T fi (t)Xt dt ∀i ≥ 1. {ξi }i≥1 : Var(ξi ) = λi , Cov(ξi , ξj ) = 0, i 6= j. W : L2 (Ω) → L2 (Ω), Wz = Z T 0 Xt E(Xt z)dt, ∀z ∈ L2 (Ω). Wξi = λi ξi , ∀i ≥ 1. Méthodes pour l’analyse des données fonctionnelles – p.12/44 Reconstitution des données en ACP ou décomposition de Karhunen-Loève : Xt = X i≥1 fi (t)ξi , ∀t ∈ [0, T ]. Approximation d’ordre K (K ≥ 1) : (K) Xt = K X i=1 fi (t)ξi , ∀t ∈ [0, T ]. Loève (1945) : X (K) est la meilleure approximation deX en norme L2 . V(Xt ) = Z T 0 E(Xt2 )dt λi . i≥1 V IK = = T r(C) = X (K) (Xt ) V(Xt ) K X λi i=1 = X λi ≤ 1. i≥1 Méthodes pour l’analyse des données fonctionnelles – p.13/44 Exemple : X = {Xt , t ∈ [0, T ]} : processus à accroissements stationnaires non corrélés (Poisson, le mouvement brownien) C(t, s) = c × min(t, s), c > 0. 4cT 2 , k = 1, . . . , ∞. - λk = 2 2 (2k − 1) π - fk (t) = r 2 sin((k − 12 )π Tt ) T - I1 = 81.1% - I2 = 90.1% - I3 = 93.3% - I4 = 95.0% Xt ≈ ξ1 f1 (t) = ξ1 r 2 πt sin( ) T 2T Méthodes pour l’analyse des données fonctionnelles – p.14/44 Estimation et approximation de l’ACP - Estimation Deville ’74, Dauxois et al. ’82 {X1 , X2 , . . . , XN } N 1 X Ĉ(t, s) = Xi (t)Xi (s), ∀(s, t) ∈ [0, T ] × [0, T ], N i=1 (Ĉf )(t) = Z 0 - T Ĉ(t, s)f (s)ds, ∀f ∈ L2 ([0, T ]). lim E(kĈ − Ck2 ) = 0, N →∞ 1 lim E(λ̂i − λi )2 = 0 (o(N − 2 )), N →∞ 1 lim E(kfˆi − fi k2 ) = 0 (o(N − 2 )). N →∞ Méthodes pour l’analyse des données fonctionnelles – p.15/44 - Interpolation {0 = t1 < t2 < . . . < tp = T }, {Xt0 , Xt2 , . . . , Xtp }. (Deville ’74 et Besse ’79) : ACP {Xt0 , Xt2 , . . . , Xtp } 6≈ ACP (Xt )t∈[0,T ] . Interpolation linéaire : IXt = p X i=0 ci φi (t), ∀t ∈ [0, T ], {φi }i=0,..,p , est une base dans un espace de fonctions et {ci }i=0..p v.a.r. : IXti = Xti p.s. ACP (IXt )t∈[0,T ] ≡ l’ACP {Xt0 , Xt1 , . . . , Xtp } avec pour métrique M = ΦΦ′ , où Φ = A−1 , A = (ai,j )0≤i,j≤p , ai,j = hφi , φj i. Le choix des fonctions d’interpolation est équivalent à celui d’une métrique. Deville ’74 : constantes par morceaux, Pardoux ’82 : splines linéaires, Aguilera ’93 : B-splines, Besse ’89 : splines, Méthodes pour l’analyse des données fonctionnelles – p.16/44 - Lissage {φ1 , . . . , φp } dans L2 ([0, T ]), lin. indep. Xt ≈ p X αi φ(t). i=1 ACP de X est equivalente à l’ACP de {α1 , . . . , αp } avec la métrique Φ = {hφi , φj i}. Méthodes pour l’analyse des données fonctionnelles – p.17/44 Implémentation R Le package fda Quelques fonctions utiles : - création d’une base de fonctions : create.bspline.basis - création d’un objet “donnée fonctionnelle” : data2fd - réalisation de l’ACP fonctionnelle : pca.fd - régression linéaire avec prédicteur fonctionnel sur les composantes principales : pcr, pls Méthodes pour l’analyse des données fonctionnelles – p.18/44 −0.04 0.02 0.06 fp[, 2] 0.040 0.025 fp[, 1] 0.055 Exemple. Les facteurs principaux : farines de Danone. 0 100 200 300 400 0 100 400 −0.05 0.05 0.10 fp[, 4] 0.00 −0.05 fp[, 3] 300 bonne[, 1] 0.05 bonne[, 1] 200 0 100 200 300 bonne[, 1] 400 0 100 200 300 400 Méthodes pour l’analyse des données fonctionnelles – p.19/44 bonne[, 1] Régression sur données fonctionnelles Y = f (X) + ε Y : - scalaire (R) - vectorielle scalaire (Rp ) - fonctionnelle (L2 ([0, T ])) - qualitative Modélisation paramétrique et non-paramétrique. Méthodes pour l’analyse des données fonctionnelles – p.20/44 Le modèle linéaire f - linéaire : théorm̀e de représentation de Riesz : f (X) = hX, βiL2 ([0,T ]) = Moindres carrés : E(Y Xt ) = Z Z T Xt β(t)dt, 0 β ∈ L2 ([0, T ]). T E(Xt Xs )β(s)ds 0 (W − H) En général, c’est un problème mal posé car Théorème (Picard) X c2 i < ∞, β unique ⇐⇒ 2 λ i≥1 i ci = Z 0 T E(Xt Y )fi (t)dt, {λi }i≥1 , {fi }i≥1 (ACP) X ci fi (t), t ∈ [0, T ]. β(t) = λ i i≥1 Exemple : Le processus X est un processus de Poisson sur [0,T] et Y = XT +h , h > 0. Alors, X 2 X c2 i = ∞, = 2 λ T i≥1 i≥1 i Ŷ = XT et β est la distribution de Dirac en T, δT . Méthodes pour l’analyse des données fonctionnelles – p.21/44 Régularisation des moindres carrés - réduction de la dimmension :X ≈ XS , S = {φ1 , . . . , φp } Régression sur les composantes principales (PCR) : S = {f1 , . . . , fp } - facteurs principaux de l’ACP de X (Deville (1978), Aguilera (1998), Cardot et al. (1999)) - pénalisation des moindres carrés : n 1X (Yi − hXi , βi)2 + λkβ (m) k2 β̂ = arg min β∈S n i=1 (Ramsay et Silverman (1997), Cardot et al. (2003)) - les moindres carrés partiels (PLS). β̂P LS n 1X 1 = arg min (Yi − hXi , βi)2 × hXi , βi2 n i=1 n | {z } β ∈ L2 ([0, T ]) | {z } kβk = 1 Méthodes pour l’analyse des données fonctionnelles – p.22/44 L’approche PLS pour données fonctionnelles X = {Xt }t∈[0,T ], Y = (Y1 , . . . , Yp ), p ≥ 1. {ti }i≥1 – variables aléatoires non-corrélées dans L2 (X) Théorème [Critère de Tucker] max w, c Cov 2 Z 0 T Xt w(t)dt, p X i=1 ci Yi ! w ∈ L2 ([0, T ]), kwk = 1 c ∈ Rp , kck = 1 est réalisé pour w et c, les vecteurs propres associés à la plus grande valeur propre des opérateurs UX , respectivement UY , où UX = CXY ◦ CY X et UY = CY X ◦ CXY . Méthodes pour l’analyse des données fonctionnelles – p.23/44 Les composantes PLS Soit w1 ∈ L2 ([0, T ]) : UX w1 = λmax w1 , t1 = Z T Xt w1 (t)dt 0 Proposition. WX WY t1 = λmax t1 Itération PLS : Let X0,t = Xt , ∀t ∈ [0, T ] and Y0,i = Yi , ∀i = 1, ..., p. (h) X WY Au pas h, h ≥ 1 : Wh−1 h−1 th = λmax th , Régression linéaire simple sur th : Xh,t = Xh−1,t − ph (t)th , Yh,i = Yh−1,i − ch,i th , {th }h≥1 - variables aléatoires {ph }h≥1 - fonctions de L2 ([0, T ]) {ch }h≥1 - vecteurs de Rp . t ∈ [0, T ], i = 1, ..., p. Méthodes pour l’analyse des données fonctionnelles – p.24/44 Théorème [Décomposition PLS] Pour tout h ≥ 1 : a) {ti }1≤i≤h – système orthogonal dans L2 (X), Z T b) Y = c1 t1 + c2 t2 + . . . ch th +Yh = Xt βP LS(h) (t)dt + Yh , | {z } 0 ŶP LS(h) c) Xt = p1 (t)t1 + p2 (t)t2 + . . . + ph (t)th + Xh,t , d) E(Yh,j ti ) = 0, ∀i = 1, ..., h, ∀j = 1, ..., p, e) E(Xh,t ti ) = 0, ∀t ∈ [0, T ], ∀i = 1, ..., h. Théorème [Convergence] lim E kŶP LS(h) − Ŷk2 = 0. h→∞ Théorème [PLS vs PCR] L’ajustement à l’aide des premières h composantes PLS est meilleur que celui avec les premières h composantes principales, R2 (Y, ŶP CR(h) ) ≤ R2 (Y, ŶP LS(h) ). Méthodes pour l’analyse des données fonctionnelles – p.25/44 Remarque : - analogie avec l’analyse canonique - prise en compte des relations existant entre les variables {Yi }i=1,...,p . - réponse fonctionnelle :Y = {Yt }t∈[0,T ′ ] . - choix de h en pratique : validation croisée. Méthodes pour l’analyse des données fonctionnelles – p.26/44 PLS et l’analyse discriminante linéaire fonctionnelle X = {Xt }t∈[0,T ] , Xt : Ω → R, Y : Ω → {1, . . . , K}, K ≥ 1, - P(Y = i) 6= 0, ∀i ∈ {1, . . . , K} Problème : Déterminer des scores discriminantes linéaires, Z T Φ(X) = Xt β(t)dt, β ∈ L2 [0, T ], 0 tels que V(E(Φ(X)|Y )) max β∈L2 [0,T ] V(Φ(X)) (James et Hastie (2001), Ratcliffe et al. (2002), Ferraty et Vieu (2003), Biau et al. (2005)) Méthodes pour l’analyse des données fonctionnelles – p.27/44 Réponse binaire : un problème mal posé Y ∈ {0, 1} : p = P(Y = 0), p = 1 − p = P(Y = 1), 0 1 0 µ0 (t) = E(Xt |Y = 0), µ1 (t) = E(Xt |Y = 1), t ∈ [0, 1]. Soient - C : l’opérateur de covariance de X - B : l’opérateur de covariance interclasses définit par Z T B f 7−→ g, g(t) = B(t, s)f (s)ds, 0 où B(t, s) = p0 p1 (µ0 (t) − µ1 (t))(µ0 (s) − µ1 (s)) = φ ⊗ φ, √ avec φ = p0 p1 (µ0 − µ1 ). Alors, Méthodes pour l’analyse des données fonctionnelles – p.28/44 La fonction discriminante, β, vérifie : Bβ = λCβ, Recoder Y par : 0 1 avec hβ, CβiL2 [0,T ] = 1. q − p1 , p0 q p0 p1 Alors, β est solution de l’équation Wiener-Hopf Z T E(Y Xt ) = E(Xt Xs )β(s)ds (W-H) 0 Méthodes pour l’analyse des données fonctionnelles – p.29/44 En pratique q q Y ∈ {0, 1} |{z} =⇒ Y ∈ { pp10 , − pp01 }. recodage Régression PLS de Y sur X = {Xt }t∈[0,T ] : - fonction discriminante : βP LS(h) . RT - score discriminant : Φ(X) = 0Xt βP LS(q) (t)dt. Prédiction : si Φ(X) ≤ 0 alors Y = 1 sinon Y = 0. Méthodes pour l’analyse des données fonctionnelles – p.30/44 Réponse multiple : K > 2 Y ∈ {1, . . . , K}. Soit Y = {Y1 , . . . , YK−1 } le vecteur aléatoire dont les composantes sont les variables indicatrices des modalités {1, . . . K − 1}. Méthodologie basée sur l’analogie entre l’analyse canonique et analyse discriminante : - régression PLS de Y sur X = {Xt }t∈[0,T ] : - déterminer les composantes PLS {t1 , . . . , th }, - réaliser l’analyse lináire discriminante classique de Y sur les composantes PLS. Méthodes pour l’analyse des données fonctionnelles – p.31/44 Modélisation non-paramétrique Y = f (X) + ε. Pn i=1 Yi K(d(x, Xi )/h) , fˆ(x) = P n K(d(x, X )/h) i i=1 (Ferraty et al. (2006) ! Convergence :φx (h) = P(d(x, X) < h). Estimation non-paramétrique de la fonction de répartition conditionnelle et du mode conditionnel. Précision des viteses de convergences. f : minimiser le risque empirique : n 1X C(Xi , Yi , f (Xi )) Remp [f ] = n i=1 Fonction de perte : C(x, y, f (x)) = 8 2 > > < (y − f (x)) > > : max{0, |f (x) − y| − ε} −yf (x) + log(1 + ef (x) ) - quadratique - ε - insensible - logistique (Y ∈ {0, 1}) Méthodes pour l’analyse des données fonctionnelles – p.32/44 Risque régularisé n 1X C(xi , yi , f (xi )) + λΩ[f ], Rreg [f ] = n i=1 où λ > 0 est un paramètre de régularisation et Ω[f ] un terme de stabilisation. (F, k · k), n 1X Rreg [f ] = C(xi , yi , f (xi )) + λkf k2F . n i=1 | {z } pénalité Im(X) ∈ H (H = L2 ([0, T ])) F = HK : K : H × H → R, symétrique et définie positive : HK = 8 d , d∈N > hx, yi > H > > < (c + hx, yiH )d , d ∈ N, c > 0 K(x, y) = > kx − yk2H > > > : − 2σ 2 , σ > 0, e ( n X i=1 ) ai K(ti , ·), ti∈H, ai∈R, n≥1 polynomial polynomial non-homogène gaussien Méthodes pour l’analyse des données fonctionnelles – p.33/44 Régression dans RKHS Théorème [Représentation] Soit {(xi , yi )}ni=1 , xi ∈ H, yi ∈ R, n > 0, n ∈ N, λ > 0 et C : H × R × R −→ R une fonction de perte convexe. Alors, la solution du problème : trouver fˆ ∈ HK qui minimise n 1X C xi , yi , fˆ(xi ) + λkfˆk2HK n i=1 existe, est unique et admet la représentation fˆ(x) = n X i=1 αi K(x, xi ), ∀x ∈ H, où αi ∈ R, i = 1, . . . , n. Méthodes pour l’analyse des données fonctionnelles – p.34/44 Exemple. C (x, y, f (x)) = (y − f (x))2 , {(xi , yi )}ni=1 , (λnI + [K])α = y, où α = (α1 , . . . , αn )′ , y = (y1 , . . . , yn )′ , [K] ∈ Mn (R), [K]i,j = K(xi , xj ), 1 ≤ i, j ≤ n. Perte logistique, ε - insensitive : méthode du gradient. Méthodes pour l’analyse des données fonctionnelles – p.35/44 Consistance dans RKHS Théorème [Consistance] Soit C la fonction de perte quadratique ou logistique et supposons qu’il existe MY > 0 tel que |Y | ≤ MY p.s. p Supposons aussi qu’il existe κ tel que ∀x ∈ H, K(x, x) ≤ κ. Alors, pour la fonction de perte quadratique on a 2 nε n n P Remp [fˆ ] − R[fˆ ] > β + ε ≤ 2 exp − 2 , 2 nβ + MY √κλ où β = 8κ2 MY2 1 + √1 λ 2 , nλ et pour la perte logistique, 2 2 2 κ 2nε λ n n ˆ ˆ ≤ 2 exp − . P Remp [f ] − R[f ] > ε + 4 nλ 9κ Méthodes pour l’analyse des données fonctionnelles – p.36/44 On a aussi : Corollaire. Avec les conditions du théorème de représentation on a : P Remp [f opt ] − Remp [fˆn ] −→ 0, P n opt ˆ R[f ] − R[f ] −→ 0. Méthodes pour l’analyse des données fonctionnelles – p.37/44 Applications. Données fonctionnelles. Parkinsoniens et l’angle de flexion du genou. Courbes de marche. 80 70 60 60 50 50 40 40 30 30 20 20 10 10 0 0 0 0 10 20 30 40 10 20 30 40 50 50 Sujets sains – (jeune–rouge, âgé–bleu) Sujets parkinsoniens. Question : Pour les sujets sains, l’âge a-t-il un effet sur la marche ? Courbes moyennes : 70 60 50 40 30 20 10 0 10 20 30 40 50 Méthodes pour l’analyse des données fonctionnelles – p.38/44 30 sujets jeunes 30 sujets âgés. Echantillon apprentissage : 40. Echantillon test : 20. Nombre échantillons : 100 Modèle Aire ROC PLS_FLDA PCR_FLog(4)) Gaussien (1) IP(1,2) IP(1,3) λ = 0.12 λ = 0.18 λ = 0.22 0.780 0.790 0.760 0.780 Moyenne de l’aire de la surface sous la courbe ROC. 0.750 Taux moyen de mal classés pour le meilleur modèle ≈ 30% Méthodes pour l’analyse des données fonctionnelles – p.39/44 Les farines de Danone X = {Xt }t∈[0,480] : résistence de la pâte durant 480s de pétrissage 700 Good 650 Bad 600 Adjustable Dough resistance 550 500 450 400 350 300 250 200 150 100 0 40 80 120 160 200 240 280 320 360 400 440 480 Time (s) 115 farines ; Qualité des biscuits : 50 (bonne), 40 (mauvaise), 25 (ajustable) Méthodes pour l’analyse des données fonctionnelles – p.40/44 Good 750 700 Bad 650 Adjustable Dough resistance 600 550 500 450 400 350 300 250 200 150 100 0 40 80 120 160 200 240 280 320 360 400 440 480 Time (s) Lissage avec des fonction B-splines cubique avec 16 noeuds Méthodes pour l’analyse des données fonctionnelles – p.41/44 Résultats : Y ∈ {bonne, mauvaise} 100 échantillons ; (apprentissage : 60 ; test : 30) Modèle PLS_FLDA K-NN(13) PC_FLDA Gaussien(6) LDA Taux de mal classés 0.112 0.103 0.142 0.108 0.154 Moyenne du taux des mal classés sur un ensemble de 100 échantillons test. La fonction discriminante Φ(X) = −1.46 + Beta PLS R 480 0 Xt β̂P LS (t)dt. discriminant coefficient function 1e−004 0e+000 −1e−004 −2e−004 −3e−004 time −4e−004 0 100 200 300 400 500 Méthodes pour l’analyse des données fonctionnelles – p.42/44 Y ∈ {bonne, ajustable, mauvaise} 100 échantillons ; (apprentissage : 70 ; test : 35) Modèle PLS_FLDA K-NN(13) PC_FLDA Gaussien(6) LDA Taux de mal classés 0.258 0.245 0.262 0.247 0.282 Moyenne du taux des mal classés sur un ensemble de 100 échantillons test. Méthodes pour l’analyse des données fonctionnelles – p.43/44 Bibliographie Méthodes pour l’analyse des données fonctionnelles – p.44/44