L` ApprenDssage ArDficiel

Transcription

L` ApprenDssage ArDficiel
415'"
BC"&@@-+'D2253+"&-DE7*+1""
A57+"5.F"G)''/+2"(+H@)-+11+2"
!"  #$%%&'()*'+,$-'..'("+("(I78+2"522)7*/+2"
#> 
J> 
6I78+2"
&'51K2+2"G+"(&/0'%1'()2%324230'..'()
#> 
,)H@-/8+'2*)'"
J> 
4-/G*7D)'"
L> 
:G+'DE75D)'"G+"2).2M2/N.+'7+2"
L>  "&'51K2+2"GC'%('+5.')3')(&/0'%1'()
&'()*'+",)-'./0)12"
&3-)45-*26+78"9":;<&"""=:&"%#$"
5'()*'+>7)-'.+0)12?53-)@5-*2(+78>A-"
#> 
,1.2(+-*'3"
J> 
,1522*E75D)'"2.@+-O*2/+"
P>  &@@-+'D2253+)'%6.27%'"+("+'O*-)''+H+'("%$%)(*89$%%82-')
#> 
B+"75G-+"G."-3-+("
J> 
B+"@-)Q1RH+"G+"1C).Q1*"
L> 
&@@-)78+2"+H@*-*N.+2"
%>  ":$%1.0(2$%())
!"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
J" !"#$%"
W.@+-O*2/""O2>";)'"2.@+-O*2/"
]785'D11)'"GC5@@-+'D2253+"
'%
S X"YU!"Z"!"VZ"U!#Z"!#VZ"["Z"U!$%Z"!$VZ"["Z"U!&Z"!%V\"
:'(-)G.7D)'"
(%
^)'7D)'"G+"G/7*2*)'"&'
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
L" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
P" !"#$%"
&@@-+'D2253+"(0,'-42(&)_"5'51K2+"2(5D2DN.+"
&@@-+'D2253+"2.@+-O*2/"_"5'51K2+"2(5D2DN.+"
m
REmp (h) =
! l ( h(x ), u )
i
i
i = 1
•  4-*'7*@+"_"
∀h ∈ H :
–  `'"2+"G)''+"H""
!
"
P R(h) > REmp (h) + G(H, m, δ) < 1 − δ
m
–  `'"78+-78+"&"!"H""A5*25'("@+."GC+--+.-"2.-"S"""
–  a'"+2@/-5'("N.+"&";'-8),'0)3<'--'0-"2.-"G+2"+F+H@1+2"b"O+'*-"
•  c-5*"2*"
–  d)''/+2"*>*>G>"
R(h) =
#
l ( h(x),u) P(x, y) dxdy
–  a'O*-)''+H+'("2(5D)''5*-+"
X "Y
•  B+e)'"+22+'D+11+"_ ""
!
()*+,-,'' ()*+,-,'3/4$,'
./01$2,'
56+'107$/0,8'
B)*"G+"
@-)Q5Q*1*(/"
0)*'(+"2.-"X"""Y"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
–  ,)'(-f1+-"15"S"75@57*(/"T"G+"H"""
%" !"#$%"
&@@-+'D2253+"2.@+-O*2/"_"1+"752"G+"15"-/3-+22*)'"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
g" !"#$%"
&@@-+'D2253+"2.@+-O*2/"_"1+"752"G+"15"-/3-+22*)'"
h : Rd → R
•  =8()G+"O-5*+"')D)'"G+"*'+,()
•  =8()G+"')D)'"G+"1$--&.89$%)(+H@)-+11+"
–  452"G+"')D)'"G+"H/H)*-+"b"7)'(-f1+-"
–  6).2"1+2"@)*'(2"2)'("/N.*O51+'(2"
• 
()()"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
h" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
$" !"#$%"
&@@-+'D2253+"5-DE7*+1"_"Q*15'"
•  &'51K2+"(8/)-*N.+"
–  W.-().("8,,-'%9((87')(0,'-42(&)
d)''/+2"(+H@)-+11+2"
–  d)''/+2)2"23")
+("(I78+2"522)7*/+2"
–  a'O*-)''+H+'("(*89$%%82-')
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
i" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#j" !"#$%"
6I78+2"GC5'51K2+"G+"2/N.+'7+2"U(+H@)-+11+2V"
•  >5?'*)'%)($2)
–  W/N.+'7+"GC57*G+2"5H*'/2"
–  W/N.+'7+2"G+"2)'2"
–  =)'G+"2(5D)''5*-+"
•  @%('+5.')3')(&/0'%1'())
–  ,).-Q+2"G+"7)'2)HH5D)'2"/1+7(-*N.+2"
–  =)'G+"2(5D)''5*-+"
9610:$74)6;''
1,'70*+,;<,'
a'O*-)''+H+'("(*89$%%82-'"
C6%.4/4$76;'
1,'70*+,;<,7'
#M"=..>'?;@:$A;,'
•  A.0B)3')3$%%&'()
–  ;/7+22*(/"GC.'"5@@-+'D2253+"+'M1*3'+"
JM"=14.24)6;'B'%6;1,''
–  a'O*-)''+H+'("2(5D)''5*-+")."')'"2(5D)''5*-+"
;6;'724)6;;4$/,'
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
##" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#J" !"#$%"
d)''/+2"(+H@)-+11+2"_"0%')2/N.+'7+"
d)''/+2"(+H@)-+11+2"_"0%')2/N.+'7+"
•  ,5-57(/-*2DN.+
•  DE'F2@;E'DE'F2@#E'F2@"E'F2'D'
""
–  B+2"F$"'+"2)'("@52"*>*>G>"
•  W/N.+'7+"E'*+")."')'""
•  B+2"F$"@+.O+'("k(-+"2(-.7(.-/2"
)C8)(&/0'%1'"+2("7)'2*G/-/+"7)HH+"0%)$5?'*)
–  F$"! Y2KHQ)1+2\"
•  `'"+'"78+-78+"25"2(-.7(.-+"""
–  F$"!"#"
•  </3-+22*)'"
–  F$"X"O+7(+.-"
•  B)*"G+"3/'/-5D)'"2).2M057+'(+"U+>3>"785l'+"G+"=5-m)OV"
–  F$"X"3-5@8+"
•  4-)7+22.2"2).2M057+'("2(5D)''5*-+"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#L" !"#$%"
d)''/+2"(+H@)-+11+2"_"0%')2/N.+'7+"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#P" !"#$%"
d)''/+2"(+H@)-+11+2"_".'"'%('+5.')G+"2/N.+'7+2"
Plan Time series structure Time series sources Motivations for mining time series Internships on machine learning fr
Time series structure
•  6I78+2"
•  :'G+F/+2")."')'"@5-"1+2"HkH+2"*'2(5'(2"
!" 
=-&3219$%)G+"15"2.*(+"G+"15"2/N.+'7+""""US"G6/,<47);A"TV"
D" 
E%8.F(')G+"15"2/N.+'7+"
•  d+"HkH+"1)'3.+.-")."')'"
A set of observations made sequentially in time:
n
, n = 1, . . . , N }
V = {v1:T
n
•  4).-"*'(+-@-/(5D)'"
•  :'G+F5D)'"
•  a>3>"
•  ["
L> 
–  ,).-2"G+"Q).-2+2"
<+78+-78+"G+"($0(6(&/0'%1'("A-/N.+'(+2")."5(K@*N.+2"
–  ,)'2)HH5D)'2"/1+7(-*N.+2""
•  +'"G*n/-+'(2"1*+.F"
•  +'"G*n/-+'(+2"25*2)'2"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#%" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#g" !"#$%"
d)''/+2"(+H@)-+11+2"_".'"'%('+5.')G+"2/N.+'7+2"
•  6I78+2"
#>  ",1522*E75D)'"2.@+-O*2/+"
•  :.8(('-)0%')%$04'..')(&/0'%1'"G5'2".'+"71522+"7)''.+"G+"2/N.+'7+2"
•  ]O+'(.+11+H+'(""@).-"A5*-+"G+2",-&3219$%()2.-"1C5O+'*-"
a'O*-)''+H+'("%$%)(*89$%%82-'"
J>  ",5(/3)-*25D)'""""US"<:+72,/$;A"TV"
•  6-).O+-"G+2"18*&7$-2'()G+"2/N.+'7+2"
L>  "<+N.k(+2"
•  ,8+-78+-"1+2"2/N.+'7+2"@-)78+2"GC.'+"2/N.+'7+"-+N.k(+"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#h" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#$" !"#$%"
a'"3/'/-51"_".'+"2+.1+"2/N.+'7+"
•  &@@-+'D2253+"b"@5-D-"GC.'"o.F"G+"G)''/+2"
•  6I78+2"
a'O*-)''+H+'("
–  =-&3219$%)3').8)(02*'"G+"15"2/N.+'7+"
2(5D)''5*-+"
DE'F2@;E'DE'F2@#E'F2@"E'F2''F2I"'JD'
–  E,,-'%9((87')'%6.27%'"U)'M1*'+"1+5-'*'3V"
5F2@;E'H2@;8E'DE'5F2@#E'H2@#8E'5F2@"E'H2@"8E'5F2E'H28'D'5F2I"E'H2I"8"p"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#i" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
Jj" !"#$%"
q.+11+2"G)''/+2"(+H@)-+11+2"p"
•  "&'51K2+"G+"2/N.+'7+2"3/')H*N.+2"
–  &'51K2+"G+"15"(*-01*0-')
–  ,1522*E75D)'!('7+'%*89$%)+'""*'(-)'2"O2>"aF)'2"
&'51K2+""
•  "6+F(+2"!"G)7.H+'(2"
G+"2/N.+'7+2"*'G*O*G.+11+2"
–  G3'%9H189$%)G+"_"&Q2(-57("r"*'(-)G.7D)'"r"["
–  G3'%9H189$%)G+2"(K@+2"GC5-3.H+'(2"
•  "W/N.+'7+2"O*G/)"
–  I'7+'%*89$%)+'"s).-'51"(/1/O*2/"r"@.Q"r""["
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
J#" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
JJ" !"#$%"
J0'.()+$3K.'())
E%8.F('-)@).-"7)H@-+'G-+"
@).-"1+2"2/-*+2"(+H@)-+11+2"p"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
JL" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
JP" !"#$%"
B5"-+@-/2+'(5D)'"G+2"2/N.+'7+2"
&'51K2+"!"7)H@-/8+'2*)'"GC.'+"2/N.+'7+"
#>  "L-0*')
#>  "=/(8)G+2"5'51KDN.+2"
–  &@-R2"@-/(-5*(+H+'(2"
J>  "<+@-/2+'(5D)'2"S"8%8.F9/0'("T"
L>  "</3-+22*)'"
–  45-"1$+52%82($%)3')1$+,$(8%*'("78)*2*+2"G5'2".'"G*7D)''5*-+"
–  ,)H@)25'(+2")-(8)3)'51+2"
P>  "<+78+-78+"G+"2(-.7(.-+2"
L>  "=)G/1*25D)'"G5'2".'+"1.8((')3<MF,$*MK('()
–  d5'2"71522+"G+"H)GR1+2"
•  t-5HH5*-+2"
•  ,85l'+2"G+"=5-m)O"
•  t-5HH5*-+2"
•  </2+5.F"G+"'+.-)'+2"
•  =)GR1+2"G+"=5-m)O"
•  ["
J%" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
N-8%(;$-+&')3')A$0-2'-"G*27-R(+"
• 
6-5'2A)-H/+"+'"$%3'.'O'()G*27-R(+"
• 
E,,-$B2+89$%)87-&7&'"@5-"H)-7+5.F"
• 
["
K6;;0,7'0$/)123./%
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
!"#$%&''(")*#&+*",-%".%
<+@-/2+'(5D)'2"5'51KDN.+2"
+*#$%-$(*$-/
• 
K6;;0,7')*+,+-./%
J>  "&'51K2+"+'",)H@>":'G+@>"U:,&V"
Jg" !"#$%"
&'51K2+-"15"2/N.+'7+"
%2345'4624758496474:;-;2<:7
•  :,&""
U":'G+@+'G+'(",)H@)'+'("&'51K2*2V"
00,"+$%+1&+%&22%$)3$'+%!45%
&($%($&2%6&27$8/
1<=4@5F-74=
?"77#1,
8*)H.9,
8.7#4&
#-;-5)=-9;2>4
#-;-5#2/;-;4=
?<:5#-;-5)=-9;2>4
J)"7
2+*+"&+"$*4,
8.7#4&
2.)+#7
:.#>>"$"#1+&,
*24/4A2745
*<@B:<32-@
2"1(34*)
'B3.<@2/
5*43#
'--)./"0*+".1
=)##&
&->4@4;7
6*17.0,
8*--"1(&
'94/;6-@
:4"--#7
;*+*
!"#$#%"&#
'(()#(*+#,
'--)./"0*+".1
--...//.
!
"! #! $! %! &!! &"!
!
"! #! $! %! &!! &"!
!
"! #! $! %! &!!&"!
!
"! #! $! %! &!! &"!
!
"! #! $! %! &!!&"!
!
"! #! $! %! &!!&"!
!
"! #! $! %! &!!&"!
-
#$%
#&%
'(#
)*+)
*))
*,)
-
*24/4A274
,2:4-6
)996<C23-;2<:
.
.
.
/
E1+#)-.4*+".1
/
';62:H7
[email protected]"$
'(()#(*+#
'--)./"0*+".1,,
D6;E<:<63-@
?<:
,<A46
F<I:=2:H
5*43#,
I*&#7
?**)
F2GD6;E<:<63-@
;*3@#$A"#&, :.">4#+&
7@1,,,1,B,C
;"&$)#+#,
<.3)"#),
=)*1&>.)0
;"&$)#+# :A#@D&A#9
:.&"1# !.4D1.0"*4&,
=)*1&>.)0
2D04#+&
24.-#,
I*&#7
.
'01
U^-)H"c*3u-*)"+("51Z"#ii$V>"L4%.:,7'6G'9?M'7$A;4:7E'7&6N$;A'
4/)G4<27'./61+<,1'O!'O:$;P$;AE'74<<41,7E'O$);A'4;1'<4/1$4<'
<!<:,>'Q6/',4<&'6G'2&,'R'.67$)6;7'7&6N;E'2&,'2N6'6/2&6A6;4:'
1$/,<)6;7'6G'2&,'7,;76/7'4/,'.:6-,1>"
<+@-/2+'(5D)'"O+7()-*+11+"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
6#()#&&".1
'7*-+"9#
F*+3)*4
!"#$#%"&#
G*1(3*(#,
:.1&+*1+
'--)./"0*+".1
Jh" !"#$%"
U^-)H"c*3u-*)"+("51Z"#ii$V>"S$;,'$;1,.,;1,;2'<6%.6;,;27'
G6+;1'G/6%'2&,'9?M'1424>'Q6/',4<&'<6%.6;,;2'2&,':,TE'O4<P'
4;1'/$A&2'3$,N7'6G'2&,'U,:1'.4-,/;7'A,;,/42,1'O!'2&,7,'
<6%.6;,;27'4/,'7&6N;'V'G+::':$;,'724;17'G6/'%4A;,)<'W+X'
<6%$;A'6+2'G/6%'2&,'&,41E'4;1'16-,1':$;,'2&,'W+X'$;N4/17>"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
J$" !"#$%"
=)G/1*25D)'2"G+2"2/-*+2"(+H@)-+11+2"
•  S",1522*N.+2"T"
–  t-5HH5*-+2"
–  ,85l'+2"G+"=5-m)O"
<+78+-78+"G+"($0(6(&/0'%1'();-&/0'%*'("
–  ["
•  "=)*'2"71522*N.+2"
–  </2+5.F"G+"'+.-)'+2"-/7.--+'(2"
–  S"<+2+-O)*-"7)[email protected]'3"T"
–  ["
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
Ji" !"#$%"
W).2M2/N.+'7+2"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
Lj" !"#$%"
d+.F"7)'(+F(+2"G*n/-+'(2"
•  `'"2.@@)2+""
•  <+78+-78+"G+"H)DA2"2/N.+'D+12"A-/N.+'(2"
–  &1@85Q+("E'*"
#>  d5'2".'+"L#)(*89/0'
–  6+H@2"G*27-+(""""Uv"2/-*+2"(+H@)-+11+2V"
""
•  41.2*+.-2"@522+2"@)22*Q1+2"
•  aF+H@1+2"
J>  d5'2".'"P$*)3')3$%%&'()
–  K,7'<:$,;27'4<&,24;2'+;'6/1$;42,+/'.6/24O:,E'4<&Y2,;2'76+3,;2'+;,'
•  6-5*(+H+'("S"b"15"O)1/+"T"
$%./$%4;2,'.:+7'24/1'5,2'1,7'<4/26+<&,7'1Z,;</,8'
–  K,7'.4),;27'<6%%,;[4;2'B'./,;1/,'*+6)1$,;;,%,;2':,'%01$<4%,;2'F'7,'
%,-,;2'B'76+\/$/'1,'%4+X'1,'2]2,'.:+7$,+/7'7,%4$;,7'.:+7'24/1'
–  ^0A+:4/$207'14;7':4'70*+,;<,'1,'.4*+,27'_C`ab`'2/4;7$24;2'7+/'+;'/07,4+'
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
L#" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
LJ" !"#$%"
<+78+-78+"G+"2).2M2(-.7(.-+2"A-/N.+'(+2"
<+78+-78+"G+"2).2M2/N.+'7+2"A-/N.+'(+2"
1. DÉFINITIONS ET PROBLÉMATIQUE
29
•  @%('+5.')3<2*'+("I"X"YO*\>""
telles que fS ! σ. L’ensemble des motifs séquentiels pour la valeur σ dans la base de données D
•  W)*(".'+"Q52+"G+"G)''/+2"D""
•  E"X"PUIV"+2("1C+'2+HQ1+"G+"().2"1+2"&4K%'+'%*()@)22*Q1+2"
est noté FSeqs(D, σ).
(2.3)
FSeqs(D, σ) := {S | Support(S, D) ! σ}
•  W)*("$*".'"/O/'+H+'("
•  %"S"(-5'257D)'2"T"7"7)'2D(./+2"GC*(+H2"O'
Avec 0 < σ " 1 dans le cas où σ est un seuil de fréquence et 0 < σ " |D| dans le cas où σ est un
•  w'+"(&/0'%1')+2(".'+"1*2(+")-G)''/+"$
seuil de support.
#"Mx"$J"Mx"["Mx"$'""
INTRODUCTION
–  ""I"X"Y&Z"yZ",Z"dZ"aZ"^\"
La propriété suivante est considérée comme la propriété centrale pour la construction d’algo-
24
•  B5"-+78+-78+"G+"2).2M2(-.7(.-+2"A-/N.+'(+2"U+>3>"2).2M2/N.+'7+2V"
rithmes efficaces d’extractions de motifs.
–  ""&"Mx"&y"Mx"y,d"Mx"&a"
Propriété 1 (Antimonotonie [AIS93]). Soit S ! et S deux séquences. Si S ! ! S alors Support(S ! ) !
•  I$0(6(&/0'%1'()Support(S) (ou f
sur la base de données.
+2("G+"7)H@1+F*(/"7517.15()*-+"+F@)'+'D+11+"
–  ""&"Mx"&"
S!
! fS ).
La propriété suivante est une conséquence de la propriété 1.
– Des méthodes d’échantillonnages
motifs 2.
séquentiels
pour les
de Quelle que soit S telle que S ! ! S, S est une
–  ""&"Mx"a"pour les
Propriété
Soit S ! une séquence
nonbases
fréquente.
données statiques et les flots
de
données
:
Ces
méthodes
se
basent
sur
l’échantillonnage
séquence
non
fréquente.
–  ""&y"Mx"y"Mx"a"
par réservoir. Nous introduisons des garanties sur la précision de l’échantillon et sa complé-
En effet, d’après cette propriété, Support(B) " Support(A) < σ, donc B n’est pas fréquent.
–  ""&a"
tude ainsi qu’un algorithme de pré-traitement du flot dans le cadre de l’extraction de motifs
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
LL" !"#$%"
séquentiels sur les flots.
Id. Séquence
Séquences
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
1
LP" !"#$%"
(a, b)(a, b)(b, d, e)
– Un algorithme d’extraction de motifs séquentiels multidimensionnels
2 sur les
(a, b, c, d, e)(b, e)
flots : Nous proposons un algorithme d’extraction de motifs séquentiels multidimension3
(b, c, e)
nels sur les flots de données. L’espace de recherche associé à cette problématique4 étant très(a, c)(b, c, e)
5
(c)(c)(d)(b, c, e)
vaste, nous proposons un algorithme permettant un parcours efficace de cet espace
de re-
=)DA2"2/N.+'D+12"G5'2".'+"yd"2(5DN.+"
=)DA2"2/N.+'D+12"G5'2".'+"yd"2(5DN.+"
cherche et permettant d’extraire de la connaissance en temps quasi-réel.
Tab. 2.1: La base de données transactionnelles exemple
Tout au long de ce mémoire nous utiliserons la base
de données
exemple suivante
Table
Exemple
2.3. Considérons
la base de(voir
données
D du chapitre 1 et représentée dans la table 2.1.
•  aF+H@1+"
60% (i.e. pour qu’une séquence s soit retenue, il
Avecbase
un seuil
fréquence minimum
de 53 soit
1.2) afin d’illustrer les différentes
propositions. Cette
seradecomplétée
dans la σpartie
Flot
•  =.1D@1+2"@522+2"@)22*Q1+2"
20
•  &13)-*(8H+2"N.*"2)'("G+2"+F(+'2*)'2"G+"&@-*)-*"
Client
Date
C1
01/04/2008
{Pain,Cola}
C1
02/04/2008
C1
04/04/2008
C1
18/04/2008
{Pain,Yaourt}
C2
11/04/2008
C2
12/04/2008
C2
C3
INTRODUCTION
faut qu’au
moins
séquencessont
dans disponibles
la base de données la supportent), les séquences fréquentes
de Données pour pouvoir prendre en compte d’une part
le fait
que trois
les données
sont alors les suivantes :
dynamiquement mais également qu’elles peuvent avoir
plusieurs dimensions.
Items
Id. Séquence
Séquences
{Chips,Pain}
1
(a, b)(a, b)(b, d, e)
{Pain}
2
(a, b, c, d, e)(b, e)
{Chips}
3
(b, c, e)
{Chocolat}
4
(a, c)(b, c, e)
29/04/2008
{Yaourt, Pain, Chocolat}
05/04/2008
{Chips,Pain}
5
(c)(c)(d)(b, c, e)
C3
12/04/2008
{Yaourt,Pain}
C4
06/04/2008
{Chips}
C4
07/04/2008
{Chips}
C4
08/04/2008
{Yaourt}
Fig. 1.2: Une base de données exemple contenant 4 clients (4 séquences de transactions)
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
transactions. Nous définissons formellement la problématique de l’extraction de motifs dans le
chapitre mais intuitivement, si nous considérons la base de données illustrée dans la Table 1.2,
nous recherchons à extraire des séquences du type : !(chips)(pain, yaourt)" que l’on peut traduire
par X% des clients ont acheté des chips puis après ont acheté du pain et des yaourts.


"a# : 3





"b# : 5






 "c# : 4
FSeqs(D, σ) =
"d# : 3



 "e# : 5











"(a)(b)# : 3 "(c)(b, e)# : 3 



"(a)(e)# : 3 "(a)(b, e)# : 3 





"(b, c)# : 4


"(b, e)# : 5




"(c)(b)# : 3





"(c, e)# : 4




"(c)(e)# : 3
Tab. 1.2: La base de données transactionnelles exemple
4
L%" !"#$%"
Organisation du mémoire
Le mémoire est organisé de la manière suivante :
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
Lg" !"#$%"
<+78+-78+"G+"2).2M2/N.+'7+2"A-/N.+'(+2"
Frequent subsequence mining
Frequent subsequence mining
Problem formulation
Problem formulation
•  <+78+-78+"G+2"2).2M2/N.+'7+2"G+"2.@@)-("x"H*'z2.@@)-("
•  B<&*8,')3')7&%&-89$%)+2(",.0()1$+,.'B'"N.+"7+11+"@).-"1+2"*(+H2+(2>""
•  d5'2"1+"752"G+2"2/N.+'7+2Z"*1"+F*2(+"G+.F"H5'*R-+2"GC/(+'G-+".'+"
2/N.+'7+"@5-".'"*(+H"_""
TID
1
2
3
4
5
–  1C+F(+'2*)'"G+"2/N.+'7+"UI6@B*'%(2$%V""
•  BC*(+H"+2("50).(/"b"15"2/N.+'7+"7)HH+"').O+1"*(+H2+("
–  1C+F(+'2*)'"GC*(+H2+("UG6)@B*'%(2$%V>""
•  BC*(+H"+2("50).(/"5."G+-'*+-"*(+H2+("G+"15"2/N.+'7+"b"/(+'G-+>"
Database D:
Database D:
TID
1
2
3
4
5
Transaction
A → AB → BCD → E
CE → AB → F → CDE
BE → B → AF → ACE
A → E → BF
BCD → AF → ABF
Transaction
A → AB → BCD → E
CE → AB → F → CDE
BE → B → AF → ACE
A → E → BF
BCD → AF → ABF
we are searching for
subsequence in the transactions
t ∈ D that
we are searching
for subsequence in the transactions t ∈ D that
B5"2).2M2/N.+'7+""='@c=""
occurs in at least min_support transactions.occurs in at least min_support transactions.
5".'"=*'z2.@@)-("X"L"
for example, the sequence A → A occurs in 3 transactions.
•  W)*("2"X"⟨U5VUQV⟩".'+"2/N.+'7+Z""
–  .'+"G)6@B*'%(2$%"G+"15"2/N.+'7+"5O+7"1C*(+H"7"G)''+"15"2/N.+'7+"2C"2.*O5'(+"_"2C"X"⟨U5VUQZ"1V⟩>""
–  w'+"I6@B*'%(2$%"G+"15"2/N.+'7+"5O+7"1C*(+H"7"G)''+"15"2/N.+'7+"2CC"2.*O5'(+"_"2CC"X"⟨U5VUQVQ1R⟩>"
Department of Computer Science
Department of Computer Science
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
Robert Kessl (CS CAS)
Lh" !"#$%"
<+78+-78+"G+"2).2M2/N.+'7+2"A-/N.+'(+2"
• 
–  dC.'+"@-)@-*/(/"GC5'DMH)')()'*7*(/"
• 
Frequent subsequence mining
The hyperlattice
–  tW4"
–  W@5G+"
–  4-+EFW@5'"
–  ["
L$" !"#$%"
18. March 2010
Problem of sequential pattern mining first introduced in:
• 
AB → A
��
B → AB ��
�����
�
��
����
����
����
���� ������
����
����
�� ������
����
��
�
����
�
����
��� ��������������
�
���
���
.
.
.
...
AB ��
A→A
�
�
� B→A
�
� ��
�
�
�
�������� B → A
�
�
���
������������
���������
��
���������������������������������������������������
�
�
�
��������������������� ������
������� ��� B �������
A ��
C
����
�
�� D ������ E
����
��
�
����
�� �����
�
����
� �
��� ��������
∅
�
• 
Some efficient sequential pattern mining algorithms have been proposed in:
–  M. Zaki. Spade: An efficient algorithm for mining sequences. Machine Learning, 40:31–
60, 2001.
–  J. Ayres, J. Gehrke, T. Yiu, and J. Flannick. Sequential pattern mining using a bitmap
representation. In Proc. of ACM SIGKDD, pages 429–435, 2002.
!"#$%"
Meet of α, β is the set of minimal uppper bounds, denoted by α ∧ β.
Join of α, β is the set of all maximal lower bounds, denoted by α ∨ β.
Department of Computer Science
Frequent subsequence mining
The Itemset Enumeration Tree was described in:
–  R. J. Bayardo. Efficiently mining long patterns from databases. In Proc. of ACM
SIGMOD, pages 85–93, 1998.
top � of the lattice L is � = ∞.
bottom ⊥ of the lattice L is an empty sequence ∅
Li" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
Let α, β be two sequences, then:
Robert Kessl (CS CAS)
An extension to episodes (i.e. combinations of events with a partially specified order)
was proposed in:
–  H. Mannila, H. Toivonen, and A. Verkamo. Discovering Frequent episodes in sequences. In
Proc. of ACM SIGKDD, pages 210–215, 1995.
Part of the lattice of all sequences L:
–  t/'/-51*25D)'2"G+"
1C513)-*(8H+"&@-*)-*"
6 / 30
–  R. Agrawal and R. Srikant. Fast algorithms for mining association rules. In proc. of VLDB,
pages 487-499, 1994.
–  dC.'"(-+*11*2"2.-"1+2"2/N.+'7+2"
E.7$-2*M+'()
18. March 2010
Robert Kessl (CS CAS)
Frequent subsequence mining
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
Références (1/2)
•  aF@1)*(5D)'"
• 
Frequent subsequence mining
18. March 2010
8 / 30
6 / 30
Références (2/2)
• 
Closed sequential pattern mining:
–  X. Yan, J. Han, and R. Afshar. Clospan: Mining closed sequential patterns in large databases. In
Proc. of SDM, 2003.
–  J.Wang and J. Han. Bide: Efficient mining of frequent closed sequences. In Proc. of IEEE ICDE,
pages 79–90, 2004.
• 
B+2"3-5HH5*-+2"
Mining association rules in temporal and spatio-temporal databases:
–  T. Abraham and J. F. Roddick. Incremental meta-mining from large temporal data sets. In ER ’98:
Proceedings of the Workshops on Data Warehousing and Data Mining, pages 41–54, 1999.
–  X. Chen and I. Petrounias. Mining temporal features in association rules. In Proc. of PKDD, pages
295–300, London, UK, 1999. Springer-Verlag.
–  I. Tsoukatos and D. Gunopulos. Efficient mining of spatiotemporal patterns. In Proc. of the SSTD,
pages 425–442, 2001.
• 
Discovering temporal patterns of Interval-based Events:
–  P. Kam and A. W. Fu. Discovering temporal patterns of Interval-based Events. In Proc. of
the DaWak, pages 317–326, London, UK, 2000. Springer-Verlag.
!"#$%"
t-5HH5*-+2"U5.()H5(+2V"
t-5HH5*-+2"U5.()H5(+2V"
5"Q"5"5"5"Q"Q"5"5"Q"Q"5"Q"Q"5"Q"Q"5"["
a
a
1
•  E,,-'%9((87')G+"3-5HH5*-+2"
–  {"@5-D-"GC.'"/785'D11)'"G+"2/N.+'7+2"@)2*DO+2"U+("'/35DO+2V"
b
2
b
–  &13)-*(8H+2"GC*'A/-+'7+"3-5HH5D751+"
a
b
4
a
b
a
b
a
b
b
PJ" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
b
3
a
b
a
a
b
a
b
a
b
b
a
b
•  q.+2D)'2""
a
b
a
b
a
b
–  &.()H5(+"75')'*N.+"p"U.'*7*(/"pV"
b
4+.("2+-O*-"b"15"@-/G*7D)'"
–  &@@-+'D2253+"p"
a
b
a
b
a
b
a
b
b
–  a("2*"Q-.*("p"
b
–  :G+'DE75D)'"G+2"/(5(2"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
PL" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
PP" !"#$%"
,85l'+2"G+"=5-m)O"
•  :'(-)G.7D)'"G+"@-)Q5Q*1*(/2"2.-"
1+2"(-5'2*D)'2"
–  =+*11+.-+"()1/-5'7+"5."Q-.*("
–  &@@-+'D2253+"G+"H5(-*7+"G+"
(-5'2*D)'"
S$3K.'()3')S8-T$4"
•  I0,,$(')
–  4-)7+22.2"2(5D)''5*-+"
–  =/H)*-+"b".'"/(5("
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
P%" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
|==""U|*GG+'"=5-m)O",85*'2V"
Pg" !"#$%"
|=="+("2+3H+'(5D)'"
#"L"P"%"L"P"g"J"P"%"J"P"%"#"#"#"J"P"%"L"J"%"J"J"%"P"L"
",517.1+-"15"2/N.+'7+"15"@1.2"@-)Q5Q1+"GC/(5(2"7578/2"UG/2"@*@/2V"5K5'("+'3+'G-/"7+}+"2/N.+'7+"G+"D-53+2"
a>3>"`'"25*("N.+"15"2/N.+'7+"+2("*22.+"G."D-53+"@5-"U)3&("2.77+22*O+H+'(Z"7857.'"
/(5'("Q*5*2/"GC.'+"H5'*R-+"2@/7*EN.+ ""
,)G*'3"
452253+2"
"'B$%("~MMx"2%*-$%("
!)
V"X)
E))V"X)
:))V"VY)
W))V"VZ)
N))V"VY)
V"!)
&6t"
6&&"
!)
V"!)
E))V"DU)
G%*'-7'%') :))V"DU)
W))V"DU)
N))V"DU)
V"X)
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
Ph" !"#$%"
!"#$%"
d/E'*D)'2"
,85l'+"G+"=5-m)O")Q2+-O5Q1+"
P"("X"(t" "n")" =" x"n" X"(t" "n"-1" ")" =" x"n"-1" ",...,"X"(t" 1" ")" =" x1" ")" =" P"("X"(t" "n")" =" x"n" X"(t" "n"-1" ")" =" x"n"-1" ")"
Ex: Une suite de lancers de dés 1,3,2,5,3,6,2,4
qui devient par abus de notation
P"("X"(t" "n")" =" x"n" X"(t" "n"-1" ")" =" x"n"-1" ")" =" P"("x"n" x"n"-1" ")"
Si à l ’instant ti, on a observé la réalisation xi de X(t) alors
P"("X"(t" "n")" %"x"n" X"(t" "n"-1" "),...,"X"(t" 1" ")")" =" P"("X"(t" "n")" %"x"n" X"(t" "n"-1" "))"
Exemple:
Alphabet & = {‘A’,’C’,’G’,’T’}
Séquence :
ACGCCTAGGCTAGCTTATCG
L’état courant d’un système contient toute l’information pour prédire son état futur.
!"#$%"
!"#$%"
4-)@-*/(/2"G"C.'+"785l'+"G+"=5-m)O"
<+@-/2+'(5D)'"G"C.'+"785l'+"G+"=5-m)O"
Formellement, il suffit de définir:
•  L’espace d’états: l’alphabet ! = {x1,..., xM} des réalisations possibles de X(t)
Probabilité d’une séquence O = (x1, ..., xn)
•  La matrice de transition
P"("x"n","x"n"-1" ",...,"x1" ")"=" P"("x"n" x"n"-1" ",...,"x1" ")""' P"("x"n"-1" ",...,"x1" ")"
A = {aij= P(xj|xi)}
•  Les probabilités de départ " = {#i = P(xi)}
P"("x"n","x"n"-1" ",...,"x1" ")"=" P"("x"n" x"n"-1" ")""' P"(x" "n"-1" "x"n"-"2",...,"x1"")""' P"(x" "n"-"2",...,"x1" ")"
Représentation Graphique
....."
Exemple:
P"("x"n","x"n"-1" ",...,"x1" ")"=" P"("x"n" x"n"-1" ")""' P"(x" "n"-1" "x"n"-"2")""'...""' P"("x"2" x1" ")""'P"(x" 1" ")"
0.4
X(t):Temps
Neige
! = {‘ neige ’,‘ pluie ’, ’soleil ’}
n"
P"(O
" )" "=" P"("x"n","x"n"-1" ",...,"x1" ")"=" P"(x
" 1" ")""' (' P"(x
" "n" x"n"-1" ")"
A=
t"="2"
& 0.4 0.3 0.3 #
$
!
$ 0.2 0.6 0.2 !
$ 0.1 0.1 0.8 !
%
"
" = {0.02 , 0.4, 0.58}
!"#$%"
0.02
0.3
0.58
0.6
0.2
Pluie
0.3
0.1
0.2
Soleil
0.1
0.4
0.8
%J" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
=-&42(2$%)b"1"C5*G+"GC.'+"785l'+"G+"=5-m)O"
aF+H@1+"G"C5@@1*75D)'"G"C.'+"785l'+"G+"=5-m)O"
Application:
Système d!’événements complet :
M"
P"("X"(t" ")"="x"i")"=" )' P" "("X"(t" ")"="x"i" X"(t" "-"1)" "="x"j")""' P"("X"(t" "-"1)" "="x"j")" "
j"=1" "
Représentation Graphique
Quelle est la probabilité qu ’il fasse ‘ Soleil ’,
5 jours de suite ?
0.4
P(Soleil, Soleil, Soleil, Soleil, Soleil)=
Neige
0.58*0.8*0.8*0.8*0.8 =0.2375
0.02
0.6
0.3
0.58
P(Neige, Neige, Pluie, Pluie, Soleil)=
0.2
Pluie
0.3
0.1
0.2
]
Hypothèse de stationnarité :
P"("X"(t" ")"="x"i" X"(t" "-"1)" "="x"j")"=" P"(x" "i" x"j")"="ai"","j"
0.1
Soleil
Quelle est la probabilité qu ’il fasse ‘ Soleil ’ dans 3 jours ?
0.4
P( X (3) =' S ' ) = P(' S ' ' N ' ) ! P( X (2) =' N ' ) + P(' S ' ' P' ) ! P( X (2) =' P' ) + !
0.8
0.02*0.4*0.3*0.6*0.2=0,000288
[
P(' S ' ' S ' ) ! P( X (2) =' S ' )
m
!a
ij
m
=1
!"
j =1
i
!
P( X (3) =' S ' ) = 0.3 * (0.4 * 0.02 + 0.2 * 0.4 + 0.1* 0.58) + 0.2 * (0.3 * 0.02 + ...
0.6 * 0.4 + 0.1* 0.58) + 0.8 * (0.3 * 0.02 + 0.2 * 0.4 + 0.8 * 0.58) = 0.5446
=1
i =1
!"#$%"
!"#$%"
=-&42(2$%)b"1"C5*G+"GC.'+"785l'+"G+"=5-m)O"
=)GR1+2"G+"=5-m)O"b"/(5(2"7578/2"
M"
P"("X"(t" "3")"="x"k" X"(t"1" ")"="x"i")"=")' P"("X"(t" "3")"="x"k" X"(t" "2")"="x"j")"P"("X"(t" "2")"="x"j" X"(t"1" ")"="x"i")"
j"=1" "
Principe : La séquence observée est une fonction de probabilité d’une chaîne de
Markov sous-jacente (cachée)
Système
Quelle est la probabilité qu’il fasse ‘ Soleil’ dans 3 jours sachant qu’il neige aujourd’hui ?
0.4
N
0.3
0.3 P 0.2
N
0.3
S
Observations
S
S
N
P
S
P
S
Etat interne
(caché)
s1
s2
s1
s3
s2
s2
s1
S
0.8
P( X (3) =' S ' X (1) =' N ') = P(' S ' ' N ' ) ! P(' N ' ' N ') + P(' S ' ' P' ) ! P(' P' ' N ') + !
Attention, la fonction d’émission de chaque état est probabiliste !!
P(' S ' ' S ' ) ! P(' S ' ' N ') = 0.3 * 0.4 + 0.2 * 0.3 + 0.8 * 0.3 = 0.42
!"#$%"
!"#$%"
w'"+F+H@1+"G+"|=="
d/E'*D)'"G"C.'"H)GR1+"G+"=5-m)O"7578/"U|==V"
S = {‘ Printemps ’, ’Eté ’, ‘ Automne ’, ’Hiver ’}
! = {‘ N ’, ’P ’, ’S ’}
A = {ai,j} modèle ergodique
E = {ej(.)} loi multinomiale
N=0.1
P=0.45
S=0.45
Printemps
e1(.)
s1
e3(.)
A
s2
N=0.01
P=0.13
S=0.86
e2(.)
0.25
!"#$%"
!"#$%"
L"N.+2D)'2"*H@)-(5'(+2"
4-)Q1RH+"#_""](5'("G)''/2".'"|=="dX~!ELE"E=E?x"+(".'+"2/N.+'7+""
"""""""""""""""""""""")Q2+-O/+""e'X"X#Z>>>Z"X_Z"
•  f+,::,',72':4'./6O4O$:$20'1Z+;,'70*+,;<,'16;;0,'J'
!  "Algorithme Forward"
•  f+,::,',72':4'2/4g,<26$/,':4'.:+7'./6O4O:,'.6+/':4'./61+<)6;'1Z+;,'70*+,;<,'
16;;0,'J"
4-)Q1RH+"J_""](5'("G)''/2".'"|=="d"+(".'+"2/N.+'7+")Q2+-O/+"eZ"
–  4-.55.%./3%56%/@4-.+).%A%0./%@363/%)6)(@/%4-$%6%56%B1*868$5$3@%&6!$&65.%
0C67*$1%.+D.+01@%!%?"
• 
N=0.05
P=0.55
S=0.4
s3
–  4-.55.%./3%56%716$/.&856+).%9:;%<%=>%0.%;%/-$76+3%=%?%
• 
0.25
Automne
0.25
q.+"@+.(M)'"A5*-+"5O+7".'"|=="p"
• 
Hiver
0.25
Eté
"
N=0.2
P=0.5
S=0.3
!  "Algorithme de Viterbi"
•  C6%%,;2'4../,;1/,':,7'.4/4%Y2/,7'1Z+;'d99'024;2'16;;0'+;',;7,%O:,'1,'
70*+,;<,7'J'
4-)Q1RH+"L_""{"@5-D-"GC.'"+'2+HQ1+"GC)Q2+-O5D)'2"X"XYX#Z>>>Z"X;\Z"
!  "Algorithme Forward-Backward (Baum-Welch)"
–  )*&&.+3%6E-/3.1%5./%B616&231./%0-%=FF%=X~!ELE"E=E?x"B*-1%
&6!$&$/.1%56%716$/.&856+).%0.%5C.+/.&85.%0C6BB1.+,//6D.%4U;""dV"?%
!"#$%"
!"#$%"
L"N.+2D)'2"*H@)-(5'(+2""U#V"
q.+11+"+2("15"@-)Q5Q*1*(/"GC.'+"2/N.+'7+"G)''/+"p"
•  f+,::,',72':4'./6O4O$:$20'1Z+;,'70*+,;<,'16;;0,'J'
•  B5"@-)Q5Q*1*(/"N.+"15"(-50+7()*-+"7jZ"7#Z"[7_I""5*("/(/"2.*O*+"+("N.+"15"2/N.+'7+"
!  "Algorithme Forward"
X#Z"[Z"X_"5*("/(/"@-)G.*(+"+2("_"
•  f+,::,',72':4'2/4g,<26$/,':4'.:+7'./6O4O:,'.6+/':4'./61+<)6;'1Z+;,'70*+,;<,'
16;;0,'J"
!  "Algorithme de Viterbi"
•  C6%%,;2'4../,;1/,':,7'.4/4%Y2/,7'1Z+;'d99'024;2'16;;0'+;',;7,%O:,'1,'
70*+,;<,7'J'
U+'"2.@@)25'("N.+"G/Q.("!"E'"2)'("1+2"2+.12"/(5(2"2*1+'7*+.F"2.-"15"(-50+7()*-+V"
!  "Algorithme Forward-Backward (Baum-Welch)"
!"#$%"
!"#$%"
q.+11+"+2("15"@-)Q5Q*1*(/"GC.'+"2/N.+'7+"G)''/+"p"
q.+11+"+2("15"@-)Q5Q*1*(/"GC.'+"2/N.+'7+"G)''/+"p"
•  W*")'"@522+"@5-"1+2"/(5(2"#"#"L"
•  B5"@-)Q5Q*1*(/"2.-"().2"1+2"78+H*'2"+2("_""
S
:7*Z")'"2.@@)2+"G+.F"/(5(2"2*1+'7*+.F"_"
G/@5-("7j"+("5--*O/+"7_Ä#"
! 
! 
!"#$%"
Mais le nombre de chemins peut être exponentiel en la longueur de la
séquence …
L’algorithme Forward permet de calculer cela efficacement
!"#$%"
BC513)-*(8H+"^)-Å5-G"
BC513)-*(8H+"^)-Å5-G"
•  B5"@-)Q5Q*1*(/"G+"15"2.*(+"GC)Q2+-O5D)'2"O X"UX#Z"[Z"X_VZ""/(5'("G)''/"1+"
H)GR1+"dZ"+2("_""
•  W)*("$PU$V"15"@-)Q5Q*1*(/"GCk(-+"G5'2"1C/(5("P"5@-R2"5O)*-")Q2+-O/"1+2"
$"@-+H*+-2"75-57(R-+2"G+"15"2/N.+'7+"e"""
•  ;).2"O).1)'2"7517.1+-"$SUhVZ"15"@-)Q5Q*1*(/"GCk(-+"G5'2"1C/(5("E'51"
5@-R2"5O)*-")Q2+-O/"().(+"15"2/N.+'7+"e"""
•  `-")'"5"1+2"-+15D)'2"_"
•  `'"@+.("2CK"@-+'G-+"-/7.-2*O+H+'("
•  dC)Ç""
:$+,.'B2*&)'%)>QGHR)[)
!"#$%"
!"#$%"
BC513)-*(8H+"^)-Å5-G"
• 
BC513)-*(8H+"^)-Å5-G"
t-I7+"b"15"@-)@-*/(/"G+"=5-m)OZ"*1"'C+2("@52"'/7+225*-+"GC+F@1*7*(+H+'("/'.H/-+-"
().2"1+2"78+H*'2>"`'"@+.(".D1*2+-"15"@-)3-5HH5D)'"GK'5H*N.+"b"15"@157+>"
•  :'*D51*25D)'"_"
–  $jUjV"X"j"
Probabilité d’être dans l’état de départ et d’avoir observé
0 caractère de la séquence
–  $PUjV"X"j""""""@).-"().2"1+2"P"N.*"'+"2)'("@52"G+2"/(5(2"2*1+'7*+.F"
•  </7.-2*)'"
–  "</7.-2*)'"@).-"1+2"/(5(2"/H+}+.-2"U$'X"#Z"[Z"_V"
–  4).-"1+2"/(5(2"2*1+'7*+.F"
! 
E.g. calculer $4(i) en utilisant $2(i-1), $4(i-1)
:$+,.'B2*&)'%)>QG#HR)80).2'0)3')>QGHR)[)
!"#$%"
!"#$%"
BC513)-*(8H+"^)-Å5-G""_""+F+H@1+"
BC513)-*(8H+"^)-Å5-G""_""+F+H@1+"
•  ](5'("G)''/+"15"2/N.+'7+""e"X"TAGA"
!"#$%"
BC513)-*(8H+"^)-Å5-G""_""+F+H@1+MJ"
!"#$%"
BC513)-*(8H+"^)-Å5-G""_""+F+H@1+MJ"
•  4).-"15"2.*(+"GC)Q2+-O5D)'2"e'_'4'4'O'O""
!"#$%"
!"#$%"
L"N.+2D)'2"*H@)-(5'(+2""U2.*(+V"
BC513)-*(8H+"G+"c*(+-Q*"
•  f+,::,',72':4'./6O4O$:$20'1Z+;,'70*+,;<,'16;;0,'J'
!  "Algorithme Forward"
•  f+,::,',72':4'2/4g,<26$/,':4'.:+7'./6O4O:,'.6+/':4'./61+<)6;'1Z+;,'70*+,;<,'
16;;0,'J"
!  "Algorithme de Viterbi"
•  C6%%,;2'4../,;1/,':,7'.4/4%Y2/,7'1Z+;'d99'024;2'16;;0'+;',;7,%O:,'1,'
70*+,;<,7'J'
!  "Algorithme Forward-Backward (Baum-Welch)"
!"#$%"
!"#$%"
&13)-*(8H+"G+"c*(+-Q*"
&13)-*(8H+"G+"c*(+-Q*U2.*(+V"
De G à D avec d(si,t,sj,t+1)=ai,j*ej(xt+1)
Système
Observations
x1
x2
xT-1
xT
s?
s?
s?
s?
Problème: Étant donnés un HMM H et une séquence observée O, quelle est la
séquence d’états S = si1,…,siT qui a la probabilité maximale d’avoir engendré O ?
!"#$%"
Principe d ’optimalité de Bellman
x1
x2
x3
xN-1
xN
s1
s1
s1
s1
s1
s2
s2
s2
s2
s2
si
si
si
si
si
sL-1
sL-1
sL-1
sL-1
sL-1
sL
sL
sL
sL
sL
!"#$%"
&13)-*(8H+"G+"c*(+-Q*"UE'V"
&13)-*(8H+"G+"c*(+-Q*"
Probabilité du meilleur début de chemin de taille t finissant par si
•  %2U$V"_"@-)Q5Q*1*(/"G."H+*11+.-"78+H*'"5H+'5'("b"1C/(5("7$"b"1C*'2(5'("2""
"""""""""U5@-R2"1+2"2"@-+H*R-+2")Q2+-O5D)'2V"
%" t"("i")" =" max" P"("x"1","x"2",...," x"t"," s"i"("t")" =" s"i" H" )"
S"
%"1"(i" ")" ="#"i" *"e"i"("x"1")"
Règle d ’induction:
%"t" 1"(i" ")" =" max" ("%"t"("j")"*"a"ji")"*"e"i"(x" "t"+1" ")"
+"
j" ="1.." m
" "
! 
Par récurrence, on calcule :
Il faut stocker les m meilleurs débuts de chemin
Résultat: Prendre le chemin qui maximise ! n (i )
Complexité: •  en temps * (m2*n)
! 
•  en espace * (m*n) (un chemin par état)
En gardant la trace, lors du calcul, de la suite d’états qui donne le meilleur
chemin amenant à l’état si à t, dans un tableau &.
!"#$%"
&13)-*(8H+"G+"c*(+-Q*"
!"#$%"
BC513)-*(8H+"G+"c*(+-Q*""_""+F+H@1+"
•  :'*D51*25D)'"
–  %jUjV"X"#"""r"%PUjV"X"j"Z""@).-"().2"1+2"/(5(2"P"')'"2*1+'7*+.F))
•  </7.-2*)'""
–  @).-"1+2"/(5(2"/H+}+.-2"U$X#Z"[Z"hV"_"
–  @).-"1+2"/(5(2"2*1+'7*+.F"_"
•  6+-H*'5*2)'"
•  <+().-"_
"W.*O-+"1+2"@)*'(+.-2"+'"5--*R-+"b"@5-D-"G+"7h""""
!"#$%"
!"#$%"
&13)-*(8H+"G+"c*(+-Q*"_"+F+H@1+"
&13)-*(8H+"G+"c*(+-Q*"_"+F+H@1+"U2.*(+V"
•  q.+11+"+2("15"H+*11+.-+"S"+F@1*75D)'"T"@).-"15"2.*(+"_"4'4'O'O"p"
•  ^*'51+H+'("_"
… la meilleure suite d’états
expliquant a a b b est :
1233
!"#$%"
!"#$%"
&13)-*(8H+"G+"c*(+-Q*"_"52@+7(2"@-5DN.+2"
•  B5" H.1D@1*75D)'" G+" @-)Q5Q*1*(/2" @-)G.*(" ().0).-2" G+2" ')HQ-+2" (-R2" @+D(2Z"
N.*"@+.O+'("7)'G.*-+"b"G+2"+--+.-2"GC5--)'G*2"2.-"1+2")-G*'5(+.-2"
•  :1" A5.(" G)'7" ().0).-2" +n+7(.+-" 1+2" 7517.12" +'" +2@57+" 1)35-*(8H*N.+" G5'2"
<+78+-78+"G+"($0(6(&/0'%1'();-&/0'%*'("
1+N.+1" 1+2" @-)G.*(2" G+O*+''+'(" G+2" 2)HH+2" +(" 1+2" ')HQ-+2" -+2(+'("
-5*2)''5Q1+2""
Complexité: •  en temps * (L2*t)
•  en espace * (L*t)
(L : nb d’états, t : taille de la
séquence observée)
(un chemin par état)
!"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
$P" !"#$%"
W).2M2/N.+'7+2"A-/N.+'(+2"_"H)DO5D)'"
W/N.+'7+2"(+H@)-+11+2"_"-+@-/2+'(5D)'"
•  :8-81*&-2(89$%)GC.'+"2/N.+'7+"
•  &1@85Q+("E'*"
–  a>3>"2).2M2/N.+'7+2"A-/N.+'(+2"+("8*2()3-5HH+"
•  W/N.+'7+2"G*27-R(+2"5O+7"/DN.+}+2"(+H@)-+11+2"G5'2";>"
•  :.8(('+'%*)GC.'+"').O+11+"2/N.+'7+"G5'2".'+"71522+"G+"
2/N.+'7+2"
–  45-"7)H@5-5*2)'"G+2"2).2M2/N.+'7+2"A-/N.+'(+2"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
$%" !"#$%"
$g" !"#$%"
B5"H/(8)G+"G+2"+$F'%%'()+$52.'("
&'51K2+-"@).-",-&32-').8)(02*')
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
$h" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
$$" !"#$%"
" ""&'51KÉ*'3"DH+"2+-*+2"H+5'2"Q-+5m*'3"G)Å'"
""""""@52("G5(5"*'()"7)H@)'+'(2"5'G"(8+'"@-)0+7(M"
""""""*'3"(8+H"*'()"(8+"A.(.-+"
" """&"DH+"2+-*+2"(K@*7511K"852"A).-"7)H@)'+'(2_"
"""""""2/,;1Z"7,476;4:$2!Z"<!<:,7Z"5'G"/4;16%"34/$4)6;"
!"#$%"
!"#$%"
4<`dw,6"`<"Wa<c:,a"da=&;d"
6*H+"W+-*+2"Ñ",)H@)'+'(2"
# ""^)-+752(+-2".2.511K"522.H+"(85("(8+"-5'G)H"
""""O5-*5D)'2"5-+"5O+-53+G").(")O+-"DH+>"
# ""68+2+"-5'G)H"+--)-2"5-+")Ü+'"522.H+G"()"Q+"
""""')-H511K"G*2(-*Q.(+G"Å*(8"5"H+5'")A"É+-)>"
6:=a"
Öa&<"#""""""""""""""""""""Öa&<"J""""""""""""""""""""Öa&<"L""""""""""""""""""""Öa&<"P"
!"#$%"
!"#$%"
" "&22.H+2"G+H5'G"Å*11"2(5K"A5*-1K"2(+5GK")O+-"DH+>"
" ""&"2N6@%6;2&'H)O*'3"5O+-53+"A)-+752("*2"A).'G"QK"
"""""2.HH*'3"(8+"G+H5'G"G.-*'3"(8+"@52("(Å)"@+-*)G2"
"""""5'G"G*O*G*'3"QK"á"J"à">"
^)-+752("X""
ä"
;''":W"6|a";w=ya<"`^"4a<:`dW":;"6|a"=`c:;t"&ca<&ta"
" ""â*(8"+578"@522*'3"@+-*)GZ"(8+"H)2("-+7+'("G+H5'G"
"""""*2"411,1"()"(8+"2.Hr"(8+"+5-1*+2("G+H5'G"*2"1/6..,1>"
"""""68*2"2H))(82").("28)-(M(+-H"*--+3.15-*D+2"*'"(8+"""
"""""G5(5"2+-*+2>"
" "":("852"')"2/,;1Z"7,476;4:Z")-"<!<:$<4:'7)H@)'+'(2>"
!"#$%"
!"#$%"
" ""=5m+2"(8+"A)-+752("H)-+"-+2@)'2*O+"()"785'3+2>"
Year
Demand
Forecast
1
110
-
2
100
-
3
120
4
140
5
170
" """w2+G"Å8+'"(8+-+"*2"5"2/,;1')-".4-,/;>'"â+*38(2"
""""""@157+"H)-+"+H@852*2")'"-+7+'("O51.+2>"
" """d+7*G*'3"(8+"Å+*38(2"-+N.*-+2"2)H+"+F@+-*+'7+"
""""""5'G"3))G"1.7mã"
Waca<&B"âa:t|6W"W|`wBd"ya"6<:adZ"&;d"6|a"`;aW"â:6|"
"6|a"B`âaW6"^`<a,&W6"a<<`<"W|`wBd"ya"WaBa,6ad"
!"#$%"
!"#$%"
N\]@@)6)=@]G>#)
å
"U"Å+*38("*'"@+-*)G"$"VU"57(.51"O51.+"*'"@+-*)GV"
å
""""""""""""""""""""""""""""""
P(8"
4+-*)G" X"
^)-+752("
"U"Å+*38(2"V"
ç#jC"
-+@-+2+'(2"
(8+"2.H")A"
(8+"Å+*38(2"
X" ##h".'*(2"
Period
Weight
Demand
Most recent
8
120
2nd Most recent
1
100
3rd Most recent
1
110
!"#$%"
!"#$%"
aF@)'+'D51"2H))(8*'3"H)G+1"
A2-(*)>-3'-)$-)=-2+8-F))^'-(2$%)
N\]@@)6)=@]G>#)
&"H)O*'3"5O+-53+"(+78'*N.+"(85(")'1K"-+N.*-+2"(8+"
152("@+-*)G"57(.51"G+H5'G"5'G"(8+"152("@+-*)G""
A)-+752(+G"G+H5'G"A)-"*'@.(>"
%(8""
4+-*)G" X"
^)-+752("
X" #LP".'*(2"
Period
Weight
Demand
Most recent
8
140
2nd Most recent
1
120
3rd Most recent
1
100
6|a"
;aâ"
^`<a,&W6"
é"
B&W6"
&,6w&B"
da=&;d"
#"M"é"
B&W6""
^`<a,&W6ad"
da=&;d"
68+"'+Å"A)-+752("*2"+N.51"()"(8+")1G"A)-+752("5G0.2(+G"QK"5"A-57D)'")A"(8+"+--)-"
U"152("@+-*)G"57(.51"G+H5'G"9"152("@+-*)G"A)-+752("V">""68+"2H))(8*'3"7)+è7*+'("
U"é"V"*2"5"Å+*38("A)-"(8+"152("57(.51"G+H5'G>"
!"#$%"
!"#$%"
aF@)'+'D51"2H))(8*'3"H)G+1"
&WWw=:;t""6|&6""é""X"
aF@)'+'D51"2H))(8*'3"+F5H@1+"
>h"Z""6|a";aê6"^`<a,&W6":W_"
&WWw=:;t""6|&6""é""X"
>h"U"#jj".'*(2"V"Ä"U"#"M">h"VU"##j".'*(2"V"
>h"U"#Jj".'*(2"V"Ä"U"#"M">h"VU"#jL".'*(2"V"
hj"Ä"LL"X"#jL".'*(2"
B52("&7(.51"
d+H5'G"
>h"Z""6|a";aê6";aâ"^`<a,&W6":W_"
$P"Ä"Lj>i"X"##P>i".'*(2"
B52("
^)-+752("
B52("&7(.51"
d+H5'G"
!"#$%"
68+"2H))(8*'3"7)+è7*+'("
B52("
^)-+752("
!"#$%"
</3-+22*)'"U1*'/5*-+V"
# """68+"2KHQ)1"*2"4:.&4"U"é"V"
# """:("75'"522.H+"5'K"O51.+"Q+(Å++'"j"5'G"#"*'71.2*O+"
68*2"(+78'*N.+"E(2"5"(-+'G"1*'+"(8-).38"5""
2+-*+2")A"8*2()-*751"G5(5"@)*'(2"5'G"(8+'""
@-)0+7(2"(85("(-+'G"1*'+"*'()"(8+"A.(.-+"A)-"
Q)(8"H+G*.H"5'G"1)'3M-5'3+"A)-+752D'3>"
# """:("@157+2"5"Å+*38(")'"(8+"152("57(.51"@+-*)G"G+H5'G"
# """68+"O51.+")A"4:.&4'-+2.1D'3"*'"(8+"1)Å+2("A)-+752(""
"""""+--)-"*2"2+1+7(+G"A)-"(8+"H)G+1>"
!"#$%"
!"#$%"
</3-+22*)'"U1*'/5*-+V"
</3-+22*)'"U1*'/5*-+V"
ÖM&ê:W":;6a<,a46"_"6|a""
4`:;6"`;"6|a"ca<6:,&B"&ê:W"6|&6"
6|a"<at<aWW:`;"B:;a",<`WWaW"
â+"*G+'DAK"5"2(-5*38("1*'+"(85("H*'*H*É+2"(8+"2.H"
)A" (8+" 2N.5-+2" )A" (8+" O+-D751" G*2(5'7+2" A-)H" (8+"
-+3-+22*)'"1*'+"()"+578")A"(8+"57(.51")Q2+-O5D)'2>"
6|a"4<ad:,6ad"c&Bwa"
""U"^`<a,&W6"V"
í"
Ö"X"5"Ä"Q"ê"
6|a"W4a,:^:ad"c&Bwa"`^"çêC"
U"6:=a"V"
Ö"&ê:W"
6|:W"&BW`":=4B:aW"6|&6"6|a"
=a&;"Wqw&<ad"a<<`<"U=WaV"
:W"=:;:=:ëad"
6|a"WB`4a"`^"6|a"Ba&W6MWqw&<aW"B:;a_""
6|a"<&6a"`^",|&;ta"
":;"çÖC"t:ca;",|&;ta":;"
6:=a"çêC"
ê"&ê:W"
=Wa":W"&"=a&Ww<a"
`^"^`<a,&W6"a<<`<"
`<:t:;"
!"#$%"
!"#$%"
</3-+22*)'"U1*'/5*-+V"
##(8"Öa&<"^`<a,&W6"
Ö"M":;6a<,a46"
WB`4a"
##(8"Öa&<"
Wc=2"@).-"15""-&7-'((2$%"
í"
Ö"X"5"Ä"Q"U"ê"V"
í"
Ö""X""iJ>gggh"Ä""#j>igih"U"##"V"
""J#L>LLLL".'*(2""X""iJ>gggh""Ä"#Jj>gggh"
!"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#j$" !"#$%"
q.+11+2"G)''/+2"(+H@)-+11+2"p"
=-&3219$%)G+"15"2.*(+"G+"15"2/N.+'7+"
•  4-/G*7D)'"G+"7).-2"Q).-2*+-2"
•  "=/(8)G+2"71522*N.+2"1*'/5*-+2"+("')'"1*'/5*-+2"
–  45-"+F(-5@)15D)'"
–  &.()-+3-+22*O+"_"&<=&"r"&<:=&"r"["
–  45-"7)H@5-5*2)'"G+"7).-Q+2"+("71522*E75D)'"2.@+-O*2/+")."')'"
–  &<,|Z"t&<,|Z"["
•  <+7)''5*225'7+"G+"15"@5-)1+"
–  ;)'"*>*>G>"
•  "&.(-+2"H/(8)G+2"_"1*'/5*-+2"+("')'"1*'/5*-+2"
–  ;)'"2(5D)''5*-+"
–  Wc="
–  6-5*(+H+'("S"b"15"O)1/+"T"
–  6d;;"
–  <+78+-78+"+("*G+'DE75D)'"G+"2).2M2/N.+'7+2"
–  <+2+-O)*-"7)[email protected]'3"
–  t-5'G+"O5-*5Q*1*(/"*'(-5"+("*'(+-M1)7.(+.-"
–  ["
–  d)''/+2"2.@+-O*2/+2"G*2@)'*Q1+2"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#ji" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
Wc="+(",-&3219$%)G+"2/N.+'7+"
• 
Wc="+("-/3-+22*)'"
S$9489$%)
• 
–  4-)Q1RH+"_"-+@-/2+'(5D)'"+')7-8%3')32+'%(2$%"_"S"7.-2+")A"G*H+'2*)'51*(K"T"
–  =5*2).'()I^S)%')($%*"U@-+2N.+V",8()('%(25.'()_).8)32+'%(2$%"G+"1C+2@57+"
• 
##j" !"#$%"
G3&'))
^)'7D)'"G+"@+-(+"_"
$ 
</3-+22*)'"1*'/5*-+"_"
$ 
W)*("b"H*'*H*2+-"_"
$ 
t/'/-51*25D)'"_"
–  4-+'G-+"1+2"+'(-/+2"2.-".'+"A+'k(-+"31*225'(+"YF(M'Z"F(M'Ä#Z"[Z"F(M#\"
–  4).-"@-/G*-+"F(")."F(Ä+""
–  Wc="1*'/5*-+")."')'"
–  4-)Q1RH+2"_""
•  B+2"F(M'Z"F(M'Ä#Z"[Z"F(M""'+"2)'("@52"*>*>G>""""""U@52"7)'A)-H+"b"15"(8/)-*+V"
•  </3153+"G+";""""U@-*2+"+'"7)H@(+"G."@522/V"
•  ,8)*F"G."')K5."
• 
4+-A)-H5'7+2")Q(+'.+2""
–  y)''+2""
–  =5*2"@52"Q*+'"H+*11+.-+2"N.+"H)GR1+2"&<"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
###" !"#$%"
!"#$%"
Wc="+("-/3-+22*)'"
:11.2(-5D)'"
-,5*
!"#$%&"'("$')*'#+,'
'
'
•  :11.2(-5D)'"
1.6
0.6
1.4
0.4
1.2
0.2
1
0
0.8
-0.2
0.6
-0.4
0.4
-0.6
9,,,
D%?&;&;'
sample
interpolation
alpha
H?<&I?)&";
5,,,
8
1
0.8
:";)(<$*=&4>(?%'3@A B4C
2
1.8
0.2
0
−2
-0.8
−1.5
−1
−0.5
0
0.5
1
1.5
8,,,
+,,,
6,,,
-1
2
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
,
,
-,
6+,
67,
+5,
8,,
8-,
!
D&A3@6EF5B6G+,,8B6+C
!"#$%&!"#$%&'(!)*+,&-./0!#1!%&0!"-$2-$!30+0.4#*.5!
!
!
##L" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
:11.2(-5D)'"
-"¦ ?
8,,,
9,,,
+,,,
9,,,
"ìS"w2*'3"2.@@)-("O+7()-"H578*'+2"A)-"
1)'3M(+-H"G*2785-3+"@-+G*7D)'"TZ"Jjjgî"
+,,,
6,,,
6,,,
,
,
A@D*
,
,
A@D*
-,
6+,
67,
+8,
-,
6+,
67,
+8,
!
*HI43%J3K
*/L;/*M"%3?@4)
*/NN*M"%3?@4)
*1O;*M"%3?@4)
!
E&B3A65F8C6G6557C6+D
:,,,
*HI43%J3K
*/L;/*M"%3?@4)
*/NN*M"%3?@4)
*1O;*M"%3?@4)
9
;"<)(=$*>&4?(@%'3*AB C4D
8,,,
9,,,
+,,,
AID*
+,
9,
& ? . L! $ M !
"#$"!
"..!
/0$!
!
!
:,
AID*
-,
6,
+,
9,
8,
:,
E&B3A6555C6G+,,9C6+D
-,
!
!"#$%&%"#$"!%&'()*+,-!"..!%&'()*+,-!/0$!%&'()*+,!*12!&3+('4(2!%5&6!7*8!29':1;!,<(!
!,'*:1:1;!=(':&2-!*12!738!29':1;!,<(!4*5:2*,:&1!=(':&2>!
!"#$%&%"#$"!%&'()*+,-!"..!%&'()*+,-!/0$!%&'()*+,!*12!&3+('4(2!%5&6!7*8!29':1;!,<(!
!
,'*:1:1;!=(':&2-!*12!738!29':1;!,<(!4*5:2*,:&1!=(':&2>!
!
'()*+%,%?('%&'@*1)(!:12:)(+!&%!"..!*12!/0$!@&2(5+>!
E&B3A6555C6G+,,9C6+D
!
!
'()*+%,%?('%&'@*1)(!:12:)(+!&%!"..!*12!/0$!@&2(5+>!
$&2(5!
8,
A'*:1:1;B!
6789&
CDC>EF!
CJC>HE!
CKH>FF!
:;66&
G>HICC!
G>HIKJ!
G>HIHD!
•  &.(-+2"5O5'(53+2"
(678"9:";<%=;87>%?<8%"<@A:%<A=B76"<#%%
6,,,
,
6,
!
–  &1)-2"N.+"1+2"<;2"()HQ+'("2).O+'("G5'2"G+2"H*'*H5"1)75.F"
+,,,
,
,
2&0.0! -"¦! *+! %&0! +,-'0)! 4-'70E! -"! *+! %&0! #.*/*$-'! 1'#2! 4-'70! -$)! -9*$E! -9-S! -.0E!
.0+G0,%*40'(E!%&0!9*$*979!-$)!9-S*979!#1!1'#2!+0.*0+5%
–  W).O+'("H+*11+.-+2"N.+"_"&<=&Z"&<:=&Z"</2+5.F"G+"'+.-)'+2"
!
!
'(()*+',*-.%-!%/01%,-%!)-2%(345*+,*-.%%
–  :H@1/H+'(+"1+"W<="_"-/2*2(+"Q*+'"5."2.-M5@@-+'D2253+"
C&0!#@U0,%*40!#1!%&0!G.0)*,%*#$!9#)0'!*+!%#!/0$0.-'*V0!-!.0'-%*#$+&*G!#1!%&0!1#''#2*$/!
1#.9R!
9,,,
6,,,
,
L;TM!
!
8,,,
9
;"<)(=$*>&4?(@%'3*AB C4D
:,,,
9,,
E&B3A65F8C6G6557C6+D
9,,
-" / - 9*$
!
- 9-S / - 9*$
•  4+-A)-H5'7+2"+'"@-/G*7D)'"
9
;"<)(=$*>&4?(@%'3*AB C4D
9
;"<)(=$*>&4?(@%'3*AB C4D
8,,,
!"#$%"
,)'71.2*)'2"2.-"1+2"Wc="+'"-/3-+22*)'"
*HI43%J3K
*/L;/*M"%3?@4)
*/NN*M"%3?@4)
*1O;*M"%3?@4)
:,,,
*HI43%J3K
*/L;/*M"%3?@4)
*/NN*M"%3?@4)
*1O;*M"%3?@4)
:,,,
-,5
!"#$%&"'(()*+&,-.+)*&/0.1#$-"&2)*&3)$%4+-*/&5#".10*%-&(*-5#.+#)$&
&
&
-,5
!"#$%&"'(()*+&,-.+)*&/0.1#$-"&2)*&3)$%4+-*/&5#".10*%-&(*-5#.+#)$&
&
&
! 6*/7.0!8!+&#2+!%&0!9#$%&'(!1'#2!)-%-!1.#9!:-$7-.(!;<=>!%#!?0,09@0.!ABB85!C&0!
)-%-! +0%!ìS"w2*'3"2.@@)-("O+7()-"H578*'+2"A)-"1)'3M(+-H"G*2785-3+"@-+G*7D)'"TZ"Jjjgî"
1.#9! :-$7-.(! ;<=>! %#! ?0,09@0.! ;<<D! *+! 7+0)! 1#.! %.-*$*$/E! 2&*'+%! %&-%! 1.#9!
:-$7-.(! ;<<<! %#! ?0,09@0.! ABB8! *+! 7+0)! 1#.! 4-'*)-%*#$5! F%! *+! 40.(! *9G#.%-$%! %#! +,-'0!
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
10-%7.0+! @01#.0! -GG'(*$/! HI"!
-$)! JKK! %#! G.0)*,%*#$! LH-.'0E! ;<<=M5! C&0! 9-*$! ##P"
-)4-$%-/0!*+!%#!-4#*)!-%%.*@7%0+!*$!/.0-%0.!$790.*,!.-$/0+!)#9*$-%*$/!%&#+0!*$!+9-''0.!
$790.*,! .-$/0+5! J$#%&0.! -)4-$%-/0! *+! %#! -4#*)! $790.*,-'! )*11*,7'%*0+! )7.*$/! %&0!
,-',7'-%*#$5! N-./0! -%%.*@7%0! 4-'70+! 9*/&%! ,-7+0! $790.*,-'! G.#@'09+! @0,-7+0! O0.$0'!
4-'70+! 7+7-''(! )0G0$)! #$! %&0! *$$0.! G.#)7,%+! #1! 10-%7.0! 40,%#.+E! +7,&! -+! %&0! '*$0-.!
O0.$0'!-$)!%&0!G#'($#9*-'!O0.$0'5!F%!*+!.0,#990$)0)!%#!'*$0-.'(!+,-'0!0-,&!-%%.*@7%0!%#!
%&0!.-$/0!LP;E!Q;M!#.!LBE!;M5!F$!%&0!9#)0''*$/!G.#,0++E!%&0!)-%-!+0%+!#1!.*40.!1'#2!20.0!
+,-'0)!%#!%&0!.-$/0!@0%200$!B!-$)!;!-+!1#''#2+R!
$&2(5!
A'*:1:1;B!
0*5:2*,:&1B!
6789&
:;66&
6789&
:;66&
0*5:2*,:&1B!
"#$"!
CDC>EF!
G>HICC!
CJC>GD!
G>HCFD!
6789&
:;66&
"..!
CJC>HE!
G>HIKJ!
CDL>KH!
G>HEFD!
CJC>GD!
G>HCFD!
/0$!
CKH>FF!
G>HIHD!
CJI>LI!
G>HKEI!
CDL>KH!
G>HEFD!
!
CJI>LI!S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
G>HKEI!
!
L;WM!
2&0.0!!$!*+!-$!$X)*90$+*#$-'!*$G7%!40,%#.!,#$+*+%*$/!#1!4-.*-@'0+!/;E!YE!/"E!YE!/$E!-$)!
&' *+! %&0! #7%G7%! 4-.*-@'05! F$! 1'#2! 9#)0''*$/E! 4-'70+! #1! /"! 9-(! @0! 1'#2! 4-'70+! 2*%&!
)*110.0$%! %*90! '-/+! -$)! %&0! 4-'70! #1! &! *+! /0$0.-''(! %&0! 1'#2! *$! %&0! $0S%! G0.*#)5!
•  =&:W"
Z0$0.-''(E!%&0!$79@0.!#1!-$%0,0)0$%!4-'70+!*$,'7)0)!*$!%&0!40,%#.!!$'*+!$#%!O$#2$!*$!
-)4-$,05!?0%0.9*$*$/!%&0!$79@0.!#1!.7$#11!4-'70+!*$4#'40+!1*$)*$/!%&0!'-/+!#1!.7$#11!!
–  ,)H@1+F*(/"+'(-+"`U_JV")."`U_LV"2*"_"1)'3.+.-"G+"15"2/N.+'7+"
!
'
'
!"#$%&'()*ø*+,,-*./01*2%344*!
##%" !"#$%"
! M1!&'2('!,&!<*4(!,<(!+*@(!3*+:+!&%!)&@=*':+&1-!,<(!+*@(!,'*:1:1;!*12!4(':%:)*,:&1!
+(,+! *'(! 9+(2! %&'! *55! @&2(5+>! A<(! +)*,,('! =5&,+! &%! &3+('4(2! 2:+)<*';(+! 4('+9+! %&'()*+,!
! M1!&'2('!,&!<*4(!,<(!+*@(!3*+:+!&%!)&@=*':+&1-!,<(!+*@(!,'*:1:1;!*12!4(':%:)*,:&1!
2:+)<*';(+!&%!"#$"-!"..!*12!/0$!@&2(5+!*'(!+<&61!:1!N:;>!L>!N:;9'(!H!+<&6+!,<(!
+(,+! *'(! 9+(2! %&'! *55! @&2(5+>! A<(! +)*,,('! =5&,+! &%! &3+('4(2! 2:+)<*';(+! 4('+9+!
%&'()*+,!
=('%&'@*1)(+!&%!,<(!,<'((!='(2:),:&1!@&2(5+!29':1;!,<(!,'*:1:1;!*12!4*5:2*,:&1!=(':&2+>!
2:+)<*';(+!&%!"#$"-!"..!*12!/0$!@&2(5+!*'(!+<&61!:1!N:;>!L>!N:;9'(!H!+<&6+!,<(!
A*35(!C!+<&6+!,<(:'!=('%&'@*1)(!:12:)(+>!M,!:+!2(@&1+,'*,(2!,<*,-!6<(1!(@=5&O(2!%&'!
=('%&'@*1)(+!&%!,<(!,<'((!='(2:),:&1!@&2(5+!29':1;!,<(!,'*:1:1;!*12!4*5:2*,:&1!=(':&2+>!
%5&6!='(2:),:&1!:1!$*16*1-!,<(!/0$!(P<:3:,+!+&@(!*24*1,*;(+!&4('!"#$"!*12!"..!
A*35(!C!+<&6+!,<(:'!=('%&'@*1)(!:12:)(+>!M,!:+!2(@&1+,'*,(2!,<*,-!6<(1!(@=5&O(2!%&'!
@&2(5+>!Q9':1;!,<(!4*5:2*,:&1-!,<(!)&''(5*,:&1!)&(%%:):(1,!&%!,<(!/0$!@&2(5!:+!G>HKEI-!
%5&6!='(2:),:&1!:1!$*16*1-!,<(!/0$!(P<:3:,+!+&@(!*24*1,*;(+!&4('!"#$"!*12!"..!
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
##g" !"#$%"
Simple
Recurrent Networks
</2+5."2*H@1+"G+"a1H5'"
Truncating the unfolded network to just one time step reduces it to a Simple Recurrent
Network (which is also known as an Elman network):
Outputs
WOH
Hidden Units
]&('80B)3')%'0-$%'()-&10--'%*()
WHH
WIH
U6*H+"d+15K";+.-51";+(Å)-m2"_"6d;;V"
Inputs
Hidden Units
Time t
Time t-1
In this case, each set of weights now only appears only once, so it is possible to apply the
gradient descent approach using the standard backpropagation algorithm rather than full
BPTT.
This means that the error signal will not get propagated back very far, and it will
•  B5"@1.2"2*H@1+"G/@+'G5'7+"(+H@)-+11+"_".'"@52"G+"(+H@2"
be difficult for the network to learn how to use information from far back in time. In
–  d*è7*1+"GC5@@-+'G-+"G+2"G/@+'G5'7+2"1)*'(5*'+2"G5'2"1+"(+H@2"
practice, this approximation proves to be too great for many practical applications.
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
L12-10
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
##h" !"#$%"
Unfolding Over Time
d/@+'G5'7+2"@1.2"1)*'(5*'+2"
##$" !"#$%"
</2+5.F"-/7.--+'("
The recurrent network can be converted into a feed-forward network by unfolding over time:
•  t/'/-51*25D)'"
Outputs
WOH
The simplest form of fully recurrent neural network is an MLP with the previous set of
hidden unit activations feeding back into the network along with the inputs:
Hidden Units
WIH
Inputs
Time t
A Fully Recurrent Network
WHH
Outputs
Hidden Units
WIH
Inputs
Time t-1
WHH
h(t+1)
Hidden Units
WIH
Hidden Units
WHH
x(t)
Inputs
Time t-2
Delay
h(t)
Inputs
This means all the earlier theory about feed-forward network learning follows through.
•  wD1*25D)'"G+"1C513)-*(8H+"G+"-+(-)M@-)@535D)'"71522*N.+"
L12-7
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
h(t+1)
##i" !"#$%"
Note that the time t has to be discretized, with the activations updated at each time step.
The time scale might correspond to the operation of real neurons, or for artificial systems
any time step size appropriate
for the given problem can be used. A delay unit#Jj"
needs
to
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
!"#$%"
be introduced to hold activations until they are processed at the next time step.
L12-3
6d;;"""US"6*H+"d+15K";+.-51";+(Å)-m2"TV"
]&('-4$2-):$+,09%7"
Figure 4. A depiction of the training and test sets used.
5.4
Controlling Overfitting
](5@+2"
Highly noisy data has often been addressed using techniques such as weight decay, weight
#> stopping
4-/(-5*(+H+'(2"
elimination and early
to control overfitting [61]. For this problem we use early
stopping with a difference: the stopping point is chosen using multiple tests on a separate
J> 
d*27-/D25D)'"UW`=V"
segment of data, rather than using a validation set in the normal manner. Tests showed that
using a validation set in the normal manner seriously affected performance. This is not very
L>  6d;;"Ua1H5'V"
surprising because there is a dilemma when choosing the validation set. If the validation
set is chosen beforeP> 
the training
data (in terms of the temporal order of the series), then
aF(-57D)'"GC5.()H5(+2"
the non-stationarity of the series means the validation set may be of little use for predicting
performance on the test
If the validation set is chosen after the training data, a problem
%>  set.6-5G.7D)'"+'"-R31+2"
occurs again with the non-stationarity – it is desirable to make the validation set as small
as possible to alleviate this problem, however the set cannot be made too small because it
needs to be a certain size in order to make the results statistically valid. Hence, we chose
#J#" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
to control overfitting by setting the training time for an appropriate stopping point a Figure
priori.3. The pre-processed, delay embedded series is converted into symbols using a self-organizing
Simulations with a separate segment of data not contained in the main data (see appendix
map. A
An Elman neural network is trained on the sequence of symbols.
for more details) were used to select the training time of 500 epochs.
We note that our use of a separate segment of data to select training set size and training time
are not expected to be ideal solutions, e.g. the best choice for these parameters may change
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#JJ" !"#$%"
11
15
=-&3219$%)_"S"-+2+-O)*-"7)[email protected]'3"T"
4-/G*7D)'"_"S"-+2+-O)*-"7)[email protected]'3"T"
B+2"<;"-/7.--+'(2"2)'("U(-R2V"G*è7*1+2"b"+'(-5l'+-"U@5-"3-5G*+'(V"
A
W*3'51"b"S"5@@-+'G-+"T"
A
A
4-*'7*@+"
B
–  wD1*25D)'"GC.'"-/2+5."-/7.--+'(""
%$%)838,*89;)[[)
S"a78)2"T"B
–  E,,-'%3-').'+"1$01M')3')($-9')1*'/5*-+"
teacher
d(n)
teacher
A
output neuron
activation y(n)
4+-A)-H5'7+2"
"reservoir" with three traces xi(n)
–  #jjj"A)*2"@1.2"@-/7*2"2.-"@-/G*7D)'"G+"
7+-(5*'2"2K2(RH+2"GK'5H*N.+2"
–  #+-"2.-"(I78+2"G*O+-2+2"
• 
• 
• 
• 
B
wi
<+7)''5*225'7+"G+"O)K+11+2"+'"05@)'5*2"
<+7)''5*225'7+"G+"78*n-+2"@5-1/2"
4-/G*7D)'"G+"7).-2"Q).-2*+-2""
["
!"#$%&'()*)#&+,+-.'/'0+1+2'&'0(%)0+*%34#5)6/+.440%.*7'&+5%+
0'*#00'65+6'#0.8+6'59%0$&+50.)6)6/+:;+<%34#5'0+=*)'6*'+
2'()'9;+>??@A+
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#JL" !"#$%"
!
teacher
d(n)
d(n)
W)-D+"
G/2*-/+"
output neuron
wi
wi
A
activation y(n)
!"#$%&$%!'"#$%&'()*(+,#+-*.-*#+/#*0&#*%1(,&'#234#!'+**&'"#+5&%61('#7(*0#*0&#)+%%&)*#
"reservoir" with three
B traces xi(n)
)+,*(,-1*(+,#!8+6('"9#!("#:&1%,(,;#*0&#<=#1**%1)*+%9#>0%&&#81?.6&#1)*(51*(+,#*%1)&8#+/#output neuron !
(,*&%,16#,&-%+,8#1%&#80+7,9#>0&@#A&)0+A#*0&#*&1)0&%#8(;,16#!""#9#B/*&%#*%1(,(,;C#*0&#
activation y(n)
!"#$%&$%!'"#$%&'()*(+,#+-*.-*#+/#*0&#*%1(,&'#234#!'+**&'"#+5&%61('#7(*0#*0&#)+%%&)*#
'&8(%&'#+-*.-*#(8#%&D)%&1*&'#/%+?#*0&#&)0+#8(;,168#*0%+-;0#+-*.-*#)+,,&)*(+,8#!'+**&'#
teacher
)+,*(,-1*(+,#!8+6('"9#!("#:&1%,(,;#*0&#<=#1**%1)*+%9#>0%&&#81?.6&#1)*(51*(+,#*%1)&8#+/#
B
1%%+78"#70+8&#7&(;0*8##$#1%&#*0&#%&8-6*#+/#*0&#*%1(,(,;#.%+)&'-%&9#
"reservoir"
with three traces xi(n)
d(n)
(,*&%,16#,&-%+,8#1%&#80+7,9#>0&@#A&)0+A#*0&#*&1)0&%#8(;,16#!""#9#B/*&%#*%1(,(,;C#*0&#
!i
w
!
'&8(%&'#+-*.-*#(8#%&D)%&1*&'#/%+?#*0&#&)0+#8(;,168#*0%+-;0#+-*.-*#)+,,&)*(+,8#!'+**&'#
!
teacher
1%%+78"#70+8&#7&(;0*8##$#1%&#*0&#%&8-6*#+/#*0&#*%1(,(,;#.%+)&'-%&9#
$%&'(!)*!+&*,(*-!,!&,.-/0!122!)%(3!4555!.*6&/.'!"+,77*-!(3*!8&*'*&9/%&8#!,.-!/.*!/6(:6(!
!"#$%&$%!'"#$%&'()*(+,#+-*.-*#+/#*0&#*%1(,&'#234#!'+**&'"#+5&%61('#7(*0#*0&#)+%%&)*#
d(n)
!
output neuron
wi
.*6&/.;!<0:/&(,.(7=>!(3*!/6(:6(!.*6&/.!),'!*?6%::*-!)%(3!&,.-/0!+/..*+(%/.'!(3,(!:&/@*+(!A,+B!
!
)+,*(,-1*(+,#!8+6('"9#!("#:&1%,(,;#*0&#<=#1**%1)*+%9#>0%&&#81?.6&#1)*(51*(+,#*%1)&8#+/#
activation y(n)
%.(/!(3*!&*'*&9/%&!"$%C;!DE#;!F!G555!'(*:!(*,+3*&!'*?6*.+*!!"4#>;;;>!!"G555#%),'!C*.*&,(*-!H&/0!
$%&'(!)*!+&*,(*-!,!&,.-/0!122!)%(3!4555!.*6&/.'!"+,77*-!(3*!8&*'*&9/%&8#!,.-!/.*!/6(:6(!
(3*!IJK!*?6,(%/.!,.-!H*-!%.(/!(3*!/6(:6(!.*6&/.;!L3%'!*M+%(*-!(3*!%.(*&.,7!.*6&/.'!(3&/6C3!(3*!
"reservoir"
with
three
traces
x
(
n
)
(,*&%,16#,&-%+,8#1%&#80+7,9#>0&@#A&)0+A#*0&#*&1)0&%#8(;,16#!""#9#B/*&%#*%1(,(,;C#*0&#
i
.*6&/.;!<0:/&(,.(7=>!(3*!/6(:6(!.*6&/.!),'!*?6%::*-!)%(3!&,.-/0!+/..*+(%/.'!(3,(!:&/@*+(!A,+B!
!
output neuron
/6(:6(!H**-A,+B!+/..*+(%/.';!FH(*&!,.!%.%(%,7!(&,.'%*.(>!(3*=!'(,&(*-!(/!*M3%A%(!'='(*0,(%+!
%.(/!(3*!&*'*&9/%&!"$%C;!DE#;!F!G555!'(*:!(*,+3*&!'*?6*.+*!!"4#>;;;>!!"G555#%),'!C*.*&,(*-!H&/0!
'&8(%&'#+-*.-*#(8#%&D)%&1*&'#/%+?#*0&#&)0+#8(;,168#*0%+-;0#+-*.-*#)+,,&)*(+,8#!'+**&'#
activation y(n)
%.-%9%-6,7!9,&%,(%/.'!/H!(3*!(*,+3*&!'*?6*.+*!"$%C;!DE#;!!
!"#$%&$%!'"#$%&'()*(+,#+-*.-*#+/#*0&#*%1(,&'#234#!'+**&'"#+5&%61('#7(*0#*0&#)+%%&)*#
(3*!IJK!*?6,(%/.!,.-!H*-!%.(/!(3*!/6(:6(!.*6&/.;!L3%'!*M+%(*-!(3*!%.(*&.,7!.*6&/.'!(3&/6C3!(3*!
!
1%%+78"#70+8&#7&(;0*8##
"reservoir" with three traces xi(n)
#JP" !"#$%"
$#1%&#*0&#%&8-6*#+/#*0&#*%1(,(,;#.%+)&'-%&9#
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
)+,*(,-1*(+,#!8+6('"9#!("#:&1%,(,;#*0&#<=#1**%1)*+%9#>0%&&#81?.6&#1)*(51*(+,#*%1)&8#+/#
/6(:6(!H**-A,+B!+/..*+(%/.';!FH(*&!,.!%.%(%,7!(&,.'%*.(>!(3*=!'(,&(*-!(/!*M3%A%(!'='(*0,(%+!
!
L3*!H,+(!(3,(!(3*!%.(*&.,7!.*6&/.'!-%':7,=!'='(*0,(%+!9,&%,.('!/H!(3*!*M+%(%.C!*M(*&.,7!'%C.,7!%'!
(,*&%,16#,&-%+,8#1%&#80+7,9#>0&@#A&)0+A#*0&#*&1)0&%#8(;,16#!""#9#B/*&%#*%1(,(,;C#*0&#
%.-%9%-6,7!9,&%,(%/.'!/H!(3*!(*,+3*&!'*?6*.+*!"$%C;!DE#;!!
!
+/.'(%(6(%/.,7!H/&!NK2'O!(3*!%.(*&.,7!.*6&/.'!06'(!)/&B!,'!8*+3/!H6.+(%/.'8!H/&!(3*!-&%9%.C!
!"#$%&$%!'"#$%&'()*(+,#+-*.-*#+/#*0&#*%1(,&'#234#!'+**&'"#+5&%61('#7(*0#*0&#)+%%&)*#
!
'&8(%&'#+-*.-*#(8#%&D)%&1*&'#/%+?#*0&#&)0+#8(;,168#*0%+-;0#+-*.-*#)+,,&)*(+,8#!'+**&'#
!
'%C.,7;!2/(!*9*&=!&,.-/07=!C*.*&,(*-!122!3,'!(3%'!:&/:*&(=>!A6(!%(!+,.!*HH*+(%9*7=!A*!A6%7(!%.(/!,!
)+,*(,-1*(+,#!8+6('"9#!("#:&1%,(,;#*0&#<=#1**%1)*+%9#>0%&&#81?.6&#1)*(51*(+,#*%1)&8#+/#
L3*!H,+(!(3,(!(3*!%.(*&.,7!.*6&/.'!-%':7,=!'='(*0,(%+!9,&%,.('!/H!(3*!*M+%(%.C!*M(*&.,7!'%C.,7!%'!
1%%+78"#70+8&#7&(;0*8##$#1%&#*0&#%&8-6*#+/#*0&#*%1(,(,;#.%+)&'-%&9#
&*'*&9/%&!"'6::/&(%.C!/.7%.*!(*M(#;!!
(,*&%,16#,&-%+,8#1%&#80+7,9#>0&@#A&)0+A#*0&#*&1)0&%#8(;,16#!""#9#B/*&%#*%1(,(,;C#*0&#
+/.'(%(6(%/.,7!H/&!NK2'O!(3*!%.(*&.,7!.*6&/.'!06'(!)/&B!,'!8*+3/!H6.+(%/.'8!H/&!(3*!-&%9%.C!
!
$%&'(!)*!+&*,(*-!,!&,.-/0!122!)%(3!4555!.*6&/.'!"+,77*-!(3*!8&*'*&9/%&8#!,.-!/.*!/6(:6(!
!
'&8(%&'#+-*.-*#(8#%&D)%&1*&'#/%+?#*0&#&)0+#8(;,168#*0%+-;0#+-*.-*#)+,,&)*(+,8#!'+**&'#
'%C.,7;!2/(!*9*&=!&,.-/07=!C*.*&,(*-!122!3,'!(3%'!:&/:*&(=>!A6(!%(!+,.!*HH*+(%9*7=!A*!A6%7(!%.(/!,!
!
.*6&/.;!<0:/&(,.(7=>!(3*!/6(:6(!.*6&/.!),'!*?6%::*-!)%(3!&,.-/0!+/..*+(%/.'!(3,(!:&/@*+(!A,+B!
<(!%'!%0:/&(,.(!(3,(!(3*!8*+3/8!'%C.,7'!A*!&%+37=!9,&%*-;!L3%'!),'!*.'6&*-!A=!,!':,&'*!
1%%+78"#70+8&#7&(;0*8##
&*'*&9/%&!"'6::/&(%.C!/.7%.*!(*M(#;!!
$%&'(!)*!+&*,(*-!,!&,.-/0!122!)%(3!4555!.*6&/.'!"+,77*-!(3*!8&*'*&9/%&8#!,.-!/.*!/6(:6(!
$#1%&#*0&#%&8-6*#+/#*0&#*%1(,(,;#.%+)&'-%&9#
%.(*&+/..*+(%9%(=!/H!4P!)%(3%.!(3*!&*'*&9/%&O!(3%'!+/.-%(%/.!7*('!(3*!&*'*&9/%&!-*+/0:/'*!%.(/!
6K@+2"G+"(I78+2"
#>  "&@@-+'D2253+"')'"2.@+-O*2/"U71.2(+-*'3V"
&'51K2+""
–  a>3>"-+78+-78+"G+"@-)E12"(K@+2"G+"7)'2)HH5(+.-2"
GC'%('+5.'("G+"2/N.+'7+2"
J>  "&@@-+'D2253+"2.@+-O*2/"
–  ,1522+H+'("G+"').O+11+2"2/N.+'7+2"
•  a>3>"7)'2)HH5D)'"/1+7(-*N.+"/1+O/+"!"')'"/1+O/+"+'(-+"#$8"+("Jj8"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#J%" !"#$%"
q.+2D)'2"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#Jg" !"#$%"
q.+2D)'2"
•  6-).O+-"1+2"P"2/N.+'7+2"1+2"@1.2"@-)78+2"GC.'+"2/N.+'7+"G)''/+"
•  6-).O+-"1+2"2/N.+'7+2"b"H)*'2"G+","GC.'+"2/N.+'7+"G)''/+"
#>  "]',-&('%*89$%)G+2"2/N.+'7+2"
•  d*2(5'7+2"71522*N.+2"
•  a.71*G*+''+"
J>  "E.27%'+'%*)+'(-+"2/N.+'7+2"
•  ;)-H+2"G*O+-2+2"
–  4-/2.@@)2+'(".'"+2@57+"O+7()-*+1"
":1"A5.("*-8%(;$-+'-)15"-+@-/2+'(5D)'"G+2"2/N.+'7+2"
L>  "=+2.-+"G+"2*H*15-*(/")."G+"32(*8%1')
•  d*2(5'7+2"@).-"1+2"2/N.+'7+2"
•  K!;4%$<'_$%,'i4/.$;A"Ud6âV"
•  K$724;<,7'1Z01$)6;'
•  L6+7@70*+,;<,'<6%%+;,':4'.:+7':6;A+,'
•  ["
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#Jh" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#J$" !"#$%"
B5"-+@-/2+'(5D)'"G+2"2/N.+'7+2"
#>  "y-.(+"
Contexte
Appariement de séries temporelles
Apprentissage app discriminants
Classification de séries
Applications
Conclusion
J>  ""<+@-/2+'(5D)'2"S"5'51KDN.+2"T"
Contexte
Appariement de séries temporelles
Apprentissage app discriminants
–  45-"7)HQ*'5*2)'"G+"7)H@)25'(+2"78)*2*+2"G5'2".'"G*7D)''5*-+"
–  ,)H@)25'(+2")-(8)3)'51+2"
q.+11+"32(*8%1'"@).-"1+2"2/N.+'7+2"
Caractéristiques
des alignements standards
Caractéristiques des alignements standards
L>  "</3.15-*(/"2.@@)2/+"
Définition Un alignement de taille r (max(T1 ,Définition
T2 ) <•  ,85l'+2"G+"=5-m)O"
r <Un
T1alignement
+ T2 )
de taille r (max(T1 , T2 ) <
•  t-5HH5*-+2"
•  </2+5.F"G+"'+.-)'+2"
(Sankoff & Kruskal 1983, Cuturi & al 2007)
Φ : {1..r} → {1..T1 } × {1..T2 } telle que :
� Φ(1) = (1; 1)
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
�
�
#Ji" !"#$%"
Φ(r) = (T1 ; T2 )
(Sankoff & • Kruskal
1983, Cuturi & al 2007)
[""
–  4-)Q1RH+"G+"15"7)H@5-5*2)'"
Φ : {1..r}
→ {1..T1 } × {1..T2 } telle que :
� Φ(1) = (1; 1)
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#Lj" !"#$%"
Φ(r) = (T1 ; T2 )
∀t ∈ BC51*3'+H+'("
[1, r − 1], Φ(t + 1) = Φ(t) + Ψ(t) où Ψ(t)
� ∀t ∈
∈ C[1, r −
1], Φ(t + 1) = Φ(t) + Ψ(t) où Ψ(t
&1*3'+H+'("@5-"d6â"
(par ex : {(1; 1), (1; 0), (0; 1)})
(par ex : {(1; 1), (1; 0), (0; 1)})
�
Alignement des observations simultanées
•  ]',-&('%*89$%)5-0*')
–  4-)Q1RH+2"
Alignement
tenant
compte des
délais
7)H@5-*2)'>"""^,41$;A'j'=11$76;@i,7:,!'`+O:$<4)6;E'"klmE',1$2,1'O!'L4;P6\E'K43$1'n'o/+7P4:E'p67,.&'q>E'""
Alignement
des observations
simultanées
W5'm)nZ"d>"+("ñ-.2m51Z"s>"U#i$LV>"""6*H+"Å5-@2Z"2(-*'3"+G*(2Z"5'G"H57-)H)1+7.1+2"_"(8+"(8+)-K"5'G"@-57D7+")A"2+N.+'7+"
•  6-R2"3-5'G+"G*H+'2*)'"
•  452"'/7+225*-+H+'("HkH+"G*H+'2*)'"
–  d6â"UdK'5H*7"6*H+"â5-@*'3V"
•  4-*'7*@+"
–  ,)ï("522)7*/"b"5@@5-*+H+'("1)751"U+>3>"HkH+"@-)E1"1)751V"
–  ,)ï("522)7*/"b"G/@157+H+'("')'"2*H.1(5'/"G5'2"1+"(+H@2"
–  =*'*H*25D)'"G+"15"2)HH+"G+2"7)ï(2"
•  ,517.1""
–  4-)3-5HH5D)'"GK'5H*N.+"
–  </51*25Q1+"+'M1*3'+"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#L#" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#LJ" !"#$%"
Aligne
!"#$%&''(")*#&+*",-%".%
<+@-/2+'(5D)'2"5'51KDN.+2"
+*#$%-$(*$-/
• 
6-5'2A)-H/+"G+"^).-*+-"G*27-R(+"
• 
6-5'2A)-H/+"+'")'G+1+}+2"G*27-R(+"
• 
&@@-)F*H5D)'"53-/3/+"@5-"H)-7+5.F"
• 
["
%2345'4624758496474:;-;2<:7
00,"+$%+1&+%&22%$)3$'+%!45%
&($%($&2%6&27$8/
1<=4@5F-74=
?"77#1,
8*)H.9,
8.7#4&
#-;-5)=-9;2>4
J)"7
2.)+#7
:.#>>"$"#1+&,
*24/4A2745
*<@B:<32-@
2"1(34*)
'B3.<@2/
5*43#
'--)./"0*+".1
=)##&
&->4@4;7
"! #! $! %! &!! &"!
!
"! #! $! %! &!! &"!
!
"! #! $! %! &!!&"!
!
"! #! $! %! &!! &"!
!
"! #! $! %! &!!&"!
!
"! #! $! %! &!!&"!
!
"! #! $! %! &!!&"!
-
#$%
#&%
'(#
)*+)
*))
*,)
-
*24/4A274
,2:4-6
)996<C23-;2<:
.
.
.
/
E1+#)-.4*+".1
/
'7*-+"9#
F*+3)*4
!"#$#%"&#
G*1(3*(#,
:.1&+*1+
'--)./"0*+".1
';62:H7
[email protected]"$
'(()#(*+#
'--)./"0*+".1,,
6#()#&&".1
6*17.0,
8*--"1(&
'94/;6-@
:4"--#7
;*+*
!"#$#%"&#
'(()#(*+#,
'--)./"0*+".1
:.0(*'-2%7)G+"2/N.+'7+2"
--...//.
!
#-;-5#2/;-;4=
?<:5#-;-5)=-9;2>4
2+*+"&+"$*4,
8.7#4&
D6;E<:<63-@
?<:
,<A46
F<I:=2:H
5*43#,
I*&#7
?**)
F2GD6;E<:<63-@
;*3@#$A"#&, :.">4#+&
7@1,,,1,B,C
;"&$)#+#,
<.3)"#),
=)*1&>.)0
;"&$)#+# :A#@D&A#9
:.&"1# !.4D1.0"*4&,
=)*1&>.)0
2D04#+&
24.-#,
I*&#7
.
'01
<+@-/2+'(5D)'"O+7()-*+11+"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#LL" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
B5"7)H@5-5*2)'"_"H+2.-+2"G+"G*2(5'7+"
#LP" !"#$%"
,1.2(+-*'3"+'"-+@-/2+'(5D)'"O+7()-*+11+"
•  "<+@-/2+'(5D)'2"A)'G/+2"2.-"1+2"48.'0-()
•  oMH)K+''+2"
–  <+@-/2+'(5D)'2"S"Q-.(+2"T")."S"5'51KDN.+2"T"
–  W5'2")%,'N4/.$;A"
•  ,1522*E75D)'"8*/-5-78*N.+"527+'G5'(+"
8"+,$(5$91:#'$;1<&6(&.=
•  ().(+2"1+2"')-H+2"B@"
!"#$%#&#'()$*+,+$-(&(&.$/0.1'(,"2$3'#4(5(,#67$
–  &O+7")%,'N4/.$;A""
•  ,1.2(+-*'3"2@+7(-51"
J ,<A465.<I:=2:H534-:75;E4547;23-;4=5=27;-:/452:5;E4564=I/4=579-/45275-@A-B75@4775
;E-:5<654PI-@5;<5;E45=27;-:/452:5;E45<62H2:-@579-/4Q
•  dK'5H*7"DH+"Å5-@*'3"
J• +64-;45-:5*--)./"0*+".1
<K5;E45=-;-L5AE2/E5A2@@5K2;52:53-2:5
d*2(5'7+"GC/G*D)'"
343<6BL5B4;564;-2:75;E454774:;2-@5K4-;I6475<K52:;4647;
•  ["
•  d*2(5'7+"G+"^-/78+("
(
J )996<C23-;4@B57<@>45;E4596<.@435-;5E-:=52:53-2:5343<6B
•  "<+@-/2+'(5D)'2"A)'G/+2"2.-"1+2"1$+,$-*'+'%*()
>+:$*+,+
'
$,
%&
J 1-M45NE<94KI@@B5>46B5K4AO5-//477475;<5;E45<62H2:-@5=-;-5<:5=27M5
–  W*3'+"G+"15"@+'(+"r"G/-*O/+2"
;<5/<:K2635;E457<@I;2<:5<.;-2:4=52:5';495"L5<65;<53<=2KB5;E45
7<@I;2<:57<52;5-H64475A2;E5;E457<@I;2<:5A45A<I@=5E->45<.;-2:4=5<:5
;E45<62H2:-@5=-;-
–  ,)+è7*+'(2"G+"4+5-2)'"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
91*-%",2: ;"(<-%*.%+1$%
&''(")*#&+*",%&22";-%
!"#$%&'"()*+),
!)(*'+ %
#L%" !"#$%"
1
# !K " $ & " "
" &!
"
/??'1@(2+,(1&$
1'$
A>#?'#5#&,+,(1&B
!"#)$,*',+
!"#)$,*',+ %
#
8
" &!
N&)" $ &)"$! ONK9" $ &9" O"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
=";$(%>"7,8*,?%#$&,-%+1&+%."(%&22%@%&,8%
!A%;$%1&6$B !"#)$,*',+ ' !)(*'+
#Lg" !"#$%"
1. PRÉSENTATION DES DONNÉES
149
,1522*E75D)'"2.@+-O*2/+"G+"2/N.+'7+"
discriminants. Ce qui est d’intérêt est d’extraire un profil discriminant pour chacune des deux
• 
saisons. Nous avons à l’issue du processus d’apprentissage, effectué une classification fondée
sur ces profils pour vérifier la capacité de notre approche à discriminer les séries. Ces tests
B+"@-)Q1RH+"
de classification ont été effectués sur la base de trois tirages aléatoires d’un échantillon de 60
par classe pour le jeu d’apprentissage et de 30 séries pour le jeu test, par une méthode
–  séries
a>3>",)'2)HH5D)'"/1+7(-*N.+"@).-"G+2"2/-*+2"G+2"71522+2"â5-H"+(",)1G"G."0+."G+"G)''/+2"7)'22+52)'>"
classification de type "k plus proches voisins".
" de
"ì|+Q-5*1Z"t>"+("51>Z"aF@1)-5()-K"5'51K2*2")A"A.'7D)'51"G5(5"O*5"71.2(+-*'3"5'G")@DH51"2+3H+'(5D)'>"Jj#jî"
:.8((2H189$%)(0,'-42(&'"G+"2/N.+'7+2"
=5*"M"W+@(+HQ-+"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#Lh" !"#$%"
`7()Q-+"M"&O-*1"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
Figure 52 – Consommation électrique pour des séries des classes Warm et Cold du jeu de
données consseason.
1.2.b
:.8((2H189$%)(0,'-42(&'"G+"2/N.+'7+"
#L$" !"#$%"
Pic de consommation
Pour répondre au second problème d’anticipation d’un pic de consommation, nous avons
divisé les séries en deux catégories : celles qui ont une consommation forte sur la période
18h-20h et celles qui ont une consommation faible. Pour cela, nous avons dans un premier
temps, calculé la moyenne pour chaque série de ces valeurs. Nous déterminons la médiane sur
cet ensemble de 349 moyennes. Enfin, en laissant un intervalle de 20% entre les deux, nous
_&Y7,'1,'C01/$<'Q/4%O6+/A'5hbME'#r"m8'
divisons la population en deux classes : les 40% de séries prenant en moyenne les valeurs les
plus hautes sur cette période et les 40% prenant les valeurs les plus faibles.) Ce qui nous
dans ce cas était d’être capable de prédire un éventuel pic de consommation à
–  intéressait
&@@-+'D2253+""
l’avance, c’est-à-dire de reconnaître, au sein des instants précédant la période critique, des
signes
discriminant les deux comportements. Nous avons à nouveau effectué une classification
•  G+".<8,,8-2'+'%*)#N`"@).-"5.3H+'(+-"1+"7)'(-52(+"+'(-+"71522+2"
fondée sur les couplages appris pour vérifier la capacité de notre approche à discriminer les
H*'*H*25'("15"O5-*5'7+"*'(-5M71522+2"+("H5F*H*25'("15"O5-*5'7+"*'(+-M71522+2"
séries. Les– tests
de classification ont été effectués sur la base de trois tirages aléatoires d’un
échantillon
de
30 séries par classe pour le jeu d’apprentissage et de 60 séries pour le jeu test.
•  G+),$23()8(($12&()80B)2%(*8%*("G5'2".'+"H/(-*N.+"*'G.*(+""
Les séries sont classées par une méthode de classification de type "k plus proches voisins", sur
UMx"*'2(5'(2"G*27-*H*'5'(2V"
la base des instants correspondant à la période 0h-16h.
:.8((2H189$%)(0,'-42(&'"_"+F+H@1+"
• 
•  &@@-)78+2 ""
–  mM;;"
–  Wc="
–  ["
•  q.+2D)'2"_"
•  ,517.1"GC.'",-$H.)+$F'%)a)1.8((')
–  q.+11+"-+@-/2+'(5D)'"p"
–  wD1*25D)'"G+"PM@@O"
•  d+2"2/N.+'7+2"
•  &O+7".'+"G*2(5'7+"*'G.*(+"@5-"15"@852+"GC5@@-+'D2253+"
•  d+2"71522+2""
–  q.+11+"G*2(5'7+"p"
–  6+2(2""
•  W.-"7).-Q+2"5-DE7*+11+2"
•  W.-"7).-Q+2"G+"7)'2)HH5D)'"/1+7(-*N.+"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#Li" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#Pj" !"#$%"
complexité du jeu, il est judicieux de s’autoriser plus de voisins. Nous testons donc plusieurs
valeurs pour le nombre de voisins K.
Pour se rendre compte de la complexité du jeu, nous représentons le résultat d’un MDS
(Multidimensional-Scaling [Cox]) pour les deux distances usuelles Euclidienne et DTW.
Nous observons sur ces figures 54 et 55 un fort recouvrement des classes, qui dénote des
ensembles complexes de séries temporelles. Les distances usuelles dE et dtw sont incapables
de séparer les classes efficacement.
Nous appliquons donc une classification KNN sur la base de la distance proposée au
chapitre précédent. Nous présentons à présent les résultats obtenus pour les deux jeux de
données.
:.8((2H189$%)(0,'-42(&'"_"+F+H@1+"
•  &@@-+'D2253+"G+2"S"25*2)'2"T"
154
152
CHAPITRE 6. APPLICATIONS À DES DONNÉES ÉLECTRIQUES
3
–  #$%%&'())
CHAPITRE 6. APPLICATIONS À DES DONNÉES ÉLECTRIQUES
•  LPi"0).-2"
Résultats
Problème de la catégorisation Nous voyons sur la figure 56, les appariements intra et
inter appris au cours de l’algorithme. L’appariement intra fait état d’une figure en damier,
•  <+1+O/"().(+2"1+2"#jH'"_""#PP"H+2.-+2"!"0).-"
montrant l’alternance entre des zones de faibles et fortes consommation. L’appariement inter
•  ]785'D11)'2"GC5@@-+'D2253+"
"X"gj"2/N.+'7+2"
a dégagé l’importance
de la zone marquée en rouge pour la discrimination de ces séries.
•  ]785'D11)'2"G+"(+2("
Nous
sur la figure 57, que les deux classes sont bien séparées. Cela met en avant
" observons
"X"Lj"2/N.+'7+2"
la capacité de la métrique à caractériser les classes.
(a) Appariement intra
3. RÉSULTATS
153
Table 3 – Taux d’erreur de
k
1nn
3nn
5nn
7nn
(a) Jeu Level
(b) Jeu Saison
(a) Jeu Level
B+2"\SS)U2.*(+V"
(b) Appariement inter
Figure 56 – Appariements appris pour une série "faible consommation" à l’issue d’une itération
la classification K plus proches voisins (%)
de dtw
d
23.9 28.3
9.4
22.8 31.1 12.8
20.0 30.0 20.5
22.2 30.6 11.1
BC5@@-+'D2253+"
Les résultats de classification étayent ce propos. La métrique apprise surpasse largement
les métriques usuelles dans des tâches de classification.
Figure 57 – Les proximités induites par la métrique apprise (tendances saisonnières).
Figure 54 – Les proximités entre les séries temporelles induites par la DE pour les deux
jeux conslevel et consseason.
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#P#" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#PJ" !"#$%"
(b) Jeu Saison
Figure 55 – Les proximités entre les séries temporelles induites par la DTWpour les deux
jeux conslevel et consseason.
6I78+2"GC5@@-+'D2253+"+("G+"@-/G*7D)'"
L"N.+2D)'2"*H@)-(5'(+2""U2.*(+V"
•  f+,::,',72':4'./6O4O$:$20'1Z+;,'70*+,;<,'16;;0,'J'
•  :.8((2H189$%"GC.'+"2/N.+'7+)
!  "Algorithme Forward"
•  ](5'("G)''/2".'"+'2+HQ1+"G+"|=="-+@-/2+'(5'("G*n/-+'(+2"71522+2"G+"2/N.+'7+2""
+(".'+"2/N.+'7+"(+2("
•  f+,::,',72':4'2/4g,<26$/,':4'.:+7'./6O4O:,'.6+/':4'./61+<)6;'1Z+;,'70*+,;<,'
16;;0,'J"
•  Trouver quel HMM +F@1*N.+"1+"H*+.F"15"2/N.+'7+"
" "
":1"A5.("G)'7"8,,-'%3-').'"|=="!"71522+"
!  "Algorithme de Viterbi"
•  C6%%,;2'4../,;1/,':,7'.4/4%Y2/,7'1Z+;'d99'024;2'16;;0'+;',;7,%O:,'1,'
70*+,;<,7'J'
•  E,,-'%9((87')U2.@+-O*2/V"
•  ](5'("G)''/2".'"H)GR1+"+("G+2"2/N.+'7+2"GC5@@-+'D2253+"
!  "Algorithme Forward-Backward (Baum-Welch)"
•  Trouver les paramètres d’un modèle"@+-H+}5'("G+"-+'G-+"7)H@(+"5O+7".'+"3-5'G+"
@-)Q5Q*1*(/"G+2"2/N.+'7+2"GC5@@-+'D2253+"U1+"Q.("/(5'("G+"3/'/-51*2+-"b"GC5.(-+2"
2/N.+'7+2V"
!"#$%"
!"#$%"
&13)-*(8H+"G+"y5.HMâ+178"
&13)-*(8H+"G+"y5.HMâ+178"
4-*'7*@+"_""""utiliser une procédure de réestimation qui affine le modèle
petit à petit selon les étapes :"
•  `'"2.@@)2+"G*2@)2+-"GC.'"/785'D11)'"G+"2/N.+'7+2"*>*>G>""L"X"YL#Z"[Z"L%\"
•  `'"78+-78+"b"5@@-+'G-+"1+2"@5-5HR(-+2"'"GC.'"|=="_"''X"U?E'=E'#V"
–  ,8)*2*-".'"+'2+HQ1+"*'*D51"G+"@5-5HR(-+2"_"-j"
•  `'"78+-78+"G)'7"_"
–  ,517.1+-"-#"b"@5-D-"G+"-j"Z"@.*2"-J"b"@5-D-"G+"-#Z"+(7>"
–  </@/(+-"0.2N.Cb".'"7-*(R-+"G+"E'"
4).-"785N.+"/(5@+".Z")'"78+-78+"-.Ä#"O/-*E5'("_""
2)*("_""
On utilise pour cela une procédure EM
!"#$%"
&@@1*75D)'"G+"@S)5.F"H/15'3+2"G+"t5.22*+''+2"
!"#$%"
&@@1*75D)'"G+"@S)5.F"H/15'3+2"G+"t5.22*+''+2"
•  W)*("1+"-+1+O/"G+2"(5*11+2"GC.'"/785'D11)'"G+"@+-2)''+2"
</2.1(5("G+"a="5@-R2"#j"*(/-5D)'2"
LZ,X.:$*+,@2@$:'.4/'+;'%0:4;A,'1,'A4+77$,;;,7'J'
!"#$%"
!"#$%"
a="@).-"G+2"H/15'3+2"G+"t5.22*+''+2"
:11.2(-5D)'"_"71.2(+-*'3"5O+7"a="+("G+2"35.22*+''+2"
437
9.2. Mixtures of Gaussians
"ìy*28)@"UJjjgVZ"S"45}+-'"<+7)3'*D)'"5'G"=578*'+"B+5-'*'3"TZ"@>PLhî"
&13)-*(8H+"
2
2
2
0
0
0
−2
−2
−2
2
0
(a)
2
0
−2
−2
2
L=2
0
(b)
2
0
(d)
2
0
(c)
2
0
(f)
2
L = 20
0
−2
−2
−2
2
L=5
0
−2
L=1
−2
−2
0
(e)
2
−2
Figure 9.8 Illustration of the EM algorithm using the Old Faithful set as used for the illustration of the K-means
algorithm in Figure 9.1. See the text for details.
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#Pi" !"#$%"
&13)-*(8H+"a="3/'/-51"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
Section 9.4
&13)-*(8H+"
#%j" !"#$%"
and the M step, for reasons that will become apparent shortly. In the expectation
step, or E step, we use the current values for the parameters to evaluate the posterior
probabilities, or responsibilities, given by (9.13). We then use these probabilities in
the maximization step, or M step, to re-estimate the means, covariances, and mixing coefficients using the results (9.17), (9.19), and (9.22). Note that in so doing
we first evaluate the new means using (9.17) and then use these new values to find
the covariances using (9.19), in keeping with the corresponding result for a single
Gaussian distribution. We shall show that each update to the parameters resulting
from an E step followed by an M step is guaranteed to increase the log likelihood
function. In practice, the algorithm is deemed to have converged when the change
in the log likelihood function, or alternatively in the parameters, falls below some
threshold. We illustrate the EM algorithm for a mixture of two Gaussians applied to
the rescaled Old Faithful data set in Figure 9.8. Here a mixture of two Gaussians
is used, with centres initialized using the same values as for the K-means algorithm
in Figure 9.1, and with precision matrices initialized to be proportional to the unit
P
matrix. Plot (a) shows the data points in green, together with the initial
configuration of the mixture model in which the one standard-deviation contours for the two
&13)-*(8H+"G+"y5.HMâ+178"
•  """""""""""""""""_""@-)Q>"N.+Z"/(5'("G)''/2".'+"2/N.+'7+"e "+(".'"
|=="G+"@5-5HR(-+"-Z"7+"2)*("1C/(5("7$"N.*"5*("/H*2"*2"G5'2"eP"+("
1C/(5("7g"N.*"5*("/H*2"*2Ä#"""
W)*("@5-"G/E'*D)'"G+2"A)'7D)'2"A)-Å5-G"+("Q57mÅ5-G"_""
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#%#" !"#$%"
!"#$%"
&13)-*(8H+"G+"y5.HMâ+178"
&13)-*(8H+"G+"y5.HMâ+178"
•  W)*("5.22*"""""""""""""15"@-)Q5Q*1*(/"N.+"1+"2*RH+"75-57(R-+"/H*2"G5'2"15"
2/N.+'7+"eP"2)*("/H*2"@5-"1C/(5("7g""""
•  B+2"').O+5.F"@5-5HR(-+2"2+"G/G.*2+'("G+2"5'7*+'2"+'"-/+2DH5'("#Z"?"+("="
@5-"7)H@(53+"2.-"15"Q52+"GC5@@-+'D2253+"_"""
`'"5"15"-+15D)'"_""
!"#$%"
&13)-*(8H+"G+"y5.HMâ+178"
!"#$%"
&13)-*(8H+"G+"y5.HMâ+178"
•  W)*("_""
!"#$%"
!"#$%"
&13)-*(8H+"G+"y5.HMâ+178"_"+F+H@1+"
&13)-*(8H+"G+"y5.HMâ+178"_"+F+H@1+"
! 
Après 15 itérations :
! 
Après 150 itérations :
•  a'"@5-(5'("G."|=="G+"@5-5HR(-+2"-j"_""
! 
On a :
! 
Après une itération :
1
1
3
<N"_"5@@-+'D2253+"2.-".'+"2+.1+"2/N.+'7+"*7*Z"
0.5
0.5
"""""""H5*2",8()8,,-'%9((87'),8-)1b0-"75-"|=="(-)@"1*H*(/>"
2
!"#$%"
&13)-*(8H+"y5.HMâ+178"_"-+H5-N.+2"
0.18
0.82
!"#$%"
,)'71.2*)'2"2.-"1+2"|=="
•  B+2"\SS)2)'("G+2"H)GR1+2"@-)Q5Q*1*2(+2"GC/H*22*)'"G+"2/N.+'7+2"
•  a="7)'O+-3+"O+-2".'"+2%2+0+).$18."G+"15"1)3"O-5*2+HQ15'7+"
•  C<2%298.2(89$%"'C+2("@52".'+"78)2+"A57*1+"G5'2"1+"752"G+2"|=="
•  BC513)-*(8H+"G6/N4/1@O4<PN4/1"@+-H+("G+"7517.1+-"15"@-)Q5Q*1*(/"N.C.'"|=="
5*("/H*2".'+"2/N.+'7+"G)''/+"
•  BC513)-*(8H+"G+"s$2,/O$'@+-H+("GC+2DH+-"15"2/N.+'7+"15"@1.2"@-)Q5Q1+"GC/(5(2"
7578/2"5K5'("@-)G.*("15"2/N.+'7+")Q+-O/+"
–  45-D-"G+"@1.2*+.-2"|==j"
–  W+"-+@)-(+-"b"15"1*}/-5(.-+"2.-"1+"2.0+("
•  BC513)-*(8H+"G+"q4+%@i,:7&"@+-H+("GC50.2(+-"1+2"@5-5HR(-+2"GC.'"|=="@5-"
H5F*H.H"G+"O-5*2+HQ15'7+"b"@5-D-"GC.'"+'2+HQ1+"G+"2/N.+'7+2"
GC5@@-+'D2253+"
•  BC5@@-+'D2253+"G+"15"2(-.7(.-+"GC.'"|=="+2(".'",-$5.K+')32c12.'"')'"
+'7)-+"H5l(-*2/"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#%i" !"#$%"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#gj" !"#$%"
B+"752"G+"15"S"71522*E75D)'",-&1$1'"T"
150
CHAPITRE 6. APPLICATIONS À DES DONNÉES ÉLECTRIQUES
B+"@-)Q1RH+"G+"15"
:.8((2H189$%),-&1$1')G+"2/N.+'7+2"
•  B+"32.'++'))
Figure 53 – Consommation électrique pour des séries des classes Low et High du jeu de
données conslevel.
A partir de ces deux jeux de données, nous allons à présent apprendre les appariements
–  41.2")'"5}+'G"
discriminants associés par la méthode introduite précédemment.
•  =+*11+.-+"+2("15"@-/G*7D)'"
2
Mise en place de l’apprentissage
=5F*H*2+-".'+"2)-(+"
•  =)*'2"*'(/-+225'(+"+11+"+2("
GC'(,&-8%1')3')782%)
Nous détaillons ici le choix des paramètres pour les différentes étapes de l’algorithme et
les différences que nous considérons pour résoudre les deux problèmes présentés ci-dessus.
2.1
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#g#" !"#$%"
4-/G*7D)'"GC.'+"2/N.+'7+"
• 
a'"(+'5'("7)H@(+"G+"1C5@@-+'D2253+"2.-"L''
#gJ" !"#$%"
Problème de la prédiction précoce Dans le cadre du second problème, nous appliquons
l’algorithme en initialisant la matrice de voisinage avec un bloc spécifique. Afin d’apprendre
des alignements dans le but de faire de la prédiction précoce, nous assignons des poids nuls
à toutes les arêtes liant des instants de la seconde série situés après l’instant 16h. En effet,
l’objectif étant de faire de la classification par un procédé "k plus proches voisins", nous
connaissons l’information sur les séries d’apprentissage, tandis que l’information est cachée
sur la base de série Test. La sortie de l’algorithme nous donne les liens discriminant les deux
profils sur la base des premiers instants.
,1522*E75D)'"@-/7)7+"
• 
Initialisation de la matrice
Problème de la S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
caractérisation des saisons Dans le cadre du premier problème, nous
appliquons l’algorithme classique, en initialisant l’apprentissage avec un couplage complet.
La sortie de l’algorithme nous donne les alignements caractéristiques au sein des classes et
nous permet d’initialiser les apprentissages inter-classes.
1) Early classifier: - A number of early classification
models have been proposed in the literature.
- In this paper, we choose to exploit an approach based on
several classifiers trained on parallel [6].
- Description of the approach here.
&@@-+'D2253+"2.-""
P0B)3')3$%%&'("
2) clustering: In order to make a good estimation of the
ìd578-5).*Z"y)'G.Z",)-'./0)12"UJj#%Z"2.QH*(+GV>"
expected cost fτ (xt ), ∀τ ∈ {1, . . . , T } (see Equation (4)), we
S"?4/:!'C:477$U<4)6;'6G'_$%,'L,/$,7''
need to partition the time series into different clusters with
47'4'L,*+,;)4:'K,<$7$6;'94P$;A"Tî"
respect
to the following constraints: a) each cluster should
contain time series with similar shapes and, b) all the clusters
should give different confusion matrices.
Figure 2. The first curve represents an incoming time series xt . The second
curve represents the expected cost fτ (xt ) given xt , ∀τ ∈ {0, . . . , T − t}.
- to achieve this clustering task under constraints a) and b)
we propose a simple method that we illustrate in Algorithm
(3).
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
an additional time step compensates the reduction of the
misclassification cost.
- Finally, Algorithm (2) summarizes a possible development of the decision function T rigger(xt , M) in Algorithm
(1). The Boolean function T rigger(xt , M) is initialized to
#gL" !"#$%"
Algorithm 3 Clustering algorithm
Input:
• D = RT × Y: a set of n labeled time series
1: Predict the labels of
� all time series
� in D;
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#gP" !"#$%"
415'"
#>  :11.2(-5D)'"
J>  q.+12"G+2*G+-5(5"p"
L>  <+@-/2+'(5D)'"GC.'"o.F"G+"G)''/+2"
&@@-+'D2253+"+'M1*3'+""
P>  y5(78"O2>"+'M1*3'+"
%>  w'"@-)Q1RH+"S"2*H@1+"T"_"7)HQ*+'"GC/1/H+'(2"G*n/-+'(2"G5'2".'"o.F"p"
%$%)(0,'-42(&)
g>  ,)'2(-.7D)'"G+"S"-/2.H/2"T"G+"o.F"G+"G)''/+2"
#> 
&@@-)78+"S"25H@1*'3MQ52+G"T"
J> 
&@@-)78+"S"H*7-)M71.2(+-*'3"T"
h>  ,)'71.2*)'2""
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#g%" !"#$%"
`'1*'+"37>"y5(78"H)G+""
`M8*)2()0%(0,'-42('3).'8-%2%7)d)
•  =*'*'3"G5(5"*'")-G+-"()"E'G"'+Å"m')Å1+G3+""
•  ;)"*G+5"5Q).("(8+"+F@+7(+G"-+2.1("
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
#gg" !"#$%"
W.HH5-*É*'3"G5(5"2(-+5H2"
`MF)3$)f')%''3)*$)(0++8-2g')38*8)(*-'8+()d)
• 
• 
• 
68+"%0+5'-")A"(.@1+2"*'"2%H%2*'"[""
68+*-"'+2((2$%)-8*'"*2"@)(+'D511K"4'-F)M27M)[""
68+"M8-3f8-'"-+2).-7+2"5-+".2+2*'3"U,4wZ"<&="Ñ":!`V"
L8*1M)+$3')e)
• 
&'"+'D-+"38*8('*)2()8482.85.'"""
• 
68+"+F5H@1+2"75'"Q+"@-)7+22+G"('4'-8.)9+'())
• 
`'8T)1$%(*-82%))'"(8+"7)[email protected]'3"DH+"
• 
68+"32(*-2509$%")A"G5(5"G)+2"%$*)1M8%7'))O+-"DH+"
`M8*)2()8)(0++8-F)d)
• 
• 
• 
&"1$+,81*)-',-'('%*89$%))A"(8+"@52("(.@1+2"
â*(8"5"7)'(-)11+G"+'+$-F)(,81'h)8110-81F"5'G".8*'%1F""
â8*78"511)Å2"()"/0'-F"56/'4;4:!t,8"(8+"8*2()-K")A"(8+"
2(-+5HZ"*'"5'"8,,-$B2+8*'3)f8F)
>%.2%'),-$1'((2%7)e)
• 
• 
• 
• 
6.@1+2"5-+"'+2O'3)$%')5F)$%')
6.@1+2"8-'),-$1'(('3)$%)*M')PF)G.+"()"(8+*-"8*38"-5(+"
56;,'.477'4:A6/$2&%78%
]'8.69+'"7)[email protected]'3"5:6N':42,;<!8'
#gh"
68+"32(*-2509$%")A"(.@1+2)1M8%7'())O+-"DH+"51/$T8' !"#$%"
68+")Q0+7DO+"*2"()"+8B2+2g')*M')8110-81F))A"(8+"N.+-*+2Z"
3*O+'"*'1M%218.)1$%(*-82%()U2(-+5H"-5(+Z",4wZ"<&="Ñ":!`V"
#g$"
!"#$%"
6Å)"(K@+2")A"2.HH5-K"
^150)1+(M=5-D'"Wm+(78"ì#î"
=-$5.'+)(*8*'+'%*e)
I,'12H1)(0++8-2'()e)"G+G*75(+G"()"5"2*'31+"N.+-K"56/'G,N8"))
• 
A.8?$.'*6S8-9%)IT'*1M)e)5@@-)F*H5(+2"(8+"'.HQ+-")A".'*N.+")Q0+7(2"*'"5"2(-+5Hr""
• 
L.$$+)A2.*'-)e"+è7*+'(1K"(+2(2"*A"5'"+1+H+'("*2"5"H+HQ+-")A"5"2+(r"
• 
:$0%*6IT'*1M)e"+è7*+'(1K"E'G2"(8+"P"H)2("A-+N.+'("+1+H+'(2")A"5"2+(r"
• 
:$0%*6S2%)IT'*1M)e""+'.H+-5(+2"(8+"'.HQ+-")A"+1+H+'(2"Å*(8"5"@5-D7.15-"O51.+Z"
)-"Å*(8*'"5'"*'(+-O51")A"O51.+2>""
• 
I"*2"5"7)11+7D)'")A"i"+1+H+'(2"_"W"X"Y2#Z"2J"[>"2;\"
• 
6Å)"+1+H+'(2")A"W"+8F)5')23'%918.""
• 
W"*'71.G+2")'1K"A"G*2D'7("+1+H+'(2"
• 
68+")Q0+7DO+"*2"()"+è7*+'(1K"'(9+8*')A"*'"(+-H2")A_"
– 
6*H+"7)H@1+F*(K"5e;,'.477'4:A6/$2&%8'
– 
W@57+"7)H@1+F*(K"
– 
4-)Q5Q*1*2D7"3.5-5'(++2"""""
W'%'-21)(0++8-2'()e)511)Å"5"15-3+"-5'3+")A"N.+-*+2")'"5'K"@52("@+-*)G""
• 
I*-'8+I8+,)e)Q52+G")'"2.77+22*O+"Å*'G)Å*'3"5'G"25H@1*'3r""
• 
:.0I*-'8+)e"Q52+G")'"H*7-)M71.2(+-*'3r"
• 
#'%I*-'8+)e"Q52+G")'"+O)1O*'3"H*7-)M71.2(+-*'3r"
\$f)+8%F))
#gi" !"#$%"
#hj" !"#$%"
:11.2(-5D)'"
^150)1+(M=5-D'"Wm+(78"ì#î"
\8(M);0%19$%)e)&5>8))
•  6)"Q+}+-".'G+-2(5'G"(8+"1M8..'%7')$;)3'*'-+2%2%7)*M')18-32%8.2*F)$;).8-7')
"rr"r""r'
('*("1+(ó2"*H53*'+"(85("K)."85O+"5"#g"785-57(+-":d"5'G"F$0j3).2T')*$)1$0%*)*M')
%0+5'-)$;)32(9%1*)G#("(85("K).óO+"2++'"*'"K).-"1)32>"|+-+"*2"5'"+F5H@1+_"
&22)7*5(+2"5'"+1+H+'()2*"Å*(8"5"0%2;$-+.F)3-8f%)52%8-F)48.0'))
• 
(:I>)*2"5)3'*'-+2%2(91"A.'7D)'"
r"r""r""'
• 
J"*2"(8+"1+'3(8")A"Q*'5-K"O51.+2"5;+%O,/'6G'O$278""
rrr""rr"'
• 
J%*2"5'"*'(+3+-"2.78"(85(""
r"r"rr""'
• 
"<5'G)H"O51.+2"5-+"0%2;$-+.F)3-8f%)Å*(8*'"%"#0, 2
"rrr"r"r'
PAghQA7gjL#jg7QJ"
•  68+2+"#g"785-57(+-2"-+@-+2+'("#J$"Q*(2>"g%ñ":d2"Å).1G"-+N.*-+"#"H+35QK(+")A"
2@57+>"W.@@)2+"Å+"-+7+*O+")O+-"L"Q*11*)'"+O+'(2"@+-"G5KZ"5'G"+578"+O+'("852"
5'":d>"68)2+":d2"-+N.*-+"L$PZjjjZjjjZjjj"Q*(2")-"ZU)72785F*'()$;)(*$-87'>"&'G"
2w ! F
w
!1$%
G%*029$%)e))
(85("*2"0.2("(8+"2@57+"(85("(8+":d"E+1G"-+N.*-+2ã"
t*O+'"5"15-3+"2+(")A"-5'G)H"Q*'5-K"O51.+2Z"
•  |)Å"7).1G"Å+"+2DH5(+"(8+"'.HQ+-")A"G*2D'7(":d"*'"5"1)3p"
1""""")A"(8+H"Q+3*'"Å*(8"á#à"
2
#"
#
#"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
• 
rr"rrr""'
#h#" !"#$%"
1""""")A"(8+H"Q+3*'"Å*(8"á##à"
4
#
#
#"
1""""")A"(8+H"Q+3*'"Å*(8"á###à"
8
1
""""")A"(8+H"Q+3*'"Å*(8"m"á#à"
2k
#hJ" !"#$%"
^150)1+(M=5-D'"Wm+(78"ì#î"
^150)1+(M=5-D'"Wm+(78"ì#î"
E)(2%7.'6,8(()8.7$-2*M+)e)
"rrrrrrr'
rr"rrrrr'
"rrrrrrr'
r"rrrrrr'
^="Wm+(78"
^'u'r'
q'u'rrrrrrrrrrrrrr''''''
&548'u'r"rr""""r""r"r'''''''''25&5488'u'r"rrrrrrrrrrrr''''''
C$189$%)$;)*M')H-(*)k!l)f2*M2%)(:I>))
"3:I>"*2"(8+"A.'7D)'"Å8*78"m++@2")'1K"(8+"E-2("á#à"5<6+;);A'G/6%':,T8Z""
)(8+-"Q*(2"5-+"2+("()"ájà""""'
:'@.("G5(5"
2(-+5H"
@B8+,.')e''''''&52*8'u'r"rr""""r""r"r'''''''''25&52*88'u'r"rrrrrrrrrrrr''''''
^="Wm+(78"
^'u'#'
q'u'r"rrrrrrrrrrrr''''''
&548'u'r"rr""""r""r"r'''''''''25&5488'u'r"rrrrrrrrrrrr''''''
&5O8'u'"rrr"r"rr""r""'''''''''25&5O88'u'"rrrrrrrrrrrrr''''''
rrr"rrrr'
:'@.("G5(5"
2(-+5H"
r"rrrrrr'
L-/$*+%*'%8$+61M%J*10/%N))
"K"*2"(8+"A.2*)'")A"511"(8+"Q*'5-K"Å)-G2"3:(:(2>>%%
O!'+7$;A'2&,'e^'6.,/426/'1,;62,1'O!'""'
!
K%O%""""rrrr'
P%O%Q'
N
B = ! t(h(si ))
i=1
])*2"(8+"-5'm")A"(8+"E-2("ájà"5<6+;);A'G/6%':,T8"Å*(8*'"K>"
685("*2"5"-8%3$+)48-285.')-'.8*'3)*$)A)[))
^="Wm+(78"
^'u'#'
q'u'""rrrrrrrrrrrr''''''
&548'u'r"rr""""r""r"r'''''''''25&5488'u'r"rrrrrrrrrrrr''''''
&5O8'u'"rrr"r"rr""r""'''''''''25&5O88'u'"rrrrrrrrrrrrr''''''
&548'u'r"rr""""r""r"r'''''''''25&5488'u'r"rrrrrrrrrrrr''''''
:'@.("G5(5"
2(-+5H"
!
$
R = # MAX t(h(si ))& +1
" N
%
#hL" !"#$%"
^150)1+(M=5-D'"Wm+(78"ì#î"
#hP" !"#$%"
^150)1+(M=5-D'"Wm+(78"ì#î"
E)(2%7.'6,8(()8.7$-2*M+)e)
:'@.("G5(5"
2(-+5H"
:'@.("G5(5"
2(-+5H"
^="Wm+(78"
^'u'#'
q'u'""rrrrrrrrrrrr''''''
&548'u'r"rr""""r""r"r'''''''''25&5488'u'r"rrrrrrrrrrrr''''''
&5O8'u'"rrr"r"rr""r""'''''''''25&5O88'u'"rrrrrrrrrrrrr''''''
&548'u'r"rr""""r""r"r'''''''''25&5488'u'r"rrrrrrrrrrrr''''''
&5<8'u'rrr"r""rr"r""r'''''''''25&5<88'u'rrr"rrrrrrrrrr''''''
E)(2%7.'6,8(()8.7$-2*M+)e)
:'@.("G5(5"
2(-+5H"
^="Wm+(78"
^'u'v'
q'u'""r"rrrrrrrrrr''''''
&548'u'r"rr""""r""r"r'''''''''25&5488'u'r"rrrrrrrrrrrr''''''
&5O8'u'"rrr"r"rr""r""'''''''''25&5O88'u'"rrrrrrrrrrrrr''''''
&548'u'r"rr""""r""r"r'''''''''25&5488'u'r"rrrrrrrrrrrr''''''
&5<8'u'rrr"r""rr"r""r'''''''''25&5<88'u'rrr"rrrrrrrrrr''''''
&5O8'u'"rrr"r"rr""r""'''''''''25&5O88'u'"rrrrrrrrrrrrr''''''
^="Wm+(78"
^'u'v'
q'u'""r"rrrrrrrrrr''''''
&548'u'r"rr""""r""r"r'''''''''25&5488'u'r"rrrrrrrrrrrr''''''
&5O8'u'"rrr"r"rr""r""'''''''''25&5O88'u'"rrrrrrrrrrrrr''''''
&548'u'r"rr""""r""r"r'''''''''25&5488'u'r"rrrrrrrrrrrr''''''
&5<8'u'rrr"r""rr"r""r'''''''''25&5<88'u'rrr"rrrrrrrrrr''''''
&5O8'u'"rrr"r"rr""r""'''''''''25&5O88'u'"rrrrrrrrrrrrr''''''
• 
68*2"2*'31+M@522"513)-*(8H"*2"5G5@(+G"()"38*8)(*-'8+()
• 
A'f),2'1'()$;)2%;$-+89$%)'++G"()"Q+"(*$-'3"*'"(8+"<&="
• 
])*2"5"-5'G)H"O5-*5Q1+"2.78"(85("_"
E(R) ! log 2 ! F
#h%" !"#$%"
#hg" !"#$%"
^150)1+(M=5-D'"Wm+(78"ì#î"
\$f)*$)'(9+8*')@Q]R)d)
:'@.("G5(5"
2(-+5H"
d+(+-H*'*2D7"
-))D'3")A"&57$8'''
• 
^150)1+(M=5-D'"Wm+(78"ì#î"
,)11+7D)'")A"&"Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^%'u'v'
q%'u'""r"rrrrrrrrrr''''''
:'@.("G5(5"
2(-+5H"
,)11+7D)'")A"&"Wm+(78"
d+(+-H*'*2D7"
-))D'3")A"&57$8'''
68+"E-2("Q*(2")A"&57$8"5-+".2+G"()"5n+7("+578"+1+H+'("()"5"2m+(78"
F 2 E ( R)
!
m
!
8U2#V"X"VV!!jj#jjj#j#""Mx"#j##"X"L"Mx"2#"*2"5n+7(+G"()"(8+"m2&"2m+(78"
a578"Wm+(78"7).'(2"5@@-)F*H5(+1K"Aa+"G*2D'7("+1+H+'(2)
#hh" !"#$%"
,)'71.2*)'2"
S"BC&@@-+'D2253+"&-DE7*+1"A57+"5.F"G)''/+2"(+H@)-+11+2"T""""""U&>",)-'./0)12V""
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^="Wm+(78"
^%'u'v'
q%'u'""r"rrrrrrrrrr''''''
m
*A"%'u'"RZ"(8+"P"E-2("Q*(2")A"&57$8'-+@-+2+'("(8+":d")A"(8+"7)--+2@)'G*'3"Wm+(78"
• 
\$f)*$)'(9+8*')@Q]R)d)
#hi" !"#$%"
W()7852D7"5O+-53+"
1
Rm
m m"
F ! 2 i=1
!
#h$" !"#$%"