1 Une balle qui roule sur une roue qui tourne

Transcription

1 Une balle qui roule sur une roue qui tourne
Tronc commun d’Automatique: Dynamique et Contrôle des Systèmes.
Examen. Durée 2h30
École Nationale Supérieure des Mines de Paris
http://cas.ensmp.fr/∼TCsysdyn/index.html
lundi 21 mai 2007
Cet examen comporte 3 problèmes indépendants.
1
Une balle qui roule sur une roue qui tourne
Description On considère une balle homogène de rayon R3 et de masse M3 qui roule sans glisser sur
une roue de rayon R1 et de moment d’inertie J1 . Ce système est situé dans un plan vertical soumis à la
gravité g. La roue est entraînée par un moteur qui exerce un couple C autour de son axe. Le système est
décrit par les trois angles suivants (voir la figure ci-dessus): q1 l’angle de la roue, q3 l’angle de rotation
de la balle sur elle même1 et q2 l’angle qui repère la position de la balle par rapport à la roue.
Modèle à étudier En notant a =
q̇2 et u =
( 35 M3 (R1 )2 )−1 C,
J1
3
2
5 M3 (R1 )
q
,ω=
5g
R1 ,
x1 = −3q̇1 +8q̇2 , x2 = q2 ,
x3 = (a + 1) q̇1 −
on a le modèle dynamique suivant,
d
x1 = ω 2 sin x2 ,
dt
d
a+1
3
x2 =
x1 +
x3 ,
dt
8a + 5
8a + 5
d
x3 = u
dt
(1)
d’état x = (x1 , x2 , x3 )T et d’entrée u.
1. Boucle ouverte Considérons (1). On suppose u = 0, donner la famille des points d’équilibre du
système (1). En se rappelant que x1 = −3q̇1 + 8q̇2 , x3 = (a + 1) q̇1 − q̇2 , à quel comportement
correspondent ces équilibres? Étudier la stabilité des équilibres qui ont une pertinence physique et
donner les pôles du système linéarisé tangent.
2. Contrôle en vitesse de la roue
Soit ² un petit paramètre positif (0 < ² ¿ 1). On considère le “bouclage proportionnel grand gain
en vitesse”
u=
ω
(v − q̇1 )
²
où v est un nouveau contrôle lentement variable, i.e., |v̇| ¿
1 Angle
repéré par rapport à une direction fixe, la verticale.
(2)
ω
² |v|.
(a) Dans un premier temps, on considère v constant. Montrer que les hypothèses du théorème de
Tikhonov sont bien vérifiées.
(b) En déduire que la dynamique lente est donnée par
d
x1 = ω 2 sin x2 ,
dt
d
x1 + 3v
x2 =
dt
8
(c) Donner le changement de variables2 , x1 = λ1 X1 , x2 = λ2 X2 , t = λτ et v = µV qui conduit à
la forme réduite suivante
X1 + 3V
X10 = sin X2 , X20 =
(3)
8
d
où 0 = dτ
.
(d) On suppose dans cette question V = 0. Quels sont les points d’équilibre de (3) ayant une
pertinence physique? Étudier leur stabilité et calculer les pôles du système linéarisé tangent.
3. Stabilisation
On considère maintenant le modèle réduit (3) ayant V comme commande et la position de la balle
Y = X2 comme seule mesure. L’objectif est de stabiliser (X1 , X2 ) en 0.
(a) Donner les équations du système linéarisé tangent autour de X1 = X2 = V = 0.
(b) Montrer que ce système est commandable et observable.
(c) Construire un observateur asymptotique qui permet d’estimer (X1 , X2 ). On notera ρ1 et ρ2
les deux pôles de cet observateur et on calculera ses gains L1 et L2 en fonction de ρ1 et ρ2 .
(d) Calculer les gains k1 et k2 du bouclage d’état V = k1 X1 + k2 X2 qui assure la stabilisation avec
comme pôles p1 et p2 .
(e) Donner les équations de l’observateur/contrôleur qui assure la stabilisation en 0 de (X1 , X2 ).
(f) Faire un schéma général où figurent: le système, l’observateur/contrôleur, et le contrôle en
vitesse de la roue.
(g) Proposer un choix raisonnable de ², ρ1 , ρ2 , p1 et p2 pour que le système (1) en boucle fermée
se stabilise en 0.
2
Mélange en ligne
On considère le procédé schématisé sur la figure ci-contre: on fabrique, à
la demande d’un client (débit w (l/h) variable dans le temps), un produit
dont la concentration doit être supérieure à c̄ (g/l). Pour cela on dispose de
deux réservoirs (notés 1 et 2) contenant chacun un liquide (dit de base) de
concentration c1 = 0 et c2 > 0, respectivement. On peut ajuster librement
les débits u1 et u2 (l/h). Les flux sortant des deux réservoirs sont mélangés
dans un bac de capacité maximum Vmax qui contient un volume V (V ∈
[0, Vmax ]) d’un mélange homogène à la concentration c (g/l). Le cahier des
charges est le suivant:
• la demande du client w(t) est variable dans le temps; elle reste dans
[0, wmax ] (wmax > 0); elle n’est pas connue à l’avance; elle n’est pas
mesurée.
• la concentration c délivrée au client doit impérativement être
supérieure ou égale à c̄.
• la concentration c2 du réservoir 2 peut fluctuer lentement autour de
sa valeur moyenne c̄2 très nettement supérieure à c̄: c̄2 À c̄. Ces
fluctuations ne sont ni mesurées, ni connues.
• le procédé dispose uniquement de deux capteurs: un capteur de niveau
permettant de mesurer le volume y1 = V (t) et un analyseur de la
concentration y2 = c(t) dans le bac de mélange.
2 (λ , λ , λ, µ)
1
2
sont des coefficients positifs que l’on déterminera.
On cherche à concevoir une stratégie de régulation qui ajuste les deux entrées (u1 , u2 ) en fonction des
deux mesures (y1 , y2 ). Il faut respecter le cahier des charges. La structure de régulation devra être la
plus simple possible et elle devra aussi limiter la consommation de la base no 2 (composition c2 ) car un
produit cher et sur-concentré (c > c̄) est facturé au client au même prix qu’un produit juste conforme
(c = c̄).
Question: exposer une telle structure de régulation; expliquer à l’aide d’équations et de schéma les
principes retenus, les difficultés auxquelles on peut s’attendre, l’ordre de grandeur des gains des divers
régulateurs en fonction de wmax , Vmax , c̄2 et c̄, le comportement prévisible en pratique, ...
3
Trajectoire périodique
On considère le système d’équations différentielles

d

 x1 = x2 − ²f (x1 )
dt

 d x = −x
2
1
dt
(4)
où ² > 0, et où f est une fonction régulière (C ∞ ) impaire qui vérifie
f (0) = 0,
f (x) < 0 sur ]0, a[,
f (a) = 0,
f (x) > 0 pour x > a
pour un certain a > 0. De plus, on a
kf (x)k ≤ kkxk
pour un certain k > 0. L’objectif de ce problème est de montrer que ce système possède une trajectoire
périodique. On rappelle que le vecteur vitesse au point de coordonnées (x1 , x2 )T est le vecteur dont les
composantes sont (x2 − ²f (x1 ), −x1 )T .
1. Discuter de l’existence et de l’unicité des trajectoires du système (4). À quelle équation différentielle
d’ordre 2 ce système correspond-il? En donner une interprétation physique.
2. Si ² = 0, à quel système correspond (4)? Sous cette hypothèse, dessiner le portrait de phases.
3. Soit
1 2
(x + x22 )
2 1
Calculer la dérivée par rapport au temps de V le long des trajectoires.
V (x1 , x2 ) =
4. Montrer que, dans un voisinage de 0, on a d V > 0. En déduire que 0 est un point d’équilibre
dt
instable.
5. Dessiner, dans le plan de phases, l’allure de la courbe C d’équation x2 = ²f (x1 ). Simplifier (4) sur
cette courbe. Représenter le vecteur vitesse en tout point de C.
6. Considérer un point A, sur l’axe des x2 , de coordonnées A = (0, α > 0)T . Dessiner ce point et le
vecteur vitesse en ce point.
7. La trajectoire issue de A coupe la courbe C en un point noté C. Représenter l’allure de la courbe
jusqu’à ce point. Si cette trajectoire rencontre la droite x1 = a, on note B son intersection.
8. En inspectant le vecteur vitesse pour les points de C, montrer que la trajectoire issue de A ne peut
pas recouper C avant de couper l’axe des x2 .
d x2
9. Montrer que dt est bornée en dehors de C et en déduire que la trajectoire issue de A ne peut
dx
dt 1
s’échapper vers l’infini et donc coupe nécessairement l’axe des x2 en un point noté E. Si cette
trajectoire coupe la droite x1 = a, on note D l’intersection.
10. Noter (0, −β(α))T les coordonnées de E. Expliquer pourquoi l’application α 7→ β(α) est continue.
11. Déduire du point 4 que β(α) > α pour α proche de 0.
12. Considérer le parcours A, B, C, D, E le long de la trajectoire issue de A (on suppose A choisi de
sorte que B et D existent). Lorsque α → +∞, la trajectoire “grossit”: les points A, B, C, D, E vont
tous vers l’infini, en restant respectivement sur l’axe x2 , la demi-droite x1 = a et x2 > 0, la courbe
C, la demi-droite x1 = a et x2 < 0, et l’axe x2 .
Le long du parcours AB, montrer que
Z
a
V (B) − V (A) =
0
dV
dx1 > 0
dx1
et que limα→∞ V (B) − V (A) = 0.
13. De même, montrer, en notant B = (a, x2b )T , D = (a, x2d )T que
Z x2d
dV
V (D) − V (B) =
dx2 < 0
dx
2
x2b
et que limα→∞ V (D) − V (B) = −∞.
14. Montrer, de même que
Z
0
V (E) − V (D) =
a
dV
dx1 > 0
dx1
et que limα→∞ V (E) − V (D) = 0.
15. Déduire des trois derniers points que, pour α suffisamment grand, on a
V (E) < V (A)
En déduire que, pour α suffisamment grand, on a
β(α) < α
16. Montrer qu’il existe α0 tel que β(α0 ) = α0 .
17. En déduire l’existence d’une trajectoire périodique.
18. Reprendre cette étude sans l’hypothèse que f est impaire. On pourra utiliser le théorème de
Poincaré-Bendixon.
Corrigé: Une balle qui roule sur une roue qui tourne
1. Boucle ouverte Les points d’équilibre sont de la forme
x1 = −3ν̄,
x2 = kπ,
x3 = −(a + 1)ν̄
avec k entier relatif arbitraire et ν réel arbitraire. Pour k impair, la balle est en bas et donc ces
équilibres n’ont pas de sens physique. La famille pertinente d’équilibres correspond à k pair: la
balle en haut comme sur la figure, à la verticale
q de l’axe de la roue; la roue tourne à une vitesse
a+1
constante ν̄ arbitraire. Les pôles sont 0 et ±ω 8a+5
. L’un d’eux est strictement positif, donc tous
ces équilibres sont instables.
2. Contrôle en vitesse de la roue
(a) Comme q̇1 =
x1 +8x3
8a+5 ,
le système en boucle fermée s’écrit:
d
x1 = ω 2 sin x2 ,
dt
d
a+1
3
x2 =
x1 +
x3 ,
dt
8a + 5
8a + 5
µ
¶
d
x1 + 8x3
² x3 = ω v −
dt
8a + 5
Il est bien sous la forme standard de Tikhonov d’un système lent/rapide: (x1 , x2 ) est l’état lent;
8ω
x3 est l’état rapide; la dynamique rapide est bien asymptotiquement stable (pôle − ²(8a+5)
).
Donc on peut faire l’approximation de quasi-stationnarité pour x3 ; la dynamique réduite admet
une unique solution.
1
1 +8x3
(b) L’équation de quasi-stationnarité de x3 , v − x8a+5
= 0 donne x3 = (8a+5)v−x
. Il suffit de
8
reporter cette valeur de x3 dans les deux équations différentielles sur les états lents x1 et x2
pour avoir le résultat.
(c) On trouve λ1 = ω, λ2 = 1, λ =
1
ω
et µ = ω.
(d) Il s’agit de X1 = X2 = 0: la balle est q
à la verticale de l’axe de rotation de la roue et cette
dernière est immobile. Les pôles sont ± 18 : l’équilibre est instable.
3. Stabilisation
(a) On a
X10 = X2 ,
X20 =
X1 + 3V
.
8
(b) L’observabilité résulte du calcul suivant
X2 = Y,
X1 = 8Y 0 − 3V
qui donne X1 et X2 en fonction de Y , Y 0 et V . La commandabilité vient du fait que le bouclage
1
statique V = 8U −X
met système sous la forme normale de Brunovsky X100 = U avec X1 la
3
sortie de Brunovsky et U le nouveau contrôle.
(c) Ses équations sont:
X̂1 + 3V
+ L2 (X̂2 − Y ).
8
µ
¶
0 1 + L1
Ses pôles sont les valeurs propres de la matrice (A + LC) qui vaut ici
. Donc
1
L2
8
on a L1 = −1 − 8ρ1 ρ2 et L2 = ρ1 + ρ2 .
X̂10 = X̂2 + L1 (X̂2 − Y ),
X̂20 =
(d) Comme X2 = X10 , un tel bouclage d’état donne
X100 =
3k2 0 1 + 3k1
X +
X1 .
8 1
8
Les pôles étant choisis en p1 et p2 , on en déduit que k1 = − 8p1 p32 +1 et k2 = 83 (p1 + p2 ).
(e) On a
V = k1 X̂1 + k2 X̂2
X̂10 = X̂2 + L1 (X̂2 − Y (t))
X̂20 =
X̂1 + 3V
+ L2 (X̂2 − Y (t))
8
(f) On fait apparaître une cascade de régulateurs. Le contrôleur agissant sur le modèle réduit
utilise l’estimation fournie par l’observateur.
1
(g) Déjà, il faut choisir ² petit, comme par exemple ² = 10
. Il faut choisir maintenant une
dynamique en boucle fermée nettement plus lente que celle du régulateur de la vitesse. On
garantie cela en choisissant les pôles de l’observateur/contrôleur nettement plus lents que celui
du régulateur de vitesse. Comme les pôles ρi et pi sont dans l’échelle de temps τ = ωt, il suffit
donc que ces derniers soient à partie réelle négative et de module nettement plus petit que
1/² = 10. Ainsi, on peut prendre par exemple,
√
√
√
√
1 + −1
1 − −1
ρ1 = −(1 + −1), ρ2 = −(1 − −1), p1 = −
, p2 = −
2
2
pour avoir un observateur deux fois plus rapide que le contrôleur.
Corrigé: mélange en ligne
Le problème est très ouvert et de nombreuses solutions sont possibles et acceptables. On donne ici un
exemple de réponse. Les équations bilan sur le volume et l’espèce mélangée conduisent à
d
y1 = u1 + u2 − w
dt
d
(y1 y2 ) = u2 c2 − wy2
dt
Après simplification, on obtient
y1
d
y2 = u2 (c2 − y2 ) + u1 (−y2 ).
dt
En première approche, on peut remarquer que puisque la concentration du bac 2 est très supérieure à
celle du mélange, la recette est très déséquilibrée. Ainsi, autour de l’équilibre on a necessairement
u1 >> u2 ,
y2 << c2
et on peut prendre comme modèle approché
d
y1 = u1 − w
dt
d
y1 y2 = u2 c2 − u1 y2
dt
Pour contrôler la première équation (celle du volume), on peut utiliser un régulateur PI agissant sur
u1 avec un certain volume de référence Vref . Ce volume de référence sera choisi, par exemple, à Vmax /2
de sorte qu’on aura toujours du mélange disponible, sans risque de débordement ni d’assèchement dès
que le régulateur PI de niveau aura des temps de convergence plus courts que Vmax /wmax :
Z
1
1
u1 = Kp (Vref − y1 ) + Ki (Vref − y1 )
avec Kp1 = 2ξ1 ω1 et Ki1 = (ω1 )2 où ω1 > 0 est de l’ordre de wmax /Vmax et ξ1 > 0 autour de 1. Ce choix
de gain pourrait être complété par une approche stochastique, si un modèle aléatoire de demande w est
disponible.
Cette première équation étant asservie, on a y1 ≈ Vref . Sous cette hypothèse, la deuxième équation
(concentration) donne
d
Vref y2 ≈ u2 c2 − u1 y2
dt
. C’est déjà un système stable, mais on peut améliorer ses performances en utilisant un autre régulateur
PI agissant sur u2 ayant cref > c̄ comme point de consigne et avec le terme de pré-compensation (feedforward) u1 cref /c̄2 :
Z
cref
2
2
u2 =
u1 + Kp (cref − y2 ) + Ki (cref − y2 )
c̄2
avec
Vref
Vref
Kp2 =
2ξ2 ω2 , Ki2 =
(ω2 )2
c̄2
c̄2
et où ξ2 est proche de 1 et ω2 > 0. En pratique, l’asservissement garantit la convergence asymptotique
de y2 vers cref mais, de manière transitoire, y2 peut être au dessous ou au dessus de cref . On aura
tendance à prendre cref le plus proche de c̄ pour limiter au maximum la consommation du liquide 2.
Cependant on risque de fabriquer en transitoire un produit hors-spécifications avec c < c̄. Il faudra donc
un asservissement réglé assez rapide ce qui peut poser des problèmes de robustesse: on aura sans doute
besoin d’un analyseur assez rapide et précis. Néanmoins à cause du terme de pré-compensation cc̄ref
u1 il
2
suffit de prendre ω2 assez grand pour compenser les fluctuations lentes de c2 (|ċ2 | ¿ ω2 c2 ). Ainsi, plus
la consigne cref sera proche de la limite c̄, plus il faudra une régulation performante.
Corrigé: trajectoire périodique
1. Le second membre de l’équation différentielle satisfait les hypothèses du Lemme 2 d’existence (et
d’unicité) globale en temps. L’équation d’ordre 2 correspondante est ẍ = −x + ²f (−ẋ).
2. Pour ² = 0, on a un oscillateur pur ẍ = −x. Les trajectoires sont représentées par des cercles dans
le plan de phase.
3. d V = −²x1 f (x1 ).
dt
4. Dans un voisinage de l’origine, on a par hypothèse f (x1 ) qui est de signe opposé à x1 , d’où la
conclusion. Les courbes fermées V = c0 pour c0 << 1 (cercles) sont donc sortantes: les trajectoires
qui en sont issues en sortent. Le point 0 est donc instable.
A
B
C
C
0
a
-a
D
E
5. Le long de la courbe C, le second membre de l’équation différentielle vaut (0, −x1 ). Les trajectoires
pointent verticalement vers le bas ou vers le haut suivant le signe de x1 .
6. Le vecteur tangent est horizontal, il vaut (α, 0).
7. Entre A et C, on a d x1 > 0 et d x2 < 0. On passe d’une tangente horizontale à une tangente
dt
dt
verticale.
8. Le long de C, les trajectoires pointent vers le dessous de la courbe et non le dessus. La trajectoire
issue de C ne touche donc pas C avant de recouper l’axe x2 .
d x2
9. En dehors de C, la quantité dt = ²f (xx11)−x2 > 0 est bornée. La trajectoire ne peut partir vers
dx
dt 1
l’infini. Il n’y a pas de point d’équilibre dans cette partie du plan de phases. La trajectoire finit
par sortir par le seul côté possible: l’axe x2 .
10. En vertu du théorème 6 de dépendance en la condition initiale, la trajectoire, et donc le point E
varie de manière régulière (C 1 ) en fonction de α. α 7→ β(α) est C 1 .
11. Au voisinage de 0 on a, d’après le point 4, d V > 0 le long de la trajectoire. Donc V (A) = α2 /2 <
dt
β 2 /2 = V (E), d’où la conclusion.
Ra
1 f (x1 )
12. V (B) − V (A) = 0 −²x
x2 −²f (x1 ) dx1 . Entre A et B, on a ²x1 f (x1 ) < 0, x2 − ²f (x1 ) > 0, donc
V (B) − V (A) > 0. D’autre part, lorsque α → +∞, x2 → +∞ alors que les bornes d’intégration
restent inchangées. D’où limα→∞ V (B) − V (A) = 0.
Rx
13. V (D) − V (B) = x2b2d ²f (x1 )dx2 . Entre B et D, on a f (x1 ) > 0, alors que x2b > x2d donc
V (D) − V (B) < 0. D’autre part, lorsque α → +∞, x1 → +∞, d’où f (x1 ) → +∞ alors que
l’intervalle d’intégration croît vers (+∞, −∞). D’où limα→∞ V (D) − V (B) = −∞.
14. Même raisonnement qu’au point 12.
15. On calcule V (E) − V (D) + V (D) − V (B) + V (B) − V (A) comme la somme des trois derniers termes
qu’on vient d’étudier. Cette somme devient négative lorsque α → +∞. D’où la conclusion.
16. L’application α 7→ β(α) − α est continue, comme on l’a montré au point 10. Elle est positive proche
de 0 et négative lorsque α → +∞. Donc il existe un α0 où elle est nulle.
17. Par symétrie, la trajectoire issue du point E se déduit de celle issue du point A. Si A a été choisi
tel que A = (0, α0 ), alors on a E = (0, −α0 ), et ensuite la trajectoire revient en (0, α0 ) = A. C’est
une trajectoire périodique.
18. Si f n’est pas impaire, on ne peut pas utiliser la construction précédente. On peut néanmoins
construire un ensemble positivement invariant, en utilisant comme frontière des morceaux de trajectoire et des segments de l’axe x2 . Cet ensemble positivement invariant contient un unique point
d’équilibre instable, et donc un cycle limite.
0
trajectoire
périodique

Documents pareils