1 Une balle qui roule sur une roue qui tourne
Transcription
1 Une balle qui roule sur une roue qui tourne
Tronc commun d’Automatique: Dynamique et Contrôle des Systèmes. Examen. Durée 2h30 École Nationale Supérieure des Mines de Paris http://cas.ensmp.fr/∼TCsysdyn/index.html lundi 21 mai 2007 Cet examen comporte 3 problèmes indépendants. 1 Une balle qui roule sur une roue qui tourne Description On considère une balle homogène de rayon R3 et de masse M3 qui roule sans glisser sur une roue de rayon R1 et de moment d’inertie J1 . Ce système est situé dans un plan vertical soumis à la gravité g. La roue est entraînée par un moteur qui exerce un couple C autour de son axe. Le système est décrit par les trois angles suivants (voir la figure ci-dessus): q1 l’angle de la roue, q3 l’angle de rotation de la balle sur elle même1 et q2 l’angle qui repère la position de la balle par rapport à la roue. Modèle à étudier En notant a = q̇2 et u = ( 35 M3 (R1 )2 )−1 C, J1 3 2 5 M3 (R1 ) q ,ω= 5g R1 , x1 = −3q̇1 +8q̇2 , x2 = q2 , x3 = (a + 1) q̇1 − on a le modèle dynamique suivant, d x1 = ω 2 sin x2 , dt d a+1 3 x2 = x1 + x3 , dt 8a + 5 8a + 5 d x3 = u dt (1) d’état x = (x1 , x2 , x3 )T et d’entrée u. 1. Boucle ouverte Considérons (1). On suppose u = 0, donner la famille des points d’équilibre du système (1). En se rappelant que x1 = −3q̇1 + 8q̇2 , x3 = (a + 1) q̇1 − q̇2 , à quel comportement correspondent ces équilibres? Étudier la stabilité des équilibres qui ont une pertinence physique et donner les pôles du système linéarisé tangent. 2. Contrôle en vitesse de la roue Soit ² un petit paramètre positif (0 < ² ¿ 1). On considère le “bouclage proportionnel grand gain en vitesse” u= ω (v − q̇1 ) ² où v est un nouveau contrôle lentement variable, i.e., |v̇| ¿ 1 Angle repéré par rapport à une direction fixe, la verticale. (2) ω ² |v|. (a) Dans un premier temps, on considère v constant. Montrer que les hypothèses du théorème de Tikhonov sont bien vérifiées. (b) En déduire que la dynamique lente est donnée par d x1 = ω 2 sin x2 , dt d x1 + 3v x2 = dt 8 (c) Donner le changement de variables2 , x1 = λ1 X1 , x2 = λ2 X2 , t = λτ et v = µV qui conduit à la forme réduite suivante X1 + 3V X10 = sin X2 , X20 = (3) 8 d où 0 = dτ . (d) On suppose dans cette question V = 0. Quels sont les points d’équilibre de (3) ayant une pertinence physique? Étudier leur stabilité et calculer les pôles du système linéarisé tangent. 3. Stabilisation On considère maintenant le modèle réduit (3) ayant V comme commande et la position de la balle Y = X2 comme seule mesure. L’objectif est de stabiliser (X1 , X2 ) en 0. (a) Donner les équations du système linéarisé tangent autour de X1 = X2 = V = 0. (b) Montrer que ce système est commandable et observable. (c) Construire un observateur asymptotique qui permet d’estimer (X1 , X2 ). On notera ρ1 et ρ2 les deux pôles de cet observateur et on calculera ses gains L1 et L2 en fonction de ρ1 et ρ2 . (d) Calculer les gains k1 et k2 du bouclage d’état V = k1 X1 + k2 X2 qui assure la stabilisation avec comme pôles p1 et p2 . (e) Donner les équations de l’observateur/contrôleur qui assure la stabilisation en 0 de (X1 , X2 ). (f) Faire un schéma général où figurent: le système, l’observateur/contrôleur, et le contrôle en vitesse de la roue. (g) Proposer un choix raisonnable de ², ρ1 , ρ2 , p1 et p2 pour que le système (1) en boucle fermée se stabilise en 0. 2 Mélange en ligne On considère le procédé schématisé sur la figure ci-contre: on fabrique, à la demande d’un client (débit w (l/h) variable dans le temps), un produit dont la concentration doit être supérieure à c̄ (g/l). Pour cela on dispose de deux réservoirs (notés 1 et 2) contenant chacun un liquide (dit de base) de concentration c1 = 0 et c2 > 0, respectivement. On peut ajuster librement les débits u1 et u2 (l/h). Les flux sortant des deux réservoirs sont mélangés dans un bac de capacité maximum Vmax qui contient un volume V (V ∈ [0, Vmax ]) d’un mélange homogène à la concentration c (g/l). Le cahier des charges est le suivant: • la demande du client w(t) est variable dans le temps; elle reste dans [0, wmax ] (wmax > 0); elle n’est pas connue à l’avance; elle n’est pas mesurée. • la concentration c délivrée au client doit impérativement être supérieure ou égale à c̄. • la concentration c2 du réservoir 2 peut fluctuer lentement autour de sa valeur moyenne c̄2 très nettement supérieure à c̄: c̄2 À c̄. Ces fluctuations ne sont ni mesurées, ni connues. • le procédé dispose uniquement de deux capteurs: un capteur de niveau permettant de mesurer le volume y1 = V (t) et un analyseur de la concentration y2 = c(t) dans le bac de mélange. 2 (λ , λ , λ, µ) 1 2 sont des coefficients positifs que l’on déterminera. On cherche à concevoir une stratégie de régulation qui ajuste les deux entrées (u1 , u2 ) en fonction des deux mesures (y1 , y2 ). Il faut respecter le cahier des charges. La structure de régulation devra être la plus simple possible et elle devra aussi limiter la consommation de la base no 2 (composition c2 ) car un produit cher et sur-concentré (c > c̄) est facturé au client au même prix qu’un produit juste conforme (c = c̄). Question: exposer une telle structure de régulation; expliquer à l’aide d’équations et de schéma les principes retenus, les difficultés auxquelles on peut s’attendre, l’ordre de grandeur des gains des divers régulateurs en fonction de wmax , Vmax , c̄2 et c̄, le comportement prévisible en pratique, ... 3 Trajectoire périodique On considère le système d’équations différentielles d x1 = x2 − ²f (x1 ) dt d x = −x 2 1 dt (4) où ² > 0, et où f est une fonction régulière (C ∞ ) impaire qui vérifie f (0) = 0, f (x) < 0 sur ]0, a[, f (a) = 0, f (x) > 0 pour x > a pour un certain a > 0. De plus, on a kf (x)k ≤ kkxk pour un certain k > 0. L’objectif de ce problème est de montrer que ce système possède une trajectoire périodique. On rappelle que le vecteur vitesse au point de coordonnées (x1 , x2 )T est le vecteur dont les composantes sont (x2 − ²f (x1 ), −x1 )T . 1. Discuter de l’existence et de l’unicité des trajectoires du système (4). À quelle équation différentielle d’ordre 2 ce système correspond-il? En donner une interprétation physique. 2. Si ² = 0, à quel système correspond (4)? Sous cette hypothèse, dessiner le portrait de phases. 3. Soit 1 2 (x + x22 ) 2 1 Calculer la dérivée par rapport au temps de V le long des trajectoires. V (x1 , x2 ) = 4. Montrer que, dans un voisinage de 0, on a d V > 0. En déduire que 0 est un point d’équilibre dt instable. 5. Dessiner, dans le plan de phases, l’allure de la courbe C d’équation x2 = ²f (x1 ). Simplifier (4) sur cette courbe. Représenter le vecteur vitesse en tout point de C. 6. Considérer un point A, sur l’axe des x2 , de coordonnées A = (0, α > 0)T . Dessiner ce point et le vecteur vitesse en ce point. 7. La trajectoire issue de A coupe la courbe C en un point noté C. Représenter l’allure de la courbe jusqu’à ce point. Si cette trajectoire rencontre la droite x1 = a, on note B son intersection. 8. En inspectant le vecteur vitesse pour les points de C, montrer que la trajectoire issue de A ne peut pas recouper C avant de couper l’axe des x2 . d x2 9. Montrer que dt est bornée en dehors de C et en déduire que la trajectoire issue de A ne peut dx dt 1 s’échapper vers l’infini et donc coupe nécessairement l’axe des x2 en un point noté E. Si cette trajectoire coupe la droite x1 = a, on note D l’intersection. 10. Noter (0, −β(α))T les coordonnées de E. Expliquer pourquoi l’application α 7→ β(α) est continue. 11. Déduire du point 4 que β(α) > α pour α proche de 0. 12. Considérer le parcours A, B, C, D, E le long de la trajectoire issue de A (on suppose A choisi de sorte que B et D existent). Lorsque α → +∞, la trajectoire “grossit”: les points A, B, C, D, E vont tous vers l’infini, en restant respectivement sur l’axe x2 , la demi-droite x1 = a et x2 > 0, la courbe C, la demi-droite x1 = a et x2 < 0, et l’axe x2 . Le long du parcours AB, montrer que Z a V (B) − V (A) = 0 dV dx1 > 0 dx1 et que limα→∞ V (B) − V (A) = 0. 13. De même, montrer, en notant B = (a, x2b )T , D = (a, x2d )T que Z x2d dV V (D) − V (B) = dx2 < 0 dx 2 x2b et que limα→∞ V (D) − V (B) = −∞. 14. Montrer, de même que Z 0 V (E) − V (D) = a dV dx1 > 0 dx1 et que limα→∞ V (E) − V (D) = 0. 15. Déduire des trois derniers points que, pour α suffisamment grand, on a V (E) < V (A) En déduire que, pour α suffisamment grand, on a β(α) < α 16. Montrer qu’il existe α0 tel que β(α0 ) = α0 . 17. En déduire l’existence d’une trajectoire périodique. 18. Reprendre cette étude sans l’hypothèse que f est impaire. On pourra utiliser le théorème de Poincaré-Bendixon. Corrigé: Une balle qui roule sur une roue qui tourne 1. Boucle ouverte Les points d’équilibre sont de la forme x1 = −3ν̄, x2 = kπ, x3 = −(a + 1)ν̄ avec k entier relatif arbitraire et ν réel arbitraire. Pour k impair, la balle est en bas et donc ces équilibres n’ont pas de sens physique. La famille pertinente d’équilibres correspond à k pair: la balle en haut comme sur la figure, à la verticale q de l’axe de la roue; la roue tourne à une vitesse a+1 constante ν̄ arbitraire. Les pôles sont 0 et ±ω 8a+5 . L’un d’eux est strictement positif, donc tous ces équilibres sont instables. 2. Contrôle en vitesse de la roue (a) Comme q̇1 = x1 +8x3 8a+5 , le système en boucle fermée s’écrit: d x1 = ω 2 sin x2 , dt d a+1 3 x2 = x1 + x3 , dt 8a + 5 8a + 5 µ ¶ d x1 + 8x3 ² x3 = ω v − dt 8a + 5 Il est bien sous la forme standard de Tikhonov d’un système lent/rapide: (x1 , x2 ) est l’état lent; 8ω x3 est l’état rapide; la dynamique rapide est bien asymptotiquement stable (pôle − ²(8a+5) ). Donc on peut faire l’approximation de quasi-stationnarité pour x3 ; la dynamique réduite admet une unique solution. 1 1 +8x3 (b) L’équation de quasi-stationnarité de x3 , v − x8a+5 = 0 donne x3 = (8a+5)v−x . Il suffit de 8 reporter cette valeur de x3 dans les deux équations différentielles sur les états lents x1 et x2 pour avoir le résultat. (c) On trouve λ1 = ω, λ2 = 1, λ = 1 ω et µ = ω. (d) Il s’agit de X1 = X2 = 0: la balle est q à la verticale de l’axe de rotation de la roue et cette dernière est immobile. Les pôles sont ± 18 : l’équilibre est instable. 3. Stabilisation (a) On a X10 = X2 , X20 = X1 + 3V . 8 (b) L’observabilité résulte du calcul suivant X2 = Y, X1 = 8Y 0 − 3V qui donne X1 et X2 en fonction de Y , Y 0 et V . La commandabilité vient du fait que le bouclage 1 statique V = 8U −X met système sous la forme normale de Brunovsky X100 = U avec X1 la 3 sortie de Brunovsky et U le nouveau contrôle. (c) Ses équations sont: X̂1 + 3V + L2 (X̂2 − Y ). 8 µ ¶ 0 1 + L1 Ses pôles sont les valeurs propres de la matrice (A + LC) qui vaut ici . Donc 1 L2 8 on a L1 = −1 − 8ρ1 ρ2 et L2 = ρ1 + ρ2 . X̂10 = X̂2 + L1 (X̂2 − Y ), X̂20 = (d) Comme X2 = X10 , un tel bouclage d’état donne X100 = 3k2 0 1 + 3k1 X + X1 . 8 1 8 Les pôles étant choisis en p1 et p2 , on en déduit que k1 = − 8p1 p32 +1 et k2 = 83 (p1 + p2 ). (e) On a V = k1 X̂1 + k2 X̂2 X̂10 = X̂2 + L1 (X̂2 − Y (t)) X̂20 = X̂1 + 3V + L2 (X̂2 − Y (t)) 8 (f) On fait apparaître une cascade de régulateurs. Le contrôleur agissant sur le modèle réduit utilise l’estimation fournie par l’observateur. 1 (g) Déjà, il faut choisir ² petit, comme par exemple ² = 10 . Il faut choisir maintenant une dynamique en boucle fermée nettement plus lente que celle du régulateur de la vitesse. On garantie cela en choisissant les pôles de l’observateur/contrôleur nettement plus lents que celui du régulateur de vitesse. Comme les pôles ρi et pi sont dans l’échelle de temps τ = ωt, il suffit donc que ces derniers soient à partie réelle négative et de module nettement plus petit que 1/² = 10. Ainsi, on peut prendre par exemple, √ √ √ √ 1 + −1 1 − −1 ρ1 = −(1 + −1), ρ2 = −(1 − −1), p1 = − , p2 = − 2 2 pour avoir un observateur deux fois plus rapide que le contrôleur. Corrigé: mélange en ligne Le problème est très ouvert et de nombreuses solutions sont possibles et acceptables. On donne ici un exemple de réponse. Les équations bilan sur le volume et l’espèce mélangée conduisent à d y1 = u1 + u2 − w dt d (y1 y2 ) = u2 c2 − wy2 dt Après simplification, on obtient y1 d y2 = u2 (c2 − y2 ) + u1 (−y2 ). dt En première approche, on peut remarquer que puisque la concentration du bac 2 est très supérieure à celle du mélange, la recette est très déséquilibrée. Ainsi, autour de l’équilibre on a necessairement u1 >> u2 , y2 << c2 et on peut prendre comme modèle approché d y1 = u1 − w dt d y1 y2 = u2 c2 − u1 y2 dt Pour contrôler la première équation (celle du volume), on peut utiliser un régulateur PI agissant sur u1 avec un certain volume de référence Vref . Ce volume de référence sera choisi, par exemple, à Vmax /2 de sorte qu’on aura toujours du mélange disponible, sans risque de débordement ni d’assèchement dès que le régulateur PI de niveau aura des temps de convergence plus courts que Vmax /wmax : Z 1 1 u1 = Kp (Vref − y1 ) + Ki (Vref − y1 ) avec Kp1 = 2ξ1 ω1 et Ki1 = (ω1 )2 où ω1 > 0 est de l’ordre de wmax /Vmax et ξ1 > 0 autour de 1. Ce choix de gain pourrait être complété par une approche stochastique, si un modèle aléatoire de demande w est disponible. Cette première équation étant asservie, on a y1 ≈ Vref . Sous cette hypothèse, la deuxième équation (concentration) donne d Vref y2 ≈ u2 c2 − u1 y2 dt . C’est déjà un système stable, mais on peut améliorer ses performances en utilisant un autre régulateur PI agissant sur u2 ayant cref > c̄ comme point de consigne et avec le terme de pré-compensation (feedforward) u1 cref /c̄2 : Z cref 2 2 u2 = u1 + Kp (cref − y2 ) + Ki (cref − y2 ) c̄2 avec Vref Vref Kp2 = 2ξ2 ω2 , Ki2 = (ω2 )2 c̄2 c̄2 et où ξ2 est proche de 1 et ω2 > 0. En pratique, l’asservissement garantit la convergence asymptotique de y2 vers cref mais, de manière transitoire, y2 peut être au dessous ou au dessus de cref . On aura tendance à prendre cref le plus proche de c̄ pour limiter au maximum la consommation du liquide 2. Cependant on risque de fabriquer en transitoire un produit hors-spécifications avec c < c̄. Il faudra donc un asservissement réglé assez rapide ce qui peut poser des problèmes de robustesse: on aura sans doute besoin d’un analyseur assez rapide et précis. Néanmoins à cause du terme de pré-compensation cc̄ref u1 il 2 suffit de prendre ω2 assez grand pour compenser les fluctuations lentes de c2 (|ċ2 | ¿ ω2 c2 ). Ainsi, plus la consigne cref sera proche de la limite c̄, plus il faudra une régulation performante. Corrigé: trajectoire périodique 1. Le second membre de l’équation différentielle satisfait les hypothèses du Lemme 2 d’existence (et d’unicité) globale en temps. L’équation d’ordre 2 correspondante est ẍ = −x + ²f (−ẋ). 2. Pour ² = 0, on a un oscillateur pur ẍ = −x. Les trajectoires sont représentées par des cercles dans le plan de phase. 3. d V = −²x1 f (x1 ). dt 4. Dans un voisinage de l’origine, on a par hypothèse f (x1 ) qui est de signe opposé à x1 , d’où la conclusion. Les courbes fermées V = c0 pour c0 << 1 (cercles) sont donc sortantes: les trajectoires qui en sont issues en sortent. Le point 0 est donc instable. A B C C 0 a -a D E 5. Le long de la courbe C, le second membre de l’équation différentielle vaut (0, −x1 ). Les trajectoires pointent verticalement vers le bas ou vers le haut suivant le signe de x1 . 6. Le vecteur tangent est horizontal, il vaut (α, 0). 7. Entre A et C, on a d x1 > 0 et d x2 < 0. On passe d’une tangente horizontale à une tangente dt dt verticale. 8. Le long de C, les trajectoires pointent vers le dessous de la courbe et non le dessus. La trajectoire issue de C ne touche donc pas C avant de recouper l’axe x2 . d x2 9. En dehors de C, la quantité dt = ²f (xx11)−x2 > 0 est bornée. La trajectoire ne peut partir vers dx dt 1 l’infini. Il n’y a pas de point d’équilibre dans cette partie du plan de phases. La trajectoire finit par sortir par le seul côté possible: l’axe x2 . 10. En vertu du théorème 6 de dépendance en la condition initiale, la trajectoire, et donc le point E varie de manière régulière (C 1 ) en fonction de α. α 7→ β(α) est C 1 . 11. Au voisinage de 0 on a, d’après le point 4, d V > 0 le long de la trajectoire. Donc V (A) = α2 /2 < dt β 2 /2 = V (E), d’où la conclusion. Ra 1 f (x1 ) 12. V (B) − V (A) = 0 −²x x2 −²f (x1 ) dx1 . Entre A et B, on a ²x1 f (x1 ) < 0, x2 − ²f (x1 ) > 0, donc V (B) − V (A) > 0. D’autre part, lorsque α → +∞, x2 → +∞ alors que les bornes d’intégration restent inchangées. D’où limα→∞ V (B) − V (A) = 0. Rx 13. V (D) − V (B) = x2b2d ²f (x1 )dx2 . Entre B et D, on a f (x1 ) > 0, alors que x2b > x2d donc V (D) − V (B) < 0. D’autre part, lorsque α → +∞, x1 → +∞, d’où f (x1 ) → +∞ alors que l’intervalle d’intégration croît vers (+∞, −∞). D’où limα→∞ V (D) − V (B) = −∞. 14. Même raisonnement qu’au point 12. 15. On calcule V (E) − V (D) + V (D) − V (B) + V (B) − V (A) comme la somme des trois derniers termes qu’on vient d’étudier. Cette somme devient négative lorsque α → +∞. D’où la conclusion. 16. L’application α 7→ β(α) − α est continue, comme on l’a montré au point 10. Elle est positive proche de 0 et négative lorsque α → +∞. Donc il existe un α0 où elle est nulle. 17. Par symétrie, la trajectoire issue du point E se déduit de celle issue du point A. Si A a été choisi tel que A = (0, α0 ), alors on a E = (0, −α0 ), et ensuite la trajectoire revient en (0, α0 ) = A. C’est une trajectoire périodique. 18. Si f n’est pas impaire, on ne peut pas utiliser la construction précédente. On peut néanmoins construire un ensemble positivement invariant, en utilisant comme frontière des morceaux de trajectoire et des segments de l’axe x2 . Cet ensemble positivement invariant contient un unique point d’équilibre instable, et donc un cycle limite. 0 trajectoire périodique