LE RÉSULTANT (DE SYLVESTER) (version 1.5.1) Soit K un corps, f
Transcription
LE RÉSULTANT (DE SYLVESTER) (version 1.5.1) Soit K un corps, f
LE RÉSULTANT (DE SYLVESTER) PHILIPPE ELBAZ-VINCENT (version 1.5.1) 1. M OTIVATIONS Soit K un corps, f et g des polynômes non nuls de K [T ] (avec T une indéterminée). Posons m = deg( f ) et n = deg(g ). Considérons l’application ϕ assoçiée à f et g , et définie par ϕ : K [T ] × K [T ] → K [T ] (u, v) 7→ u f + v g . On observe que ϕ est une application K -linéaire. Cette application permet d’étudier l’idéal engendré par f et g , qui dans ce cas (puisque K [T ] est principal) est un idéal principal (dont un générateur sera le pgcd de f et g ). En pratique, on peut réduire l’étude aux polynômes u de degré < n et aux polynômes v de degré < m. Posons, pour tout s ∈ N K [T ]s = {P ∈ K [T ], deg(P ) < s} . On peut alors restreindre ϕ à K [T ]n ×K [T ]m et son image sera contenue dans K [T ]m+n . Notons ϕ0 cette application. Nous avons alors les propriétés suivantes : (1) pgcd( f , g ) = 1 si et seulement si ϕ0 est un isomorphisme. (2) Si pgcd( f , g ) = 1, alors il existe une unique solution à l’équation ϕ0 ((u, v)) = 1. On récupère ainsi l’unicité (en tenant compte des contraintes que l’on s’est fixé) des coefficients de l’identité de Bézout. L’aspect important que l’on doit noter est que l’on vient de reformuler la propriété d’être étranger1 en termes d’algèbre linéaire. Maintenant traduisons ces propriétés en termes matricielles pour obtenir des résultat effectifs. On va travailler dans la base (T i , 0), (0, T j ), i < m, j < n, de K [T ]n × K [T ]m et dans la base T i , i < m + n, de K [T ]m+n . Notons Syl( f , g ) la matrice de ϕ0 dans ces bases respectives. Si pgcd( f , g ) = 1 alors det(Syl( f , g )) 6= 0 et de plus l’unique solution de 0 .. Syl( f , g )X = . , 0 1 nous donne les coefficients de Bézout du pgcd. Ce calcul est maintenant ramené a celui d’une élimination de Gauss. On remarque aussi que si f et g ont un facteur commun alors det(Syl( f , g )) = 0. En effet, si d = pgcd( f , g ), nous avons f = d f 1 et g = d g 1 . Si deg(d ) Ê 1, le couple (g 1 , − f 1 ) est dans K [T ]n ×K [T ]m et ϕ0 ((g 1 , − f 1 )) = 0. Donc ϕ0 n’est pas un isomorphisme et de ce fait det(Syl( f , g )) = 0. 1premier entre eux. 1 2 frenchPHILIPPE ELBAZ-VINCENT Cette approche a été développée par Joseph James Sylvester2 dans les années 1851-1853. La matrice Syl( f , g ) est usuellement appelée matrice de Sylvester de f et g et det(Syl( f , g )) le résultant de Sylvester de f et g (en pratique il existe d’autres types de «résultant»). Joseph James Sylvester (1814 - 1897) Nous allons étudier cette approche en toute généralité dans la suite en donnant quelques applications. 2. L E RÉSULTANT ET SES PROPRIÉTÉS Dans ce qui suit R sera un anneau commutatif intègre. Rappelons que cela permet d’une part de parler de polynômes sur R et d’autre part de garantir qu’un polynôme de degré d a au plus d racines3. On désignera par R[T ] l’anneau des polynômes sur R en l’indéterminée T . Définition 2.1. Le résultant de Sylvester Soient f et g deux polynômes de R[T ], avec m = deg( f ) et n = deg(g ). Nous posons Res( f , g ) = det(Syl( f , g )), où Syl( f , g ) est la matrice du morphisme de R-modules libres ϕ0 : R[T ]n × R[T ]m → R[T ]m+n (u, v) 7→ u f + v g , dans les bases (T i , 0), (0, T j ), i < m, j < n, de R[T ]n × R[T ]m et T i , i < m + n, de R[T ]m+n , et R[T ]s = {P ∈ R[T ], deg(P ) < s} . On appelle Res( f , g ) le résultant (de Sylvester) de f et g , et Syl( f , g ) la matrice de Sylvester de f et g . Si m = n = 0 on pose Res( f , g ) = 0. 2cf. http://www-groups.ds.st-and.a.uk/~history/Biographies/Sylvester.html 3Dans un anneau non intègre, on peut avoir des polynômes avec un nombre de racines supérieur au degré du polynôme. Si l’anneau est infini, on peut avoir des polynômes avec une infinité de racines. frenchLE RÉSULTANT (DE SYLVESTER) 3 Remarque 2.2. Comme pour le pgcd, du fait de sa construction, le résultant ne dépends que des polynômes f et g et du plus petit anneau contenant les coefficients des polynômes (ce que l’on appelle l’anneau de définition des polynômes f et g ). En particulier si les polynômes f et g sont définis sur Q, regarder le résultant de f et g en tant que polynômes sur Q ou en tant que polynômes sur C ne fait aucun différence. Le résultant est essentiellement intrinsèque aux polynômes f et g . C’est donc un objet de nature géométrique. On peut en fait caractériser le résultant de la manière suivante (preuve laissée en exercice). Proposition 2.3. Pour tout polynômes f , g de R[T ], il existe un unique élément Res( f , g ) ∈ R, tel que : (1) Res(g , f ) = (−1)deg( f ) deg(g ) Res( f , g ), (2) si 0 < deg( f ) É deg(g ) et si r est le reste de la division euclidienne de LC ( f )g par f , alors Res( f , g ) = LC ( f )(deg(g )−deg(r )−deg( f )) Res( f , r ) , (3) si g = a ∈ R, alors Res( f , a) = a deg( f ) . Remarque 2.4. Le fait de regarder le reste de la division euclidienne de LC ( f )g par f est pour garantir que le reste (ainsi que le quotient) sera bien dans R[T ]. Cela est toujours le cas si f est unitaire. Dans le cas où R est un corps, on peut prendre directement le reste de la division euclidienne de g par f , mais dans ce dernier cas, l’exposant de LC ( f ) sera deg(g )−deg(r ). En fait, si on effectue la division euclidienne dans F r ac(R)[T ], nous avons Res( f , g ) = LC ( f )(deg(g )−deg(r )) Res( f , r ) . Mais comme nous avons (exercice) Res( f , LC ( f )g ) = LC ( f )deg( f ) Res( f , g ) , nous en déduisons l’expression 2. Notons que cette caractérisation du résultant fournit aussi un algorithme (que l’on écrira en exercice) efficace pour son calcul. On ne s’aventurera pas à calculer le résultant via un calcul de déterminant surtout si les degrés sont élevés. Pour la preuve, on utilise le lemme pratique suivant que l’on peut démontrer directement. Lemme 2.5. Soient f et g deux polynômes de R[T ]. Alors pour tout a, b ∈ R, nous avons Res(a f , bg ) = a deg(g ) b deg( f ) Res( f , g ) . Nous pouvons donner une forme explicite du résultant lorsque les polynômes sont donnés comme des produits de polynômes de degré 1. Qn Q Proposition 2.6. Soient f = a m i =1 (T − αi ) et g = b i =1 (T − βi ) avec a, b ∈ R. Alors nous avons les expressions suivantes du résultant de f et g : Y Res( f , g ) = a n b m (αi − β j ) , i,j =a n Y g (αi ) , i Y deg( f ) deg(g ) m = (−1) b i f (βi ) . 4 frenchPHILIPPE ELBAZ-VINCENT Remarque 2.7. Quitte a regarder les polynômes dans une clotûre algébrique de F r ac(R), on peut toujours se ramener à de telles expressions. Néanmoins le coût du calcul des racines (et de l’extension algébrique pour trouver ces racines) rend cette approche peu effective. Comme on le verra, ces formules peuvent s’avérer pratique pour démontrer certaines propriétés du résultant. Nous allons montrer que le résultant est toujours dans l’idéal engendré par f et g . Proposition 2.8. Soient f et g deux polynômes non nuls de R[T ]. Il existe des polynômes u et v de R[T ] tels que : deg(u) < deg(g ), deg(v) < deg( f ) et u f + v g = Res( f , g ) . Démonstration. Nous allons donner une esquisse de preuve et laissons les détails aux lecteurs. L’idée est de faire une preuve par récurrence sur d f ,g = deg( f ) + deg(g ) et d’utiliser la caractérisation du résultant donnée en 2.3. Si d f ,g = 0 la propriété est immédiate, on a u = v = 0. Supposons la propriété vraie jusqu’a une certain entier d . Montrons que l’on a encore la propriété pour d f ,g = d + 1. Quitte a permuter f et g via la symétrie (cf. 2.3 (1)), on peut supposer que deg( f ) É deg(g ). Si deg( f ) = 0, alors par 2.3 (3), on a Res( f , g ) = ±a deg(g ) , il suffit de prendre u = ±a deg(g )−1 et v = 0 (et ce couple est unique). Si deg( f ) > 0, par division euclidienne nous avons LC ( f )g = q f + r , avec deg(q) = deg(g ) − deg( f ) et deg(r ) < deg( f ). Le couple (q, r ) est unique (car il est unique dans F r ac(R)[T ] et R[T ] est un sous-anneau de F r ac(R)[T ]). Par 2.3 (2), nous avons Res( f , g ) = LC ( f )(deg(g )−deg(r )−deg( f )) Res( f , r ) , et maintenant d f ,r < d +1. Il existe donc des polynômes u ′ et v ′ de R[T ] tels que : deg(u ′ ) < deg(r ), deg(v ′ ) < deg( f ) et Mais r = LC ( f )g − q f . Il s’ensuit que u ′ f + v ′ r = Res( f , r ) . u ′ f + v ′ r = u ′ f + v ′ (LC ( f )g − q f ) , = (u ′ − LC ( f )v ′ q) f + (LC ( f )v ′ )g = Res( f , r ) . Nous avons deg(v ′ q) = deg(v ′ ) + deg(q) < deg(g ), puisque deg(v ′ ) < deg( f ) et aussi deg(LC ( f )v ′ ) < deg( f ). Comme deg(u ′ ) < deg(r ) < deg( f ) É deg(g ), on en conclut que deg(u ′ −LC ( f )v ′ q) < deg(g ). Finalement, en posant u = LC ( f )(deg(g )−deg(r )−deg( f )) (u ′ −LC ( f )v ′ q) et v = LC ( f )(deg(g )−deg(r )−deg( f )+1) v ′ , nous avons deg(u) < deg(g ), deg(u) < deg( f ) et u f + v g = Res( f , g ) . On voit que le résultant généralise la notion de pgcd. En pratique, on peut utiliser le résultant pour calculer le pgcd de polynômes, comme on le verra plus loin. Le résultant détecte aussi la présence d’un facteur commun. Proposition 2.9. Si R est factoriel et si f et g sont des polynômes non constants de R[T ]. Alors f et g ont un facteur commun de degré Ê 1 si et seulement si Res( f , g ) = 0. frenchLE RÉSULTANT (DE SYLVESTER) 5 Démonstration. Pour la première partie de la preuve, on peut appliquer les arguments vu à la fin de la section 1. On peut aussi le démontre de la manière suivante ; Si f et g ont un facteur commun dans R[T ] alors ils ont aussi un facteur commun dans F r ac(R)[T ] avec F r ac(R) une clotûre algébrique de F r ac(R), et par suite ils ont au moins une racine commune. Par 2.6, on déduit que Res( f , g ) = 0. Réciproquement, supposons que Res( f , g ) = 0. Par 2.8, il existe des polynômes u et v de R[T ] tels que : deg(u) < deg(g ), deg(v) < deg( f ) et u f + vg = 0. Puisque R est factoriel, il en est de même de R[T ], et de ce fait on a le «lemme de Gauss» dans R[T ]. Si P est un facteur irréductible de f , alors il divise le produit v g , si P ne divise pas g , alors il divise v. Si f et g n’avaient pas de facteur commun, en itérant le raisonnement précédent on en déduirait que f divise v, ce qui entraînerait deg( f ) Ê deg(v) et contredirait les hypothèses. Donc Res( f , g ) = 0 entraîne que f et g ont un facteur commun. Remarque 2.10. On peut observer que l’on a seulement besoin de l’hypothèse de factorialité pour démontrer que Res( f , g ) = 0 entraîne que f et g ont un facteur commun. Si f et g ont un facteur commun et R est arbitraire, alors Res( f , g ) = 0. On peut reformuler ce résultat dans le cas particulier d’un corps algébriquement clos. Corollaire 2.11. Si K est un corps algébriquement clos. Alors f , g ∈ K [T ] ont une racine commune dans K si et seulement si Res( f , g ) = 0. Cela motive l’utilisation du résultant pour l’étude des racines d’un polynôme. C’est ainsi que l’on définit le discriminant d’un polynôme, dans le but de discriminer les racines. Définition 2.12. «Discriminant d’un polynôme» Soit f un polynôme non nul de R[T ]. On définit le discriminant de f , noté Disc( f ), comme étant la quantité df 1 Res( f , ), Disc( f ) = LC ( f ) dT où d dT est la dérivation formelle relativement à T de R[T ]. Si f = 0, on pose Disc( f ) = 0. Remarque 2.13. Comme pour le résultant, le discriminant ne dépends que de f et du plus petit anneau contenant ses coefficients. Nous avons alors les propriétés suivantes du discriminant. Proposition 2.14. Soit f un polynôme de R[T ], de degré n et soit α1 , . . . , αn ses racines (non nécessairement distinctes) dans une clotûre algébrique de F r ac(R). Alors : (1) Disc( f ) ∈ R, (2) Disc( f ) = LC ( f )2n−2 n Y n Y i =1 j =1, j 6=i (αi − α j ). Exemple(s) 2.15. Calculer le discriminant du polynôme aT 2 + bT + c. Un cas particulier d’application de la Proposition 2.9 sera le cas où R est un anneau de polynômes à plusieurs indéterminées sur un corps K . En effet, si f et g sont des polynômes non constants de K [T1, . . . , T s ], on notera ResTi ( f , g ) le résultant de f et g en Ti . Dans ce cas R = K [T1 , . . . , Tˆi , . . . , T s ] avec Tˆi signifiant que l’on a enlevé l’indéterminée Ti . On en déduit que ResTi ( f , g ) = 0 6 frenchPHILIPPE ELBAZ-VINCENT si et seulement si f et g ont un facteur commun non constant en Ti . En particulier, si f et g sont des polynômes de deux indéterminées x, y, et que l’on souhaite résoudre le système ( f =0 g = 0, il suffira de trouver les solutions de ( Resx ( f , g ) = 0 Res y ( f , g ) = 0 , qui sont maintenant des équations à une indéterminée, et de tester les solutions dans le système de départ. On peut généraliser cela à plusieurs indéterminées, ce qui nous donne un problème de relèvement, similaire à celui que l’on a vue pour l’élimination. Théorème 2.16. «Relévement des solutions pour deux polynômes» Soit K un corps algébriquement clos. Soient f et g deux polynômes de K [T1, . . . , T s ] non constants en T1 . Notons a ∈ K [T2 , . . . , T s ] (resp. b ∈ K [T2 , . . . , T s ]) le terme dominant de f (resp. g ) comme polynôme en T1 . Soit (α2 , . . . , αs ) ∈ K s−1 tel que ResT1 ( f , g )(α2 , . . . , αs ) = 0 , et supposons de plus que a(α2, . . . , αs ) 6= 0 ou b(α2 , . . . , αs ) 6= 0. Alors il existe α1 ∈ K tel que f (α1 , α2 , . . . , αs ) = 0 et g (α1 , α2 , . . . , αs ) = 0. A partir de ce résultat on peut faire le cas d’une famille finie de polynôme. On a ainsi une stratégie de calcul des solutions d’un système d’équations via le résultant (ce n’est pas nécessairement ce qu’il y a de plus efficace dans le cas de plusieurs polynômes et indéterminées). Soient f 1 , . . . , f ℓ des polynômes de K [T1, . . . , T s ] et pour simplifier nous supposerons K algébriquement clos. Notons S les solutions dans K du système d’équations f =0 1 .. . fℓ = 0 . En calculant les résultants successifs relativement aux différentes indéterminées, on se ramène a déterminer un ensemble de points S ′ de K s , obtenu en résolvant une multitude d’équations à une indéterminée. Le «théorème de relèvement» nous dit que S ⊂ S ′. En particulier si S ′ est fini, pour déterminer S il suffit de trouver les points de S ′ qui vérifient le système d’équations. La Proposition 2.9 peut aussi s’appliquer dans un contexte modulaire, en cherchant des facteurs communs dans un anneau quotient de R. Pour cela on utilise le résultat suivant Proposition 2.17. Soient f et g deux polynômes de R[T ] et I un idéal de R. Notons par P l’image de P ∈ R[T ] dans R/I [T ]. Supposons que deg( f ) = deg( f ) (i.e., f a bonne réduction modulo I ). Alors Res( f , g ) = 0 si et seulement si Res( f , g ) = 0 . De plus, si R/I est factoriel, alors Res( f , g ) = 0 si et seulement si f et g ont un facteur commun (non constant). Un cas particulier est R = Z avec I = (p), p étant premier. Dans ce cas la proposition précédente dit que p divise Res( f , g ) si et seulement si f et g ont un facteur commun dans Z/p Z[T ]. frenchLE RÉSULTANT (DE SYLVESTER) 7 Exemple(s) 2.18. (1) Déterminer les équations des projections sur les plans de coordonnées de l’intersection du cône x 2 + y 2 = z/2 et du cylindre (y − 1)2 + (z + 4)2 = 1. Déterminer leur intersection. (2) Déterminer les équations des projections sur les plans de coordonnées des deux surfaces S 2 = {(x, y, z) ∈ R3 , x 2 + y 2 +z 2 = 1} et et celle d’équation x 2 y 2 + y 2 z 2 +z 2 x 2 = 2x y z. Factoriser les équations obtenues, en déduire l’intersection. Peut-on obtenir l’intersection plus directement ? (3) Sans déterminer leurs zéros ni les factoriser, dire si les polynômes (sur Q) suivants ont des racines multiples : P 1 = x 144 + x 16 + 3x 134 + 3x 6 − 4x 141 − 4x 13 − 12x 131 − 12x 3 + 4x 138 + 4x 10 + 12x 128 + 12, P 2 = x 11 − 12x 10 + 55x 9 − 115x 8 + 76x 7 + 150x 6 − 404x 5 + 290x 4 + 75x 3 + 162x 2 + 459x + 405. Est-ce que les polynômes T 5 −3T 4 −2T 3 +3T 2 +7T +6 et T 4 +T 2 +1 ont un facteur commun sur Q ? sur des extensions de Q ? (4) Soit la conique C (x, y) = 2x 2 + x y + 4y 2 − 1 et la conique paramétrée par a ∈ Q, C a (x, y) = −2x 2 + 3x y + a y 2 − 1, que l’on regardera comme polynômes dans Q[x, y]. On s’intéresse à l’ensemble Z a = {(α, β) ∈ Q, C (α, β) = 0 et C a (α, β) = 0}. Calculer Resx (C ,C a ) et Res y (C ,C a ). En tant que polynômes à une variable sont-ils identiques ? Tracez les ensembles C (x, y) = 0 et C a (x, y) = 0 pour a = 2, 3, 4, 5 (On précisera le domaine de traçage choisit). Donnez une estimation de Z a dans chacun des cas. Déterminez Z a à l’aide du résultant et comparez avec ce que vous avez obtenus précédemment (on essayera dans la mesure du possible de trouver les solutions en fonction du paramètre a). (5) Soit C le cylindre de R3 d’équation (x − 12 )2 + y 2 = 41 et S la sphère de R3 . On s’intérèsse à l’ensemble T = C ∩ S. Vérifier que T 6= ; et qu’en fait le cylindre est «à l’intérieur de la sphére» avec un point tangent à la sphère que l’on déterminera. A quoi ressemble T ? 3. U N EXEMPLE 2 DÉTAILLÉ Considérons les deux polynômes f (x, y) = (y + 6)(x − 1) − y(x 2 + 1) et g (x, y) = (x 2 + 6)(y − 1) − x(y 2 + 1). On remarque que l’on a f (x, y) = g (y, x). Notons Z f (resp. Z g ) l’ensemble des zéros de f (resp. g ) que l’on regardera dans le plan réel (ou complexe). Commencons par tracer ces deux courbes dans la portion où elles s’intersectent, un peu d’essai et d’erreur, nous suggère de regarder dans le cadran (x, y) ∈ [0, 5]2 . 8 frenchPHILIPPE ELBAZ-VINCENT On observe qu’il y a 4 points d’intersections, en étant plus attentifs on remarque qu’ils sont circonscrits (et nous allons chercher l’équation de ce cercle). Nous allons maintenant étudier l’aspect algébrique en calculant le résultant respectivement aux différentes variables. Du fait de la symétrie de f et g , ces résultants sont symétriques par rapport à ces variables. En effet on a Resx ( f , g ) = 2y 6 − 22y 5 + 102y 4 − 274y 3 + 488y 2 − 552y + 288 , et on vérifiera que Res y ( f , g ) est le même polynôme où l’on a remplacé y par x (on laisse au lecteur le soin de vérifier que c’est toujours le cas lorsque l’on a des polynômes symétriques). Déterminons p les racines de ce polynôme, nous obtenons y = 2, y = 3 et y = 1+i2 15 . Vérifions que les points d’intersections sont bien circonscrits. Considérons un cercle C d’équation C = (x − a)2 + (y − b)2 − c , et tel que C passent par les points d’intersections de Z f et Z g . En imposant que C passe par (x, y) = (2, 2), (3, 3), (2, 3), nous trouvons b= 5 , 2 a= 5 1 ,c = . 2 2 On peut vérifier que le quatrième point est bien sur le cercle frenchLE RÉSULTANT (DE SYLVESTER) 9 4. É PILOGUE Bien que le résultant soit un outil intéressant, quel que soit l’algorithme utilisé ce sera un objet «assez gros» (sauf bien sur dans le cas où les coefficients sont dans un corps fini, du fait que la taille des coefficients est «fixe»). On peut préciser cette «taille» dans le cas R = Z. Soient f et g des polynômes non nuls de Z[T ]. Notons par ||·||∞ le maximum des valeurs absolues des coefficients d’un polynôme de Z[T ]. Alors nous avons la borne suivante pour Res( f , g ) : |Res( f , g )| É (deg( f ) + 1) deg(g ) 2 (deg(g ) + 1) deg( f ) 2 deg(g ) || f ||∞ deg( f ) ||g ||∞ . On pourra vérifier (exercice) qu’en pratique le résultant est souvent de cet ordre de grandeur. Un autre défaut du résultant de Sylvester est qu’il ne tient pas suffisamment compte de propriétés spécifiques des polynômes (homogénéité, symétrie spécifique) et qu’il est assez inadapté dans le cas des polynômes creux (i.e., avec très peu, moins de 10% voir moins de 1%, de coefficients non nuls). C’est pour cela qu’ont été développés durant le XXe siècle de nouvelles familles de résultants (ou des améliorations des anciens résultants) plus performants du point de vue des calculs et mieux adaptés aux propriétés de certaines familles de polynômes.