LE RÉSULTANT (DE SYLVESTER) (version 1.5.1) Soit K un corps, f

Transcription

LE RÉSULTANT (DE SYLVESTER) (version 1.5.1) Soit K un corps, f
LE RÉSULTANT (DE SYLVESTER)
PHILIPPE ELBAZ-VINCENT
(version 1.5.1)
1. M OTIVATIONS
Soit K un corps, f et g des polynômes non nuls de K [T ] (avec T une indéterminée). Posons
m = deg( f ) et n = deg(g ). Considérons l’application ϕ assoçiée à f et g , et définie par
ϕ : K [T ] × K [T ] → K [T ]
(u, v) 7→ u f + v g .
On observe que ϕ est une application K -linéaire. Cette application permet d’étudier l’idéal engendré par f et g , qui dans ce cas (puisque K [T ] est principal) est un idéal principal (dont un
générateur sera le pgcd de f et g ).
En pratique, on peut réduire l’étude aux polynômes u de degré < n et aux polynômes v de degré
< m. Posons, pour tout s ∈ N
K [T ]s = {P ∈ K [T ], deg(P ) < s} .
On peut alors restreindre ϕ à K [T ]n ×K [T ]m et son image sera contenue dans K [T ]m+n . Notons ϕ0
cette application. Nous avons alors les propriétés suivantes :
(1) pgcd( f , g ) = 1 si et seulement si ϕ0 est un isomorphisme.
(2) Si pgcd( f , g ) = 1, alors il existe une unique solution à l’équation ϕ0 ((u, v)) = 1.
On récupère ainsi l’unicité (en tenant compte des contraintes que l’on s’est fixé) des coefficients
de l’identité de Bézout.
L’aspect important que l’on doit noter est que l’on vient de reformuler la propriété d’être étranger1
en termes d’algèbre linéaire.
Maintenant traduisons ces propriétés en termes matricielles pour obtenir des résultat effectifs.
On va travailler dans la base (T i , 0), (0, T j ), i < m, j < n, de K [T ]n × K [T ]m et dans la base T i ,
i < m + n, de K [T ]m+n .
Notons Syl( f , g ) la matrice de ϕ0 dans ces bases respectives. Si pgcd( f , g ) = 1 alors det(Syl( f , g )) 6= 0
et de plus l’unique solution de
 
0
 .. 
 
Syl( f , g )X =  .  ,
0
1
nous donne les coefficients de Bézout du pgcd. Ce calcul est maintenant ramené a celui d’une élimination de Gauss. On remarque aussi que si f et g ont un facteur commun alors det(Syl( f , g )) = 0.
En effet, si d = pgcd( f , g ), nous avons f = d f 1 et g = d g 1 . Si deg(d ) Ê 1, le couple (g 1 , − f 1 ) est dans
K [T ]n ×K [T ]m et ϕ0 ((g 1 , − f 1 )) = 0. Donc ϕ0 n’est pas un isomorphisme et de ce fait det(Syl( f , g )) =
0.
1premier entre eux.
1
2
frenchPHILIPPE ELBAZ-VINCENT
Cette approche a été développée par Joseph James Sylvester2 dans les années 1851-1853. La matrice Syl( f , g ) est usuellement appelée matrice de Sylvester de f et g et det(Syl( f , g )) le résultant de
Sylvester de f et g (en pratique il existe d’autres types de «résultant»).
Joseph James Sylvester (1814 - 1897)
Nous allons étudier cette approche en toute généralité dans la suite en donnant quelques applications.
2. L E RÉSULTANT
ET SES PROPRIÉTÉS
Dans ce qui suit R sera un anneau commutatif intègre. Rappelons que cela permet d’une part
de parler de polynômes sur R et d’autre part de garantir qu’un polynôme de degré d a au plus d
racines3. On désignera par R[T ] l’anneau des polynômes sur R en l’indéterminée T .
Définition 2.1. Le résultant de Sylvester
Soient f et g deux polynômes de R[T ], avec m = deg( f ) et n = deg(g ). Nous posons Res( f , g ) =
det(Syl( f , g )), où Syl( f , g ) est la matrice du morphisme de R-modules libres
ϕ0 : R[T ]n × R[T ]m → R[T ]m+n
(u, v) 7→ u f + v g ,
dans les bases (T i , 0), (0, T j ), i < m, j < n, de R[T ]n × R[T ]m et T i , i < m + n, de R[T ]m+n , et
R[T ]s = {P ∈ R[T ], deg(P ) < s} .
On appelle Res( f , g ) le résultant (de Sylvester) de f et g , et Syl( f , g ) la matrice de Sylvester de f et g .
Si m = n = 0 on pose Res( f , g ) = 0.
2cf. http://www-groups.ds.st-and.a.uk/~history/Biographies/Sylvester.html
3Dans un anneau non intègre, on peut avoir des polynômes avec un nombre de racines supérieur au degré du polynôme. Si l’anneau est infini, on peut avoir des polynômes avec une infinité de racines.
frenchLE RÉSULTANT (DE SYLVESTER)
3
Remarque 2.2. Comme pour le pgcd, du fait de sa construction, le résultant ne dépends que des
polynômes f et g et du plus petit anneau contenant les coefficients des polynômes (ce que l’on
appelle l’anneau de définition des polynômes f et g ). En particulier si les polynômes f et g sont
définis sur Q, regarder le résultant de f et g en tant que polynômes sur Q ou en tant que polynômes
sur C ne fait aucun différence. Le résultant est essentiellement intrinsèque aux polynômes f et g .
C’est donc un objet de nature géométrique.
On peut en fait caractériser le résultant de la manière suivante (preuve laissée en exercice).
Proposition 2.3. Pour tout polynômes f , g de R[T ], il existe un unique élément Res( f , g ) ∈ R, tel
que :
(1) Res(g , f ) = (−1)deg( f ) deg(g ) Res( f , g ),
(2) si 0 < deg( f ) É deg(g ) et si r est le reste de la division euclidienne de LC ( f )g par f , alors
Res( f , g ) = LC ( f )(deg(g )−deg(r )−deg( f )) Res( f , r ) ,
(3) si g = a ∈ R, alors Res( f , a) = a deg( f ) .
Remarque 2.4. Le fait de regarder le reste de la division euclidienne de LC ( f )g par f est pour
garantir que le reste (ainsi que le quotient) sera bien dans R[T ]. Cela est toujours le cas si f est unitaire. Dans le cas où R est un corps, on peut prendre directement le reste de la division euclidienne
de g par f , mais dans ce dernier cas, l’exposant de LC ( f ) sera deg(g )−deg(r ). En fait, si on effectue
la division euclidienne dans F r ac(R)[T ], nous avons
Res( f , g ) = LC ( f )(deg(g )−deg(r )) Res( f , r ) .
Mais comme nous avons (exercice)
Res( f , LC ( f )g ) = LC ( f )deg( f ) Res( f , g ) ,
nous en déduisons l’expression 2.
Notons que cette caractérisation du résultant fournit aussi un algorithme (que l’on écrira en exercice) efficace pour son calcul. On ne s’aventurera pas à calculer le résultant via un calcul de déterminant surtout si les degrés sont élevés.
Pour la preuve, on utilise le lemme pratique suivant que l’on peut démontrer directement.
Lemme 2.5. Soient f et g deux polynômes de R[T ]. Alors pour tout a, b ∈ R, nous avons
Res(a f , bg ) = a deg(g ) b deg( f ) Res( f , g ) .
Nous pouvons donner une forme explicite du résultant lorsque les polynômes sont donnés
comme des produits de polynômes de degré 1.
Qn
Q
Proposition 2.6. Soient f = a m
i =1 (T − αi ) et g = b i =1 (T − βi ) avec a, b ∈ R. Alors nous avons les
expressions suivantes du résultant de f et g :
Y
Res( f , g ) = a n b m (αi − β j ) ,
i,j
=a
n
Y
g (αi ) ,
i
Y
deg( f ) deg(g ) m
= (−1)
b
i
f (βi ) .
4
frenchPHILIPPE ELBAZ-VINCENT
Remarque 2.7. Quitte a regarder les polynômes dans une clotûre algébrique de F r ac(R), on peut
toujours se ramener à de telles expressions. Néanmoins le coût du calcul des racines (et de l’extension algébrique pour trouver ces racines) rend cette approche peu effective. Comme on le verra,
ces formules peuvent s’avérer pratique pour démontrer certaines propriétés du résultant.
Nous allons montrer que le résultant est toujours dans l’idéal engendré par f et g .
Proposition 2.8. Soient f et g deux polynômes non nuls de R[T ]. Il existe des polynômes u et v de
R[T ] tels que : deg(u) < deg(g ), deg(v) < deg( f ) et
u f + v g = Res( f , g ) .
Démonstration. Nous allons donner une esquisse de preuve et laissons les détails aux lecteurs.
L’idée est de faire une preuve par récurrence sur d f ,g = deg( f ) + deg(g ) et d’utiliser la caractérisation du résultant donnée en 2.3. Si d f ,g = 0 la propriété est immédiate, on a u = v = 0. Supposons la propriété vraie jusqu’a une certain entier d . Montrons que l’on a encore la propriété pour
d f ,g = d + 1.
Quitte a permuter f et g via la symétrie (cf. 2.3 (1)), on peut supposer que deg( f ) É deg(g ). Si
deg( f ) = 0, alors par 2.3 (3), on a Res( f , g ) = ±a deg(g ) , il suffit de prendre u = ±a deg(g )−1 et v = 0 (et
ce couple est unique). Si deg( f ) > 0, par division euclidienne nous avons
LC ( f )g = q f + r ,
avec deg(q) = deg(g ) − deg( f ) et deg(r ) < deg( f ). Le couple (q, r ) est unique (car il est unique dans
F r ac(R)[T ] et R[T ] est un sous-anneau de F r ac(R)[T ]). Par 2.3 (2), nous avons
Res( f , g ) = LC ( f )(deg(g )−deg(r )−deg( f )) Res( f , r ) ,
et maintenant d f ,r < d +1. Il existe donc des polynômes u ′ et v ′ de R[T ] tels que : deg(u ′ ) < deg(r ),
deg(v ′ ) < deg( f ) et
Mais r = LC ( f )g − q f . Il s’ensuit que
u ′ f + v ′ r = Res( f , r ) .
u ′ f + v ′ r = u ′ f + v ′ (LC ( f )g − q f ) ,
= (u ′ − LC ( f )v ′ q) f + (LC ( f )v ′ )g = Res( f , r ) .
Nous avons deg(v ′ q) = deg(v ′ ) + deg(q) < deg(g ), puisque deg(v ′ ) < deg( f ) et aussi deg(LC ( f )v ′ ) <
deg( f ). Comme deg(u ′ ) < deg(r ) < deg( f ) É deg(g ), on en conclut que deg(u ′ −LC ( f )v ′ q) < deg(g ).
Finalement, en posant u = LC ( f )(deg(g )−deg(r )−deg( f )) (u ′ −LC ( f )v ′ q) et v = LC ( f )(deg(g )−deg(r )−deg( f )+1) v ′ ,
nous avons deg(u) < deg(g ), deg(u) < deg( f ) et
u f + v g = Res( f , g ) .
On voit que le résultant généralise la notion de pgcd. En pratique, on peut utiliser le résultant
pour calculer le pgcd de polynômes, comme on le verra plus loin. Le résultant détecte aussi la
présence d’un facteur commun.
Proposition 2.9. Si R est factoriel et si f et g sont des polynômes non constants de R[T ]. Alors f et g
ont un facteur commun de degré Ê 1 si et seulement si Res( f , g ) = 0.
frenchLE RÉSULTANT (DE SYLVESTER)
5
Démonstration. Pour la première partie de la preuve, on peut appliquer les arguments vu à la fin
de la section 1. On peut aussi le démontre de la manière suivante ; Si f et g ont un facteur commun dans R[T ] alors ils ont aussi un facteur commun dans F r ac(R)[T ] avec F r ac(R) une clotûre
algébrique de F r ac(R), et par suite ils ont au moins une racine commune. Par 2.6, on déduit que
Res( f , g ) = 0. Réciproquement, supposons que Res( f , g ) = 0. Par 2.8, il existe des polynômes u et v
de R[T ] tels que : deg(u) < deg(g ), deg(v) < deg( f ) et
u f + vg = 0.
Puisque R est factoriel, il en est de même de R[T ], et de ce fait on a le «lemme de Gauss» dans
R[T ]. Si P est un facteur irréductible de f , alors il divise le produit v g , si P ne divise pas g , alors
il divise v. Si f et g n’avaient pas de facteur commun, en itérant le raisonnement précédent on en
déduirait que f divise v, ce qui entraînerait deg( f ) Ê deg(v) et contredirait les hypothèses. Donc
Res( f , g ) = 0 entraîne que f et g ont un facteur commun.
Remarque 2.10. On peut observer que l’on a seulement besoin de l’hypothèse de factorialité pour
démontrer que Res( f , g ) = 0 entraîne que f et g ont un facteur commun. Si f et g ont un facteur
commun et R est arbitraire, alors Res( f , g ) = 0.
On peut reformuler ce résultat dans le cas particulier d’un corps algébriquement clos.
Corollaire 2.11. Si K est un corps algébriquement clos. Alors f , g ∈ K [T ] ont une racine commune
dans K si et seulement si Res( f , g ) = 0.
Cela motive l’utilisation du résultant pour l’étude des racines d’un polynôme. C’est ainsi que
l’on définit le discriminant d’un polynôme, dans le but de discriminer les racines.
Définition 2.12. «Discriminant d’un polynôme»
Soit f un polynôme non nul de R[T ]. On définit le discriminant de f , noté Disc( f ), comme étant la
quantité
df
1
Res( f ,
),
Disc( f ) =
LC ( f )
dT
où
d
dT
est la dérivation formelle relativement à T de R[T ]. Si f = 0, on pose Disc( f ) = 0.
Remarque 2.13. Comme pour le résultant, le discriminant ne dépends que de f et du plus petit
anneau contenant ses coefficients.
Nous avons alors les propriétés suivantes du discriminant.
Proposition 2.14. Soit f un polynôme de R[T ], de degré n et soit α1 , . . . , αn ses racines (non nécessairement distinctes) dans une clotûre algébrique de F r ac(R). Alors :
(1) Disc( f ) ∈ R,
(2) Disc( f ) = LC ( f )2n−2
n
Y
n
Y
i =1 j =1, j 6=i
(αi − α j ).
Exemple(s) 2.15. Calculer le discriminant du polynôme aT 2 + bT + c.
Un cas particulier d’application de la Proposition 2.9 sera le cas où R est un anneau de polynômes à plusieurs indéterminées sur un corps K . En effet, si f et g sont des polynômes non
constants de K [T1, . . . , T s ], on notera ResTi ( f , g ) le résultant de f et g en Ti . Dans ce cas R =
K [T1 , . . . , Tˆi , . . . , T s ] avec Tˆi signifiant que l’on a enlevé l’indéterminée Ti . On en déduit que
ResTi ( f , g ) = 0
6
frenchPHILIPPE ELBAZ-VINCENT
si et seulement si f et g ont un facteur commun non constant en Ti . En particulier, si f et g sont
des polynômes de deux indéterminées x, y, et que l’on souhaite résoudre le système
(
f =0
g = 0,
il suffira de trouver les solutions de
(
Resx ( f , g ) = 0
Res y ( f , g ) = 0 ,
qui sont maintenant des équations à une indéterminée, et de tester les solutions dans le système
de départ. On peut généraliser cela à plusieurs indéterminées, ce qui nous donne un problème de
relèvement, similaire à celui que l’on a vue pour l’élimination.
Théorème 2.16. «Relévement des solutions pour deux polynômes»
Soit K un corps algébriquement clos. Soient f et g deux polynômes de K [T1, . . . , T s ] non constants
en T1 . Notons a ∈ K [T2 , . . . , T s ] (resp. b ∈ K [T2 , . . . , T s ]) le terme dominant de f (resp. g ) comme polynôme en T1 . Soit (α2 , . . . , αs ) ∈ K s−1 tel que
ResT1 ( f , g )(α2 , . . . , αs ) = 0 ,
et supposons de plus que a(α2, . . . , αs ) 6= 0 ou b(α2 , . . . , αs ) 6= 0. Alors il existe α1 ∈ K tel que f (α1 , α2 , . . . , αs ) =
0 et g (α1 , α2 , . . . , αs ) = 0.
A partir de ce résultat on peut faire le cas d’une famille finie de polynôme. On a ainsi une stratégie de calcul des solutions d’un système d’équations via le résultant (ce n’est pas nécessairement ce
qu’il y a de plus efficace dans le cas de plusieurs polynômes et indéterminées). Soient f 1 , . . . , f ℓ des
polynômes de K [T1, . . . , T s ] et pour simplifier nous supposerons K algébriquement clos. Notons S
les solutions dans K du système d’équations


f =0

 1
..
.



fℓ = 0 .
En calculant les résultants successifs relativement aux différentes indéterminées, on se ramène a
déterminer un ensemble de points S ′ de K s , obtenu en résolvant une multitude d’équations à une
indéterminée. Le «théorème de relèvement» nous dit que S ⊂ S ′. En particulier si S ′ est fini, pour
déterminer S il suffit de trouver les points de S ′ qui vérifient le système d’équations.
La Proposition 2.9 peut aussi s’appliquer dans un contexte modulaire, en cherchant des facteurs
communs dans un anneau quotient de R. Pour cela on utilise le résultat suivant
Proposition 2.17. Soient f et g deux polynômes de R[T ] et I un idéal de R. Notons par P l’image de
P ∈ R[T ] dans R/I [T ]. Supposons que deg( f ) = deg( f ) (i.e., f a bonne réduction modulo I ). Alors
Res( f , g ) = 0 si et seulement si Res( f , g ) = 0 .
De plus, si R/I est factoriel, alors Res( f , g ) = 0 si et seulement si f et g ont un facteur commun (non
constant).
Un cas particulier est R = Z avec I = (p), p étant premier. Dans ce cas la proposition précédente
dit que p divise Res( f , g ) si et seulement si f et g ont un facteur commun dans Z/p Z[T ].
frenchLE RÉSULTANT (DE SYLVESTER)
7
Exemple(s) 2.18.
(1) Déterminer les équations des projections sur les plans de coordonnées
de l’intersection du cône x 2 + y 2 = z/2 et du cylindre (y − 1)2 + (z + 4)2 = 1. Déterminer leur
intersection.
(2) Déterminer les équations des projections sur les plans de coordonnées des deux surfaces
S 2 = {(x, y, z) ∈ R3 , x 2 + y 2 +z 2 = 1} et et celle d’équation x 2 y 2 + y 2 z 2 +z 2 x 2 = 2x y z. Factoriser les équations obtenues, en déduire l’intersection. Peut-on obtenir l’intersection plus
directement ?
(3) Sans déterminer leurs zéros ni les factoriser, dire si les polynômes (sur Q) suivants ont des
racines multiples :
P 1 = x 144 + x 16 + 3x 134 + 3x 6 − 4x 141 − 4x 13 − 12x 131 − 12x 3 + 4x 138 + 4x 10 + 12x 128 + 12,
P 2 = x 11 − 12x 10 + 55x 9 − 115x 8 + 76x 7 + 150x 6 − 404x 5 + 290x 4 + 75x 3 + 162x 2 + 459x + 405.
Est-ce que les polynômes T 5 −3T 4 −2T 3 +3T 2 +7T +6 et T 4 +T 2 +1 ont un facteur commun
sur Q ? sur des extensions de Q ?
(4) Soit la conique C (x, y) = 2x 2 + x y + 4y 2 − 1 et la conique paramétrée par a ∈ Q, C a (x, y) =
−2x 2 + 3x y + a y 2 − 1, que l’on regardera comme polynômes dans Q[x, y]. On s’intéresse à
l’ensemble Z a = {(α, β) ∈ Q, C (α, β) = 0 et C a (α, β) = 0}. Calculer Resx (C ,C a ) et Res y (C ,C a ).
En tant que polynômes à une variable sont-ils identiques ? Tracez les ensembles C (x, y) = 0
et C a (x, y) = 0 pour a = 2, 3, 4, 5 (On précisera le domaine de traçage choisit). Donnez une
estimation de Z a dans chacun des cas. Déterminez Z a à l’aide du résultant et comparez
avec ce que vous avez obtenus précédemment (on essayera dans la mesure du possible de
trouver les solutions en fonction du paramètre a).
(5) Soit C le cylindre de R3 d’équation (x − 12 )2 + y 2 = 41 et S la sphère de R3 . On s’intérèsse
à l’ensemble T = C ∩ S. Vérifier que T 6= ; et qu’en fait le cylindre est «à l’intérieur de la
sphére» avec un point tangent à la sphère que l’on déterminera. A quoi ressemble T ?
3. U N EXEMPLE
2
DÉTAILLÉ
Considérons les deux polynômes f (x, y) = (y + 6)(x − 1) − y(x 2 + 1) et g (x, y) = (x 2 + 6)(y − 1) −
x(y 2 + 1). On remarque que l’on a f (x, y) = g (y, x). Notons Z f (resp. Z g ) l’ensemble des zéros de
f (resp. g ) que l’on regardera dans le plan réel (ou complexe). Commencons par tracer ces deux
courbes dans la portion où elles s’intersectent, un peu d’essai et d’erreur, nous suggère de regarder
dans le cadran (x, y) ∈ [0, 5]2 .
8
frenchPHILIPPE ELBAZ-VINCENT
On observe qu’il y a 4 points d’intersections, en étant plus attentifs on remarque qu’ils sont circonscrits (et nous allons chercher l’équation de ce cercle). Nous allons maintenant étudier l’aspect
algébrique en calculant le résultant respectivement aux différentes variables. Du fait de la symétrie
de f et g , ces résultants sont symétriques par rapport à ces variables. En effet on a
Resx ( f , g ) = 2y 6 − 22y 5 + 102y 4 − 274y 3 + 488y 2 − 552y + 288 ,
et on vérifiera que Res y ( f , g ) est le même polynôme où l’on a remplacé y par x (on laisse au lecteur
le soin de vérifier que c’est toujours le cas lorsque l’on a des polynômes
symétriques). Déterminons
p
les racines de ce polynôme, nous obtenons y = 2, y = 3 et y = 1+i2 15 .
Vérifions que les points d’intersections sont bien circonscrits. Considérons un cercle C d’équation
C = (x − a)2 + (y − b)2 − c ,
et tel que C passent par les points d’intersections de Z f et Z g . En imposant que C passe par (x, y) =
(2, 2), (3, 3), (2, 3), nous trouvons
b=
5
,
2
a=
5
1
,c = .
2
2
On peut vérifier que le quatrième point est bien sur le cercle
frenchLE RÉSULTANT (DE SYLVESTER)
9
4. É PILOGUE
Bien que le résultant soit un outil intéressant, quel que soit l’algorithme utilisé ce sera un objet
«assez gros» (sauf bien sur dans le cas où les coefficients sont dans un corps fini, du fait que la taille
des coefficients est «fixe»). On peut préciser cette «taille» dans le cas R = Z.
Soient f et g des polynômes non nuls de Z[T ]. Notons par ||·||∞ le maximum des valeurs absolues
des coefficients d’un polynôme de Z[T ]. Alors nous avons la borne suivante pour Res( f , g ) :
|Res( f , g )| É (deg( f ) + 1)
deg(g )
2
(deg(g ) + 1)
deg( f )
2
deg(g )
|| f ||∞
deg( f )
||g ||∞
.
On pourra vérifier (exercice) qu’en pratique le résultant est souvent de cet ordre de grandeur.
Un autre défaut du résultant de Sylvester est qu’il ne tient pas suffisamment compte de propriétés
spécifiques des polynômes (homogénéité, symétrie spécifique) et qu’il est assez inadapté dans le
cas des polynômes creux (i.e., avec très peu, moins de 10% voir moins de 1%, de coefficients non
nuls). C’est pour cela qu’ont été développés durant le XXe siècle de nouvelles familles de résultants (ou des améliorations des anciens résultants) plus performants du point de vue des calculs
et mieux adaptés aux propriétés de certaines familles de polynômes.