Mathématique - Géométrie et Lois et Unités de Mesures Gradués (Ligne Droite=Règle-Parrallèles - Angles Droits=Perpendiculaire - Angles=Dégrés=équerres - Cercles=Compas-Triangles
Équation
14 x + 15 = 71 Robert Recorde est un précurseur pour l'écriture d'une équation. Il invente l'usage du signe
= pour désigner une égalité
1.
Un
système dynamique correspond à un type particulier d'équation, dont les solutions recherchées sont des fonctions. Le comportement limite est parfois complexe. Dans certains cas, il est caractérisé par une curieuse figure géométrique, appelée
attracteur étrange.
Une équation est, en mathématiques, une relation (en général une égalité) contenant une ou plusieurs variables. Résoudre l'équation consiste à déterminer les valeurs que peut prendre la variable pour rendre l'égalité vraie. La variable est aussi appelée inconnue et les valeurs pour lesquelles l'égalité est vérifiée solutions. À la différence d'une identité, une équation est une égalité qui n'est pas nécessairement vraie pour toutes les valeurs possibles que peut prendre la variable2,3.
Les équations peuvent être de natures diverses, on les trouve dans des branches différentes des mathématiques ; les techniques associées à leur traitement diffèrent selon leur type.
L'algèbre étudie surtout deux familles d'équations : les équations polynomiales et parmi elles les équations linéaires. Les équations polynomiales sont de la forme P(X) = 0, où P est un polynôme. Des méthodes de transformation et de changement de variable permettent de venir à bout des plus simples. Les équations linéaires sont de la forme a(x) + b = 0, où a est une application linéaire et b un vecteur. On utilise pour les résoudre des techniques algorithmiques ou géométriques, issues de l'algèbre linéaire ou de l'analyse. Modifier le domaine de définition de la variable peut changer considérablement la nature de l'équation. L'algèbre étudie également les équations diophantiennes, équations dont les coefficients et les solutions sont des entiers. Les techniques utilisées sont différentes et essentiellement issues de l'arithmétique. Ces équations sont en général difficiles, on cherche souvent uniquement à déterminer l'existence ou l'absence de solution et, si elles existent, leur nombre.
La géométrie utilise les équations pour décrire et caractériser des figures. L'objectif est encore différent des cas précédents, l'équation est utilisée pour mettre en évidence des propriétés géométriques. Il existe, dans ce contexte, deux grandes familles d'équations, les cartésiennes et les paramétriques.
L'analyse étudie des équations du type f(x) = 0, où f est une fonction ayant certaines propriétés comme la continuité, la dérivabilité ou encore le fait d'être contractante. Des techniques permettent de construire des suites convergeant vers une solution de l'équation. L'objectif est de pouvoir approcher la solution aussi précisément que possible.
Un système dynamique est défini par une équation dont les solutions sont, soit des suites, soit des fonctions d'une ou plusieurs variables. Il existe deux questions centrales : l'état initial et le comportement asymptotique. Pour chaque état initial admissible, par exemple la valeur de la suite ou de la fonction en zéro, l'équation admet une unique solution. Parfois, une petite modification de l'état initial modifie peu la solution. Ce n'est pas toujours le cas, cette sensibilité à la condition initiale est l'objet de la première question. Le comportement limite ou encore asymptotique d'une solution correspond à la forme de la solution quand la variable tend vers l'infini, ce comportement est l'objet de la deuxième question. S'il ne diverge pas, il peut, soit tendre vers une valeur donnée, soit s'approcher d'un comportement cyclique (une fonction périodique ou une suite parcourant toujours un même ensemble fini de valeurs et dans le même ordre), soit avoir un comportement chaotique, semblant évoluer au gré du hasard, même si la solution est par définition déterministe.
- Remarque : Le terme inéquation correspond à une définition différente4. Si dans certains cas particuliers5 les sujets sont connexes, dans le cas général ils sont suffisamment éloignés pour mériter des traitements distincts. Les inéquations sont en conséquence traitées dans un article séparé.
Préambule
Définitions : équation, inconnue et solution
L'exemple suivant est extrait6 du livre d'Al-Khawarizmi, l'un des fondateurs de l'algèbre.
« Un homme meurt et laisse quatre fils et il fait, à un homme, une donation égale à la part d'un de ses fils et, à un autre, le quart de la différence entre le tiers de l'héritage et la première donation. ». Si x désigne l'inconnue, ici la fraction de l'héritage que reçoit un fils, la question se traduit par l'équation suivante, où la valeur 1 à droite désigne 1 héritage : ( 1 ) 4 x + x + 1 4 ( 1 3 − x ) = 1. |
Dans l'exemple, la formulation sous forme d'équation, c'est-à-dire l'égalité (1), est équivalente à la question posée. Y répondre revient à déterminer l'unique valeur que doit prendre l'inconnue x pour que l'égalité définissant l'équation soit vraie. Le maniement de l'inconnue permet de résoudre quelques équations, comme celle présentée ici. Cette vision est source d'une autre manière de définir une équation. Pour l'Encyclopédie Soviétique de Mathématiques, une équation est la traduction, sous une forme analytique, d'un problème7,8. L'équation f(x) = g(x) correspond à la question : pour quelle valeur de x, l'équation se transforme-t-elle en égalité ? Cette définition décrit bien les premières équations étudiées, qui sont parfois la formulation mathématique d'une question de la vie courante.
Cette définition fondée sur une question n'est pas la plus générale : en géométrie, l'équation du cercle ne fait pas référence à une question9. Cependant, la forme reste la même : une égalité entre deux expressions, utilisant deux variables généralement notées x et y.
Paramètre
Au XVIe siècle, Viète, un mathématicien français, trouve une méthode pour exprimer de manière générique une famille d'équations10. Pour en comprendre l'intérêt, illustrons-le par une question.
Exemple d'équation paramétrée.
|
Le graphe de la fonction f est la parabole illustrée en bleu sur la figure, celui de g1( x) la droite illustrée en rouge, celui de g-2( x) en violet et celui de g-1 en vert.
Quel est le nombre de solutions des équations réelles11 suivantes ?
( 1 ) x 2 = 2 x + 1 , ( 2 ) x 2 = 2 x − 2 et ( 3 ) x 2 = 2 x − 1.
Pour trouver ce nombre, on considère la fonction f(x), qui à x associe x2, dont le graphe est la parabole représentée à droite en bleu. La fonction g1(x) associe à x la valeur 2.x +1 (la droite rouge). Les solutions de l'équation sont les abscisses des intersections de la parabole avec la droite rouge, la représentation graphique montre l'existence de deux solutions, car il existe deux intersections. Pour l'équation (2), considérons la fonction g–2(x) qui à x associe 2x – 2 (la droite violette). Elle ne rencontre pas la parabole et l'équation n'admet pas de solution. Pour traiter le dernier cas, on considère la fonction g–1(x) qui à x associe 2x – 1 (la droite verte) ; c'est encore une droite parallèle à la précédente et cette fois-ci il existe une unique solution.
Une manière globale de résoudre ces trois questions est de faire appel à une lettre a qui représente un nombre quelconque. Les trois équations précédentes correspondent à la suivante, si a est égal à 1, –2 ou encore à –1 :
( 4 ) x 2 = 2 x + a . |
L'équation (4) ci-contre est dite « équation paramétrée » et la lettre a désigne le « paramètre ». Son usage permet d'étudier les équations par familles.
Problèmes soulevés par une équation
Démontrer l'existence d'une solution au
problème isopérimétrique, revient à montrer l'existence d'un sommet sur la figure. À chaque couple (
C, φ), on associe l'aire du triangle de périmètre 3, contenant un côté de longueur
C et un angle adjacent à ce côté égal à φ. Les mathématiciens de l'antiquité ne disposaient pas d'outils pour résoudre cette question
Note 1.
Les questions que soulève l'étude d'une équation dépendent de sa nature. À l'image de l'équation précédente, certaines sont définies à l'aide d'une fonction f : ℝ → ℝ, c'est-à-dire de l'ensemble des nombres réels dans lui-même. L'équation s'écrit f(x) = 0 (plus généralement, une équation de la forme g(x)=h(x) sera ramenée à la forme f(x) = 0 en posant f=g-h). On commence parfois l'étude par établir l'existence ou non de solution à l'équation. Le nombre de solutions est donnée par l'étude de la fonction f, ce cas est étudié dans le paragraphe sur les zéros d'une fonction.
Parfois, il est plus simple de commencer par étudier les propriétés de la ou des éventuelles solutions, sans se préoccuper initialement de leur existence. C'est le cas pour le problème isopérimétrique du triangle. La question revient à trouver le triangle de périmètre donné (on prend ici la valeur 3) de plus grande aire possible. Si T désigne l'inconnue, ici un triangle de périmètre 3, S(T) la fonction qui à un triangle associe son aire et m la borne supérieure des surfaces des triangles de périmètre 3, la traduction sous forme d'équation du problème s'écrit :
S ( T ) = m .
Dès l'antiquité, les mathématiciens savent que l'unique réponse possible est le triangle équilatéral12. En revanche, établir l'existence d'une solution est plus technique et fait appel à des outils inconnus jusqu'au XVIIIe siècleNote 2. L'existence d'une solution est intimement liée à l'ensemble dans lequel on recherche cette solution. Si, dans l'exemple choisi, cet ensemble est étendu à celui des polygones de périmètre 3, l'équation n'admet plus de solution. Pour établir ce résultat, on démontre dans un premier temps qu'une éventuelle solution serait nécessairement un polygone régulierNote 3. Or plus le nombre de côtés d'un polygone régulier de périmètre donné augmente, plus son aire croît ; ce qui montre l'absence de solution, car aucun polygone régulier n'est d'aire maximale.
La forme d'une solution dépend des besoins. L'équation définissant le nombre d'or φ est : X2 – X – 1 = 0. Pour un architecte, la forme la plus pragmatique est une approximation décimale comme 1,618. En revanche, si l'objectif est d'établir la formule reliant la suite de Fibonacci (un) avec φ :
∀ n ∈ N u n = 1 5 ( φ n − ( 1 − φ ) n ) .
Une forme exacte comme (1 + √5)/2 est indispensable. Comme le nombre d'or est irrationnel, il ne peut y avoir d'expression exacte sans l'aide d'une fonction auxiliaire comme la racine carrée, car les quatre opérations et les nombres entiers n'expriment que des rationnels. L'approximation de solutions fait l'objet de vastes études, qui entrent dans un domaine des mathématiques appelé analyse numérique13.
Algèbre
Théorie des équations
Le graphe du module du polynôme
X5 - 3
X + 2, montre que ce polynôme admet au moins quatre racines (la cinquième n'est pas visible sur le graphique), illustrant le
théorème de d'Alembert-Gauss dans un cas particulier.
La première théorie des équations ne concerne que les équations polynomiales, c'est-à-dire de la forme P(X) = 0 où P est un polynôme14. Elle est basée sur des transformations des membres de l'équation en appliquant les cinq opérations « classiques » (addition, multiplication, soustraction, division et extraction de racine) aux coefficients de l'équation comme à son inconnue.
Si le degré du polynôme est égal à 2 et si les coefficients et les solutions recherchées sont réels, alors ces méthodes permettent de trouver les solutions, encore appelées racine (cf. l'article « Équation du second degré »). L'usage du changement de variable permet d'étendre la famille d'équations qui se résolvent, comme l'illustre l'exempleNote 4 e2x – (ea + eb)ex + ea+b = 0 en posant X = ex. Cette méthode du changement de variable ne se limite pas aux équations algébriques.
Pour aller plus loin et résoudre l'équation cubique, c'est-à-dire du troisième degré, les mathématiciens italiens de la Renaissance découvrent la nécessité d'enrichir l'ensemble des nombres en lui adjoignant des nombres imaginaires15. Cette découverte permet la résolution des équations du troisième et quatrième degré (voir les méthodes de Cardan et Ferrari).
Le théorème de d'Alembert-Gauss précise que tout polynôme de degré supérieur ou égal à 1 et à coefficients réels ou complexes, admet au moins une racine complexe16. Si ce théorème assure, dans un cas très général, l'existence d'une solution, il n'en offre aucune formulation explicite, et l'intuition de ces racines complexes pour les polynômes réels n'est pas immédiate. Le deuxième théorème, dit théorème d'Abel en explique la raison : il n'existe, en général, aucune formule analogueNote 5 à celles qui s'appliquent aux petits degrés, capable d'exprimer les racines. Ce résultat, œuvre de Niels Abel17, est complété par Évariste Galois qui indique une condition nécessaire et suffisante pour déterminer dans quels cas les racines d'une équation polynomiale possèdent une expression de cette nature18. Sa démonstration fait appel à la théorie de Galois.
Les deux théorèmes précédents closent la théorie des équations. Cette expression fut encore en vigueur en mathématiques pendant tout le XIXe siècle19. Elle reste d'actualité en histoire des sciences20. Elle est encore utilisée en mathématiques21, mais elle est devenue rare et un peu désuète.
Système d'équations linéaires
Une autre famille d'équations est traitée par l'algèbre : celle des équations linéaires. Ce sont les équations de la forme (1) a(x) + b = 0, où a est une application linéaire d'un espace vectoriel E dans un espace vectoriel F, b un vecteur de F et x une variable qui décrit l'ensemble E. Si les espaces E et F sont de dimension finie, notés n pour E et m pour F, le choix d'une base de E et de F, permet d'exprimer a sous la forme d'une matrice (aj,k), x sous la forme d'un vecteur colonne à n coordonnées (xk) et b d'un vecteur colonne à m coordonnées (bj).
( 2 ) { a 1 , 1 x 1 + a 1 , 2 x 2 + . . . + a 1 , n x n = b 1 a 2 , 1 x 1 + a 2 , 2 x 2 + . . . + a 2 , n x n = b 2 ⋮ a m , 1 x 1 + a m , 2 x 2 + . . . + a m , n x n = b m .
D'une équation (1) on passe à un système (2), de m équations à n inconnues. Cette technique, consistant à passer d'une équation vectorielle à un système de plusieurs équations réelles de plusieurs variables réelles, ne se limite pas au cas linéaire.
Sous la forme (2), plusieurs algorithmes permettent de trouver une racine. Si n est égal à m et si le déterminant de la matrice de a est non nul, il est possible d'utiliser la règle de Cramer. Ce n'est pas l'algorithme le plus efficace : la méthode du pivot de Gauss est plus simple et plus rapide22. Elle revient à isoler les n variables à l'aide d'une suite de substitutions. Cette méthode est ancienne ; on en trouve un équivalent dans le chapitre 8 du livre chinois de mathématiques intitulé Les Neuf Chapitres sur l'art mathématique et datant d'avant notre ère23. Au XIIIe siècle, Qin Jiushao va plus loin et trouve comment résoudre un système linéaire avec des congruences comme coefficients, pour résoudre une question liée à un « programme de répartition de grains »24.
Équation linéaire et géométrie
La géométrie permet de trouver des algorithmes de résolution de l'équation linéaire, plus rapides que la
méthode du pivot de Gauss. La figure illustre le graphe en dimension 3, de la fonction
f.
Cette figure illustre les courbes de niveaux en bleu de la fonction f. Les segments rouges et verts correspondent au trajet suivi par la suite approximante, qui converge en deux étapes en dimension 2.
L'approche géométrique de l'équation linéaire offre des informations d'une autre nature. L'image d'une application linéaire a, c'est-à-dire l'ensemble des vecteurs qui admettent un antécédent par f forme un sous-espace vectoriel, comme l'est un plan dans un espace de dimension trois. Le noyau de a, c'est-à-dire les vecteurs de l'ensemble de départ ayant pour image le vecteur nul, est aussi un sous-espace. Ces résultats montrent que l'ensemble des solutions forme un espace affine de direction le noyau de a.
Le point de vue géométrique permet d'élaborer des algorithmes de résolution qui tiennent compte des spécificités de a. Dans certains cas particuliers, il existe des techniques qui permettent de trouver une solution plus rapidement qu'avec la méthode du pivot de Gauss. Un exemple correspond au cas où E est un espace euclidien égal à F et a est tel que l'application qui à x et y associe 〈–ax,y〉 soit un produit scalaire. Ici les crochets désignent le produit scalaire initial de l'espace ENote 6. Ceci implique que la matrice de a est de déterminant non nul et symétrique, si la base de E est choisie orthonormée.
Une méthode consiste à ne pas chercher à résoudre l'équation ax + b = 0 mais à répondre à une autre question, d'apparence plus complexe. Elle revient à trouver le point optimalNote 7 de l'expression qui à x associe f(x), défini par :
∀ x ∈ E f ( x ) = 1 2 ⟨ a x , x ⟩ + ⟨ b , x ⟩ .
Son point optimal est la solution de l'équation linéaire. Pour comprendre la méthode de résolution, le plus simple est de représenter le cas où F est de dimension 2. Le graphe de f a alors la forme d'un pain de sucre, comme illustré sur la figure de gauche. Une méthode consiste à partir d'un point quelconque x0 et à suivre la ligne de plus grande pente, illustrée en rouge sur les figures et qui correspond à une parabole à gauche et à un segment à droite. Le sommet de cette parabole est noté x1. À partir du point x1, on suit à nouveau la ligne de plus grande pente, en vert sur les figures. Cette technique porte le nom d'algorithme du gradient.
Si, au lieu de suivre exactement le chemin de plus grande pente, on en choisit un de direction orthogonale aux directions précédentes pour le produit scalaire 〈–ax,y〉, la méthode converge vers la solution en un maximum de n étapes, si n désigne la dimension de E. Elle porte le nom de méthode du gradient conjugué25.
Géométrie
Géométrie analytique
Une
conique est toujours l'intersection d'un plan et d'un cône de révolution.
En géométrie euclidienne, il est possible d'associer à chaque point de l'espace un jeu de coordonnées, par exemple à l'aide d'un repère orthonormé. Cette méthode permet de caractériser des figures géométriques à l'aide d'équations. Un plan dans un espace de dimension 3 s'exprime comme l'ensemble des solutions d'une équation du type ax + by + cz + d = 0, où a, b, c et d sont des nombres réels, x, y, z les inconnues qui correspondent aux coordonnées d'un point du plan dans le repère orthonormal. Les valeurs a, b et c sont les coordonnées d'un vecteur perpendiculaire au plan défini par l'équation. Une droite s'exprime comme l'intersection de deux plans, c'est-à-dire comme les solutions d'une équation linéaire à valeurs dans ℝ2 ou comme les solutions d'un système de deux équations linéaires à valeurs dans ℝ, si ℝ désigne l'ensemble des nombres réels.
Une conique est l'intersection d'un cône d'équation x2 + y2 = z2 et d'un plan. Autrement dit, dans l'espace, toute conique est définie comme les points dont les coordonnées sont solutions d'une équation du plan dans ℝ2 et de l'équation précédente. Ce formalisme permet de déterminer les positions et les propriétés des foyers de la conique.
Avec cette approche, on obtient des équations dont l'objectif n'est pas l'expression des solutions au sens du paragraphe précédent. Un exemple est donné par un théorème de Thalès indiquant qu'un triangle est rectangle s'il possède un côté égal à un diamètre d'un cercle et un sommet opposé élément du cercle. Ce théorème est illustré sur la figure de droite. Si le repère est bien choisi, il est orthogonal et l'équation du cercle s'écrit : x2 + y2 = 1, les points A et C de la figure de droite ont pour coordonnées respectives (-1,0) et (1,0). Dire que AB est perpendiculaire à CB revient à dire que les vecteurs associés sont orthogonaux. L'équation du cercle permet de conclure la démonstration, en effet :
A B → ⋅ C B → = ⟨ ( x − 1 , y ) , ( x + 1 , y ) ⟩ = ( x + 1 ) ( x − 1 ) + y 2 = x 2 + y 2 − 1 = 0 car x 2 + y 2 = 1 Note 8.
L'usage d'une équation permet de faire appel à un nouveau pan des mathématiques pour résoudre des questions de géométrie. Le repère cartésien transforme un problème de géométrie en un problème d'analyse, une fois les figures étudiées traduites en équations ; d'où le nom de géométrie analytique26. Ce point de vue, mis en évidence par Descartes, enrichit et modifie la géométrie telle que la concevaient les mathématiciens de la Grèce antiqueNote 9.
Actuellement, la géométrie analytique désigne une branche des mathématiques où la recherche est active. Si elle utilise toujours l'équation pour caractériser une figure, elle utilise aussi des outils sophistiqués issus de l'analyse fonctionnelle ou de l'algèbre linéaire.
Équation cartésienne et paramétrique
Il existe au moins deux méthodes pour décrire une figure géométrique à l'aide d'équations. La première consiste à la décrire par une équation de la forme f(x) = 0, où f est une fonction de l'espace euclidien E de dimension n dans ℝd où d est un entier plus petit que n. Si f est une fonction suffisamment régulière, n - d est la dimension de la figure géométrique. Si elle est égale à 1, la figure est une courbe, pour 2, on parle de surface, etc27. Une telle équation peut aussi s'écrire comme système de d équations à valeurs dans les réels exactement comme pour le cas de l'équation linéaire. Ce type d'équation est appelé cartésien si x est exprimé à l'aide de ses coordonnées dans un repère cartésien28. Les équations décrites dans le paragraphe précédent sont toutes cartésiennes, comme celle du cercle d'équation x2 + y2 = 1.
Une autre méthode consiste à décrire la figure géométrique à l'aide d'une fonction f de ℝd dans E de la manière suivante, un point m de E est élément de la figure lorsqu'il existe un point x de l'ensemble de définition de la fonction f tel que f(x) est égal à m. Dans ce cas, et sous réserve d'une régularité suffisante de f (il suffit que sa différentielle soit injective), la figure est de dimension d. On parle d'équation paramétrique de la figure géométrique29, cette définition de l'équation est relativement éloignée de celle trouvée en algèbre.
Si la figure est suffisamment régulière, par exemple si elle correspond à une variété, au moins localement, il existe un paramétrage de la figure. Localement signifie que si m est un élément de la figure, il existe une fonction f et un voisinage V d'un point de l'ensemble de départ de f tel que l'image de f soit incluse dans la figure et tel que l'image de V par f soit un voisinage de m dans la figure30. Localement, il est aussi possible de définir la figure à l'aide d'une équation cartésienne.
Arithmétique
Équation diophantienne
Après plusieurs siècles d'efforts de la communauté mathématique, c'est
David Hilbert qui finit par résoudre l'équation diophantienne de degré 2.
Historiquement, les premières équations formalisées sont de nature arithmétique et datent du IIIe siècle31. Si l'on recherche comme solution d'une équation, non pas un nombre quelconque, mais un nombre entier et si l'équation est à coefficients entiers, on parle d'équation diophantienne32. Les méthodes décrites précédemment sont généralement insuffisantes pour conclure, des outils issus de l'arithmétique, ou au moins de l'arithmétique élémentaire sont indispensables. Un exemple relativement simple33 est celui linéaire à deux inconnues ax + by = c.
Si le degré de l'équation augmente, la question devient beaucoup plus complexe. Même une équation de degré 2 n'est en général pas simple (voir par exemple le théorème des deux carrés de Fermat ou l'équation de Pell-Fermat). À condition d'ajouter d'autres méthodes, comme celle de descente infinie et de nouveaux résultats comme le petit théorème de Fermat, il est possible de résoudre quelques cas particuliers. Le cas général de l'équation de degré 2 demande l'usage d'outils plus sophistiqués, comme ceux de la théorie algébrique des nombres. Les ensembles de nombres sont enrichis, on utilise les corps finis et les entiers algébriques, qui s'étudient, comme pour l'équation algébrique, à l'aide de la théorie de Galois. Si l'équation algébrique de degré 2 est essentiellement résolue par Al-Khwârizmi, un mathématicien arabe du VIIIe siècle, il faut attendre la fin du XIXe siècle pour que David Hilbert vienne à bout de son équivalent diophantienNote 10. L'étude de l'équation diophantienne est souvent suffisamment complexe pour se limiter à établir l'existence de solutions et, s'il en existe, à déterminer leur nombre.
Un vaste domaine d'application des équations diophantiennes est l'informatique. Les outils issus de leurs études permettent de concevoir des codes correcteurs et sont à la base d'algorithmes en cryptologie. Il existe des équations diophantiennes qui s'écrivent simplement, mais qui demandent des temps de traitement prohibitifs pour les résoudre, elles sont à la base de codes secrets. Par exemple, l'équation n = xy, où n est un entier naturel fixé et où x et y sont les inconnues, n'est pas résoluble en pratique, si n est le produit de deux nombres premiers suffisamment grands. Cette équation est à la base du chiffrement RSA34.
Nombre algébrique et transcendant
Lindemann montre qu'aucune équation polynomiale à coefficients entiers n'admet
π comme racine.
Au lieu de se demander quels nombres sont solutions d'une équation donnée, on peut considérer le problème inverse : de quelles équations un nombre donné est-il solution ? Un nombre est dit rationnel s'il est solution d'une équation du premier degré à coefficients entiers. Il est dit algébrique s'il est solution d'une équation polynomiale à coefficients entiers. S'il n'est pas algébrique, il est dit transcendant. Ainsi, pour un nombre donné, l'objectif est de trouver les éventuelles équations polynomiales dont ce nombre est racine (voir « Polynôme minimal (théorie des corps) »).
Par exemple pour √2, la question se pose de savoir s'il est possible de construire une équation du premier degré ayant cette valeur pour racine. Elle se résout simplement : si une telle équation existe, on en déduit l'expression 2a2 = b2, où a et b sont des nombres entiers. L'analyse de la décomposition en facteurs premiers montre que le terme de droite contient le facteur 2 un nombre pair de fois et celui de gauche un nombre impair. Cette remarque démontre que √2 n'est pas un nombre rationnelNote 11. En revanche, il est par définition algébrique, car solution de l'équation X2 – 2 = 0.
La même question pour le nombre π est plus délicate. Pour montrer que ce nombre n'est solution d'aucune équation du premier degré à coefficients dans les nombres entiers, on utilise des fractions continues généralisées (une démonstration est proposée dans l'article « Fraction continue et approximation diophantienne »). Les techniques sont plus sophistiquées que celles utilisées pour démontrer l'irrationalité de √2. Alors que ce premier résultat est déjà connu à l'époque d'Euclide35, il faut attendre le XVIIIe siècle pour établir celle de π36.
Si montrer que π n'est pas solution d'une équation du premier degré à coefficients dans les entiers n'est déjà pas si simple, il est encore plus ardu de montrer qu'il n'est solution d'aucune équation polynomiale à coefficients entiers. Il faut encore plus d'un siècle d'efforts pour établir cette transcendance37. Elle clôt une vieille question, à savoir s'il est possible de construire à la règle et au compas un carré de même aire qu'un cercle, cette question porte le nom de quadrature du cercle. Elle est impossible car toute construction de cette nature définit une surface d'aire égale à un nombre algébrique.
Géométrie algébrique
- Genre de quelques surfaces orientables
-
-
-
-
Résoudre une équation diophantienne polynomiale n'est pas toujours possible avec les seuls outils de la théorie algébrique des nombres. Avec ce type de méthode, Ernst Kummer parvient à résoudre, au milieu du XIXe siècle, presque tous les cas inférieurs à 100 de la célèbre équation dénommée dernier théorème de Fermat38, mais le cas général reste hors de portée.
La géométrie, et plus précisément la géométrie algébrique, a été nécessaire pour conclure. L'équation du dernier théorème de Fermat s'écrit de la manière suivante : xn + yn = zn. Quitte à étudier les solutions dans les nombres rationnels, on peut diviser par zn et écrire l'équation qn + rn = 1. Si q et r sont choisis dans l'ensemble des nombres complexes, noté ici ℂ, géométriquement, cette équation correspond à une figure de ℂ2, ou encore à une surface réelle dans un espace de dimension 4. Vue dans l'espace projectif de ℂ2, on obtient une surface réelle, plongée dans un espace compact dont la visualisation n'est pas intuitive. Il suffit de connaître les points rationnels de cette surface pour permettre de conclure sur les solutions du théorème de Fermat.
La topologie offre des éléments de réponse pour cette équation. Une surface de cette nature possède un genre. Topologiquement, elle est équivalente à une sphère (genre 0), à un tore (genre 1) ou à une figure comportant n trous (genre n). Dans le cas d'une variété algébrique, définie par une équation du type P(X, Y) = 0, où P est un polynôme à coefficients rationnels, le genre de la variété est une indication sur le nombre de solutions. Ce résultat, qui porte le nom de théorème de Faltings, est de la même famille d'outils que ceux utilisés pour la démonstration du théorème de FermatNote 12.
Analyse
Zéro d'une fonction
En analyse plus encore, il sera bien souvent vain d'espérer traiter une équation par des techniques élémentaires de substitution ou transformation, en espérant isoler la variable. Et même quand cela s'avère possible, comme pour certaines équations algébriques, si l'objectif est l'obtention d'une valeur numérique, l'approche décrite dans ce paragraphe est souvent moins coûteuseNote 13. On peut toujours ramener l'équation à une forme f(x) = 0. Considérons par exemple l'équation suivante, l'inconnue étant un réel strictement positif :
sin ( x ) = ln ( 1 x ) .
Elle se réécrit f(x) = 0 si l'on pose f(x) = (sinx) + (lnx)/2. Un zéro est une solution de l'équation dans ce cas particulier. Il serait vain de chercher à exprimer un zéro par une formule composant des fonctions élémentaires (fractions rationnelles, fonctions exponentielles, logarithmiques ou trigonométriques...). Une telle expression n'existe pas ici. On se contentera de chercher le nombre de zéros, des intervalles les contenant, ainsi que des approximations de ces zéros39.
Dans l'exemple, l'étude de la fonction f montre facilement qu'il y a exactement trois zéros, un dans l'intervalle ]0, 1], un dans [3, 4] et le dernier dans [5, 6]. La continuité de f permet de construire une première suite (xn) convergeant vers le zéro de l'intervalle ]0, 1]. Au voisinage de 0, la fonction est strictement négative, au point 1, elle est strictement positive, le théorème des valeurs intermédiaires garantit l'existence d'un zéro dans cet intervalle, car f est continue. On pose x0 = 0, au point 1/2, la fonction f est strictement positive, on en déduit l'existence d'un zéro dans l'intervalle [0, 1/2] et on pose x1 = 0. Au point 1/4, elle est strictement négative, on en déduit l'existence d'un zéro dans [1/4, 2/4] et on pose x2 = 1/4 et ainsi de suite. On construit ainsi une suite convergeant vers la solution, ce qui permet d'obtenir une approximation aussi précise que souhaitée. Cette méthode porte le nom de dichotomie et est la première illustrée dans la figure du paragraphe.
Seule la continuité de f a été utilisée dans l'algorithme précédent, un théorème du point fixe est à la base d'une méthode plus efficace. On construit une fonction g (en rouge sur la figure du milieu) ayant pour point fixe (c'est-à-dire un point x tel que g(x) = x) la solution recherchée. On choisit g de telle manière que la dérivée au point fixe soit la plus petite possible. Une solution simple est de définir g(x) = x + λf(x). Dans l'exemple, on peut choisir λ égal à –1/2. Cette fois-ci, il est plus judicieux de choisir x0 égal à 1. On définit xn = g(xn–1). Si la dérivée de g est proche de 0, la convergence est bien meilleure que celle de l'algorithme précédent. Dans l'exemple choisi, la solution est égale à 0,43247... La quatrième itération de la première méthode donne pour valeur 0,375 alors que celle issue du point fixe donne 0,432240...
La dérivabilité de f partout sur son domaine permet la mise au point d'un algorithme ayant une convergence encore meilleure. La méthode consiste, à partir d'un point x0, égal à 1 dans l'exemple, à trouver la solution x1 de l'équation linéaire tangente de la fonction f au point x0. Puis on construit x2 comme la solution de l'équation linéaire tangente de la fonction f au point x1. Dans l'exemple étudié, illustré sur la figure de droite, la valeur de x4 est égale à 0,43246 soit quatre décimales exactes. Cette méthode porte le nom de Newton41.
Équation vectorielle
L'algorithme du gradient s'applique à toute équation d'un espace vectoriel de dimension finie et à valeurs dans l'ensemble des nombres réels. Il est illustré ici à l'aide d'une représentation en courbes de niveaux
Si l'équation prend la forme f(x) = 0 où f est une fonction d'un espace vectoriel E à valeurs dans un espace vectoriel F dont le vecteur nul est noté 0, les idées de l'algèbre linéaire peuvent encore s'appliquer partiellement. Il est possible de choisir une base de E et de F et d'exprimer f à l'aide de m fonctions fj réelles de n variables xk, où m est la dimension de F et n celle de E, on obtient ce que l'on appelle un système d'équations, de la forme suivante :
{ f 1 ( x 1 , ⋯ x n ) = 0 f 2 ( x 1 , ⋯ x n ) = 0 ⋮ f m ( x 1 , ⋯ x n ) = 0
Cette représentation correspond à la même équation que celle représentée à gauche, mais cette fois-ci en dimension 3.
Les mêmes limitations que celles décrites au paragraphe précédent s'appliquent. Il est tout à fait possible que la technique d'isolation des variables, qui fonctionne dans le cas de l'équation linéaire, ne soit pas possible, par exemple si les fi contiennent des expressions trop complexes. Certaines des idées, exprimées dans le cas où f est une fonction de la variable réelle à valeurs réelles, peuvent s'adapter à la géométrie d'un espace vectoriel de dimension finie, d'autres non. Il n'existe pas d'équivalent du théorème des valeurs intermédiaires pour la nouvelle configuration. En revanche, le théorème du point fixe se généralise, ainsi que la définition d'une dérivée.
La dérivée, ou plutôt la différentielle de f peut être utilisée de plusieurs manières. La première est une simple adaptation de la méthode de Newton, à partir d'un point x0, on résout l'équation linéaire tangente en ce point, c'est-à-dire Dfx0.h + f(x0) = 0. La valeur x1 est égale à x0 + h et l'on réitère le processus pour obtenir une suite. Si E est égal à F et pour permettre une convergence plus rapide, on résout souvent une équation linéaire analogue, mais dont l'application linéaire associée définit un produit scalaire. Cette astuce permet une accélération du temps de traitement de la résolution des équations linéaires intermédiaires, la méthode associée porte le nom de quasi-Newton42.
Une autre méthode consiste à transformer l'ensemble d'arrivée en R+, par exemple en équipant F d'un produit scalaire et en recherchant les zéros de la fonction g à valeurs réelles, qui à x associe le carré de la norme de f(x) ou encore le produit scalaire de f(x) avec x, si E est égal à F. Les deux équations f(x) = 0 et f(x)2 = 0 possèdent les mêmes solutions. Le problème revient à trouver un extremum de la nouvelle fonction g. On part d'un point x0 dans la direction de la ligne de plus grande pente, dont la direction est donnée par le gradient et on s'arrête au point x1, le minimum de la fonction g dans la direction du gradient. Puis on réitère le calculNote 14.
Analyse fonctionnelle
L'
aérodynamisme d'un objet volant est régi par une équation qui s'étudie à l'aide de l'analyse fonctionnelle. Des outils puissants tels que l'
espace de Hilbert sont nécessaires pour établir quelques théorèmes généraux.
Si l'espace vectoriel E est plus vaste et n'est plus de dimension finie, d'autres idées doivent être utilisées pour venir à bout de l'équation. Cette configuration se produit si l'inconnue x désigne une fonction. Une fois encore, il est vain de rechercher des méthodes systématiques exprimant les solutions sous la forme d'une composition de fonctions élémentaires, les cas où une telle expression existe tiennent plus de l'exception que de la règle.
Une méthode générale43 consiste associer à un espace de fonctions Hp, comme celui des fonctions continues définies sur un intervalle [a, b], une géométrie. Pour ce faire, on peut définir sur l'espace une distance euclidienne, c'est-à-dire définie par un produit scalaire comme celui qui, à deux fonctions f et g de Hp associe :
⟨ f , g ⟩ = ∫ a b f ( μ ) g ( μ ) d μ .
À l'aide de cette distance, on construit une suite (xn) de fonctions qui vérifie la propriété de Cauchy, c'est-à-dire que si les indices n et m sont suffisamment grands xn et xm sont arbitrairement proches. Un exemple est donnée par l'équation intégrale, dite de Fredholm44 :
( 1 ) F ( x ) = g avec F : x → F x ( t ) = ∫ a b K ( t , μ ) x ( μ ) d μ .
La suite (xn) est construite de telle manière que la distance entre les fonctions Fxn(t) et g(t) tende vers zéro. La difficulté est qu'une suite de Cauchy ne converge pas nécessairement dans Hp, ce qui revient à dire que cet espace n'est pas complet. Il est alors plongé dans un espace H qui le contient et qui lui, est complet45. Un élément de H n'est plus une fonction, il peut être vu comme un élément du dual de Hp46. Dans H, la suite (xn) converge vers une limite s. Elle peut être interprétée comme une solution de l'équation (1) car la distance entre F(s) et g est nulle. Mais s n'est pas une fonction, c'est un être abstrait, élément du dual de Hp, on parle de solution faible. On montre enfin que cet être abstrait s'identifie à un élément de Hp, c'est-à-dire une à fonction qui vérifie l'équation (1), appelée solution forte47,Note 15
Systèmes dynamiques
Introduction
Une fois connues la vitesse et la position d'une comète en un instant
t, la résolution d'une
équation différentielle permet de déterminer sa trajectoire exacte.
La physique est à l'origine d'équations fonctionnelles particulières : les systèmes dynamiques. Un exemple historiquement célèbre, est issu de la loi universelle de la gravitation. Si l'on néglige l'attraction due aux autres planètes, l'accélération de la Terre est dirigée vers le soleil et son intensité est inversement proportionnelle au carré de la distance qui sépare les deux astres. Cette loi physique se traduit par une équation qui, une fois connues la position et la vitesse initiales de la Terre, donne sa trajectoire, c'est-à-dire sa position en fonction du temps. Historiquement, la capacité à prévoir la position exacte des comètes au XVIIIe siècle fut une confirmation de la théorie de NewtonNote 16.
Un système qui évolue et dont une équation permet de connaître exactement son état au cours du temps, à la condition de connaître son état initial, est qualifié de dynamique. On peut les classer en trois grandes catégories. La formulation la plus simple est dite discrèteNote 17, l'état du système est décrit à différentes étapes, notées par les entiers 0, 1, 2 ..., k, ... et la solution est une suite (uk). Ce type de système est utilisé pour simuler un comportement continu, en discrétisant le temps à l'aide d'intervalles suffisamment petits pour que l'imprécision engendrées par cette méthode reste dans des limites acceptables. Connaître la trajectoire exacte d'une comète suppose la prise en compte de l'attraction de tous les corps célestes du système solaire. Résoudre l'équation dans ce cas devient difficile, on peut alors supposer qu'en une seconde, la gravité est presque constante, la trajectoire de la comète est presque parabolique et sa position au bout d'une seconde se calcule aisément, une fois connue la position des différents corps célestes massifs comme les planètes ou le soleil. Ensuite, il suffit de recalculer, à chaque seconde, la nouvelle attraction pour obtenir une suite donnant une approximation de la trajectoire réelle. Si (pk, vk) désigne le couple position et vitesse de la comète à la seconde k, il existe deux fonctions f et g régissant l'équation :
p n = f ( p n − 1 , v n − 1 ) et v n = g ( p n − 1 , v n − 1 ) .
On obtient des suites définies par récurrence, caractéristique d'un système dynamique discret48.
Il est aussi possible de s'y prendre autrement. Une relation lie la position de la comète avec sa vitesse instantanée (que l'on appelle dérivée en mathématiques) et son accélération (ou dérivée seconde). Résoudre l'équation permet de trouver la trajectoire de notre planèteNote 18. L'équation prend une forme de la nature suivante, appelée équation différentielle :
f ( t , p ( t ) , d p d t ( t ) , d 2 p d t 2 ( t ) ) = 0.
Enfin, l'objectif peut être de déterminer l'état d'un objet qui ne se traduit non pas par un vecteur d'un espace de dimension finie, mais par une fonction, comme l'état d'une corde vibrante. On parle d'équation aux dérivées partielles49.
Équation différentielle
Tracé d'une solution d'une équation différentielle (bleu) de la forme x' = φ(x), la fonction φ est illustrée en vert.
La lettre x désigne ici une fonction de la variable réelle et f une fonction de n + 1 variables réelles. Soit F la fonction qui à x associe la fonction t ↦ f(t, x(t), x'(t), x(2)(t),..., x(n)(t)), où x(k) la dérivée kième de la fonction x. On considère l'équation F(x) = 0. Une telle équation est appelée équation différentielle.
Les solutions sont, en général, étudiées sous la « forme de Cauchy », c'est-à-dire associées à des valeurs t0 ,ξ0 ,ξ1,... ,ξn–1 telles qu'une solution vérifie :
f ( t , x , x ′ , ⋯ , x ( n ) ) = 0 avec x ( t 0 ) = ξ 0 , x ′ ( t 0 ) = ξ 1 , ⋯ , x ( n − 1 ) ( t 0 ) = ξ n − 1
La situation est un peu analogue à celle des équations polynomiales. Il existe une théorie des équations différentielles50. Un premier résultat global est le théorème de Cauchy-Lipschitz, qui garantit que si f est une fonction lipschitzienne, il existe une unique solution au problème de Cauchy. Résoudre le problème de Cauchy consiste à déterminer la solution d'une équation différentielle vérifiant une condition initiale donnée51. Dans certains cas particuliers, il est possible d'expliciter directement une solution, comme pour l'équation différentielle d'ordre un à variables séparées ou l'équation différentielle linéaire, mais pas toujours.
L'exemple de droite illustre une solution d'une équation de la forme x' = φ(x), où la solution recherchée est une fonction définissant une courbe du plan. Sa variable est réelle et elle est à valeurs dans R2. La fonction φ est une fonction continue de R2 dans lui-même. À chaque point du plan, elle associe un vecteur ; on dit qu'elle définit un champ vectoriel. Une solution s possède la propriété d'avoir, pour chaque point p de son image, une tangente à sa courbe de direction φ(p). La vitesse scalaire à l'instant tNote 19 est égale à la norme de l'image par φ du point s(t).
Équation aux dérivées partielles
L'équation régissant la surface de la mer est une équation aux dérivées partielles.
La physique propose divers exemples où la solution recherchée ne dépend pas d'une mais de plusieurs variables. Un cas relativement simple est celui d'une onde sur une corde vibrante. La fonction décrivant sa position dépend de deux paramètres, le temps et une coordonnée pour décrire un point de la corde. Trois variables sont nécessaires pour décrire une vague, deux décrivent la position d'un point de la surface et la troisième le temps. En physique quantique, la relation fondamentale de la dynamique se traduit par une équation d'onde qui nécessite quatre variables, trois pour l'espace et une pour le temps. Ce principe fondamental est appelée équation de Schrödinger.
L'équation équivalente à celle du paragraphe précédent, pour une fonction x de plusieurs variables, porte le nom d'équation aux dérivées partielles. L'équivalent du problème de Cauchy s'exprime de manière plus complexe. la condition initiale est remplacée par les conditions aux limites. Dans certains cas on recherche comme solution une fonction définie sur Ωx[a, b] où Ω est un ouvert que l'on suppose borné, connexe et dont la frontière ∂Ω est régulièreNote 20, [a, b] est un intervalle qui représente le temps. Les conditions aux limites s'expriment sous forme de deux contraintes. L'une correspond à la valeur ou la limite de la fonction sur ∂Ω×]a, b[. La fonction modélisant les mouvements d'une membrane de tambour est constante à la limite de la membrane, cette contrainte est appelée la condition aux limites de Dirichlet. Les valeurs de la fonction sur Ωx{a} sont appelées la condition initiale ou donnée de Cauchy52.
En météorologie, la prévision numérique du temps consiste à modéliser les mouvements de l'atmosphère terrestre par les équations de Navier-Stokes53. Une difficulté pratique est de déterminer précisément la donnée de Cauchy : il faudrait mesurer la température, la pression, le taux d'humidité etc en tout point de l'atmosphère. Cette difficulté, ajoutée au fait qu'on ne sait pas résoudre ces équations de manière analytiqueNote 21 font que les méthodes de résolution utilisées sont numériques : on ne peut calculer que des valeurs approchées54.
Certaines équations aux dérivées partielles ne sont pas aussi complexes. Fourier, un mathématicien du début du XIXe siècle avait trouvé comment la chaleur se diffuse dans un corps solide dans le cas de conditions aux limites simples55. La spécificité de cette équation, comme celle décrivant les ondes se propageant sur une corde vibrante est d'être linéaire, c'est-à-dire que l'on peut la mettre sous la forme a(x) + b = 0, où a est un opérateur linéaire construit à l'aide de dérivées partielles et b une fonction particulière. Le cas linéaire est traité par une théorie « relativement bien constituée »56. L'outil principal est un espace fonctionnel particulier, dit de Sobolev.
D'autres équations restent difficiles d'accès. La surface d'un océan est aussi modélisée par une équation aux dérivées partielles. Comme le laisse penser la forme d'une vague, l'expression d'une solution peut s'avérer difficileNote 22. On est loin de disposer d'une théorie générale57, les deux paragraphes suivant indiquent le type de difficulté à résoudre pour comprendre les systèmes dynamiques.
Condition initiale
Une des questions qui se pose sur les systèmes dynamiques est la nature de la solution en fonction de sa valeur initiale. Si une petite modification de cette valeur change de manière importante le comportement de la solution, même si le système est déterministe, son évolution semblera aléatoire. Si "déterministe" signifie que toute évolution du système dépend uniquement de sa valeur initiale, sa connaissance parfaite permet de prévoir parfaitement son futur, ce qui est toujours le cas d'un système dynamique idéalisé. En physique, il est impossible de connaître parfaitement l'état initial du système. On le connaît, par exemple avec une précision de 5 décimales, si la sixième décimale finit par modifier l'évolution du système de manière significative, le futur de l'évolution n'est pas connu (il est même indéterminable), mais dépend d'une information inaccessible parce qu'idéalisée. Le futur apparaît alors comme incertain, même si les lois modélisant l'évolution sont "déterministes". On voit donc ici les limites de la modélisation. Ce phénomène se produit en météorologie, cette science est modélisée par un système dynamique qui, pour permettre une prévision sur le long terme, demande une connaissance précise de l'état initial. Comme cette connaissance est d'une précision limitée, il existe un horizon (ou plutôt des horizons plus ou moins divergents) dans la prévision58. Si l'équation modélisant la météorologie est bien connue, on ne sait toujours pas si les solutions dépendent continûment de valeurs aux bornes du domaine de la solution (l'équivalent de la condition initiale pour une équation aux dérivées partielles), cette question est associée à l'un des sept prix de un million de dollars offerts par l'Institut de mathématiques Clay au premier qui apportera la réponse59.
Une méthode pour apporter des éléments de réponse, est d'étudier les cas les plus simples possibles. On cherche à comprendre ce phénomène sur une suite récurrente définie par l'équation : xn+1 = f(xn) où f est un polynôme du second degré, réel ou complexe. Un cas très étudié est celui où f(x) = x2 + c. La condition initiale est ici la valeur de x0, un nombre complexe. Jc est l'ensemble des conditions initiales telles que la suite est bornée, il est appelé ensemble de Julia, dont un exemple est illustré sur la figure de gauche. Toute condition initiale p hors de la frontière de Jc possède un voisinage ne contenant que des conditions initiales dont le comportement des suites sont qualitativement analogues. Les couleurs indiquent les valeurs de convergence, l'intensité symbolise la vitesse de convergence60.
Une première question qui se pose est le poids de la zone frontière. Sur cette zone, il existe toujours une perturbation de la condition initiale, aussi minime soit-elle, qui modifie la nature de la solution. Dans les configurations classiques, une frontière d'une figure géométrique de dimension 2 est d'aire nulle, même si la figure possède une aire strictement positive. Ainsi, un disque de rayon strictement positif est d'aire strictement positive et sa frontière, un cercle de même rayon, est d'aire nulle. En revanche, le cercle, considéré comme une courbe, possède une longueur finie. Pour la frontière de l'ensemble de Julia, cette méthode s'avère parfois inopérante, on peut trouver une longueur infinie, si la frontière est considérée comme une courbe61. Pour évaluer le poids de cette longueur, on utilise une remarque géométrique. Soit S une surface d'aire s, l'homothétie de rapport 2 appliquée à S, définit une nouvelle surface d'aire 22s. Si V est une figure géométrique de dimension 3 et de volume v, l'homothétie de rapport 2 définit une figure de volume 23v. L'exposant que l'on applique au rapport de l'homothétie indique la dimension de la figure, ce qui, d'une certaine manière permet une évaluation du poids de la figure, on parle de dimension de Hausdorff ou de dimension fractale62. Cette technique peut être appliquée à la frontière de l'ensemble de Julia, sa dimension est génériquement différente de un63 : la frontière est dite fractale64.
Chaos
Une suite récurrente, même définie de manière simple, permet de voir l'apparition d'un phénomène chaotique.
La sensibilité à la condition initiale n'est pas l'unique question à résoudre pour élaborer une théorie générale des systèmes dynamiques. On souhaite aussi connaître le comportement limite du système, encore appelé comportement asymptotique, c'est-à-dire ce qu'il se passe une fois que l'on a attendu que le système se stabilise. S'il ne diverge pas, on peut classer son comportement en trois catégories, soit le système s'immobilise, soit il tend vers un cycle, soit vers encore autre chose qui, selon certaines définitions, est appelée chaos65.
Une fois encore, il est utile de considérer le système dynamique le plus simple possible, pour comprendre au moins qualitativement les mécanismes en jeu. Comme précédemment, on utilise une suite récurrente définie par un polynôme du second degré Pr, cette fois-ci réel à valeurs réelles. La suite logistique est définie par récurrence : xr,n+1 = r xr,n(1 – xr,n). L'un des charmes de cette suite est que son comportement est relativement indépendant de la condition initiale si elle est choisie entre 0 et 1Note 23.
Les
turbulences générées par les masses d'air autour d'une aile d'avion en mouvement sont chaotiques.
L'objectif est d'augmenter la valeur de r, initialement nulle et d'étudier ce comportement asymptotique. Si une fonction f possède un point fixe pf, de dérivée strictement comprise entre –1 et 1, en valeur absolue, et si la suite définie par xn+1 = f(xn) prend une valeur proche de ce point fixe, elle converge vers pf. Ce point est dit attracteur et la zone des valeurs initiales dont les suites convergent vers ce point est appelée bassin d'attraction. Pour une suite logistique le bassin d'attraction principal contient toujours ]0, 1[, à un ensemble négligeable près, quelle que soit la valeur de l'attracteur. La suite semble être attirée, comme par un aimant vers cet attracteur. Si r est compris entre 0 et 3, l'attracteur est un point et la suite converge. À partir de la valeur 3, le polynôme Pr ne possède plus de point fixe, mais le polynôme composé avec lui-même, en possède un, si r est suffisamment petit. Le comportement asymptotique de la suite est une oscillation entre les deux points fixes attractifs de Pr2. La valeur 3 de r est appelée une bifurcation. L'attracteur devient un ensemble à deux éléments, illustré sur la figure de droite. Au point 1 + √6, une nouvelle bifurcation se produit, l'attracteur possède alors 4 points. Le cardinal de l'attracteur augmente de plus en plus en fonction de r par des doublements, jusqu'à atteindre une valeur infinie pour r égale à μ, qui se situe aux alentours de 3,5766.
Il devient nécessaire de préciser ce qu'on entend par « attracteur » : ce sera l'intersection des ensembles An où An est l'adhérence des points x k pour k supérieur à n. Dans le cas de la suite logistique et à l'exception d'un ensemble de mesure nulle, l'attracteur est indépendant de la condition initiale. On peut voir l'attracteur Ar comme un ensemble qui attire les éléments de la suite, laquelle, à partir d'un certain rang, devient arbitrairement proche de A. Entre μ et 4, un triple comportement est possible. Pour un ensemble H (pour hyperbolique67) de valeurs du paramètre r qui est un ouvert dense de [μ, 4], l'attracteur est un ensemble fini68 (comportement cyclique). Pour un autre ensemble C (pour chaotique67) de valeurs du paramètre, qui est lui fermé, totalement discontinu et de mesure strictement positive, pour presque toutes valeurs initiales x0 (dépendant de r) l'attracteur est un intervalle d'intérieur non vide et le comportement est chaotique69, c'est-à-dire qu'il évolue sans ordre apparent, à l'exception d'un ensemble de mesure nulle, semblant évoluer au gré du hasard, même si cette évolution est en fait déterministe. Le dernier comportement se produit sur l'ensemble A, complémentaire de l'union de C et de H dans [μ, 4]. L'ensemble A n'est pas vide, le comportement est alors plus complexe et fait intervenir, comme attracteur, des ensembles de CantorNote 24. Depuis 2002, on sait que A est de mesure nulle70.
Ce comportement s'applique aussi aux équations différentielles ou aux dérivées partielles. Edward Lorenz a trouvé une équation différentielle relativement simple, ayant un attracteur fractal, généralement qualifié d'étrange, il est représenté sur la deuxième illustration de cet article71. Certaines équations différentielles ne peuvent avoir de solutions si complexes, le théorème de Poincaré-Bendixson montre une famille d'équations n'ayant pas de comportement chaotique72. Des solutions chaotiques complexes apparaissent aussi dans les équations aux dérivées partielles, on les trouve dans les modélisations des mouvements des masses d'air, par exemple autour des ailes d'avion, elles prennent la forme de turbulences. En 2009, l'état des mathématiques est loin d'être capable de présenter une condition nécessaire et suffisante générale, indiquant si oui ou non un comportement chaotique apparaît, même dans le cas des systèmes discrets.
Voir aussi
Sur les autres projets Wikimedia :
Articles connexes
Bibliographie
- Jean-Pierre Aubin, Analyse fonctionnelle appliquée, PUF, (ISBN 978-2-13039264-4)
Ce livre aborde l'analyse fonctionnelle sous un aspect didactique. Le choix, que l'auteur commente ainsi « ... pour garder la longueur de l'exposé dans les limites raisonnables, nous avons choisi de nous placer dans le seul cadre des espaces de Hilbert. » est essentiellement repris dans l'article pour la rédaction du paragraphe sur l'analyse fonctionnelle.
- Marcel Berger et Bernard Gostiaux, Géométrie différentielle : variétés, courbes et surfaces [détail des éditions]
Cette référence traite de la géométrie, de manière plus complète et moins accessible que
Trignan 2004. L'objet central de l'étude est la
variété différentielle ; on traite aussi des courbes avec une étude globale et des résultats comme le
théorème de Jordan. Ce livre complète les informations des paragraphes sur la géométrie : il traite des théories plus sophistiquées comme les variétés ou la théorie du degré.
- Claude Brezinski et Michela Redivo-Zaglia, Méthodes numériques itératives : Algèbre linéaire et non linéaire, Ellipses Marketing, (ISBN 978-2-72982887-5)
Ce livre traite à la fois de l'aspect théorique et pratique des méthodes de résolution d'équations. L'algèbre linéaire n'est pas en reste, mais on trouve aussi comment aborder des problèmes un peu différents, en particulier issus de la géométrie fractale. Cette référence couvre très largement l'intégralité des informations présentées pour la résolution par approximation des équations réelles ou vectorielles dans le cas de la dimension finie.
- Haïm Brezis, Analyse fonctionnelle : théorie et applications [détail des éditions]
Cette introduction à l'analyse fonctionnelle est souvent citée comme référence à la fois accessible et riche. Elle choisit une présentation plus générale et moins didactique, en commençant directement par les propriétés d'un
espace de Banach. L'exemple du paragraphe sur l'analyse fonctionnelle, ainsi que le vocabulaire, provient de cette référence.
- (en) David A. Cox, Primes of the Form x2 + ny2, Wiley-Interscience, (ISBN 978-0-47119079-0, lire en ligne [archive])
Cette référence est très spécialisée. Ce livre de plus de 300 pages traite exclusivement de la résolution des équations diophantiennes du deuxième degré. Avec
Samuel, il est très largement à l'origine du paragraphe « Équation diophantienne ».
- Régine et Adrien Douady, Algèbre et théories galoisiennes [détail des éditions]
Un livre qui permet d'aller plus loin pour comprendre le traitement d'une équation algébrique. On y trouve l'exemple illustré par la figure ainsi qu'une formulation du
théorème de d'Alembert-Gauss. Son niveau, jugé trop élevé pour l'article, n'est pas à l'origine des idées exprimées dans le paragraphe associé, même s'il a été consulté pour des points de détail.
- Jacques Dubois et Jean Chaline, Le monde des fractales, Ellipse, (ISBN 978-2-72982782-3)
À la différence des autres ouvrages de référence, celui-là n'est pas universitaire. Son auteur Jacques Dubois, Professeur émérite à l'Institut de Physique du Globe de Paris, a choisi ici une approche didactique sur la sensibilité aux conditions aux limites, reprise par l'article. Cette approche est abordée dans son livre sous l'axe des ensembles de Julia et l'étude de leurs dimensions, à l'image du paragraphe sur la condition initiale.
- (en) Y. V. Egorov et M. A. Shubin (en), Foundations of the Classical Theory of Partial Differential Equations, Springer-Verlag, 2e éd., 1998 (ISBN 978-3-54063825-4) [lire en ligne [archive]]
Un livre technique sur les équations aux dérivées partielles, traitant surtout du cas linéaire. Pour être compris, il suppose un bon niveau en mathématiques. L'expression des résultats fait usage de concepts trop sophistiqués pour qu'ils soient véritablement présentés dans l'article.
- Niels Ferguson et Bruce Schneier, Sécurité de l'information et des systèmes : Cryptographie : En pratique, Vuibert, 2004 (ISBN 978-2-71174820-4)
Cette référence décrit divers systèmes de cryptographie dont RSA. Elle n'a pas été consultée pour la rédaction de l'article.
- Tatiana Roque, Sara Franceschelli et Michel Paty, Chaos et systèmes dynamiques, Hermann, 2007 (ISBN 978-2-70566687-3)
Ce livre définit et étudie les systèmes dynamiques, particulièrement sous la forme d'équations différentielles, même si les équations aux différences finies ou aux dérivées partielles ne sont pas absentes. Les exemples choisis dans l'article comme la météorologie ou l'évolution du système solaire sont traités dans ce livre, qui pousse l'étude à un niveau beaucoup plus élevé que celui de l'article.
- (en) G. H. Hardy et E. M. Wright, An Introduction to the Theory of Numbers (1re éd. 1938) [détail des éditions]
Cette référence est généraliste. Elle couvre non seulement les informations données sur les équations diophantiennes, même si elle n'a pas été consultée dans cette optique, mais développe aussi des méthodes d'
approximation diophantienne permettant de savoir si un nombre est un rationnel, un entier algébrique ou un nombre transcendant. Ce livre contient les informations du paragraphe sur les nombres algébriques et transcendants.
- John H. Hubbard et Beverly H. West, Équations différentielles et systèmes dynamiques, Vuibert, 1999 (ISBN 978-2-84225015-7)
Une référence très accessible sur l'étude des systèmes dynamiques. L'approche qualitative, ainsi que les simulations sur ordinateurs sont fréquentes, car il est rare de pouvoir exprimer une solution sous une forme explicite. Il couvre l'intégralité des informations du paragraphe sur les équations différentielles. On y trouve la définition d'équation différentielle ainsi que le théorème de Cauchy avec sa démonstration, et l'étude de la « forme de Cauchy ». À l'image de cette référence, l'article étudie surtout les équations différentielles sous l'angle des systèmes dynamiques.
- David C. Lay, Algèbre linéaire, De Boeck, (ISBN 978-2-80414408-1, lire en ligne [archive])
Une référence qui traite des équations linéaires, à la fois sous forme de système et de géométrie vectorielle. Il couvre l'intégralité des informations de nature mathématique données dans les deux paragraphes sur l'équation linéaire.
- Jean Merker, Du trinôme du second degré à la théorie de Galois, Presses universitaires de Franche-Comté, 2007 (ISBN 978-2-84867205-2) [lire en ligne [archive]]
En supposant un acquis nul, mais une bonne capacité de compréhension, l'auteur parcourt l'essentiel de la théorie des équations, au sens historique du terme. Ce livre couvre le paragraphe « Théorie des équations ».
- Alfio Quarteroni, Riccardo Sacco et Fausto Saleri, Méthodes Numériques Algorithmes, analyse et applications, Springer (ISBN 978-8-84700495-5) [lire en ligne [archive]]
Ce livre aborde des techniques d'analyse numérique qui dépassent le cadre strict de l'équation linéaire. Il vise un public d'étudiants de deuxième et troisième cycle universitaire. Ce livre approfondit les résultats de
Lay 2004, mais cet approfondissement n'est pas retranscrit dans l'article.
- (en) R. Clark Robinson, An Introduction to Dynamical Systems, Prentice Hall, 2004 (ISBN 978-0-13143140-9) [lire en ligne [archive]]
Ce gros livre de plus de 600 pages traite des systèmes dynamiques non linéaires, sous forme d'équations différentielles et d'équations aux différences finies. Seule, la deuxième partie, traitant des différences finies, a été consultée. L'exemple de la
suite logistique, abordé dans le paragraphe
Chaos, est précisément décrit.
- Pierre Samuel, Théorie algébrique des nombres [détail de l’édition]
Comme son nom l'indique, cette référence offre un accès à la théorie algébrique des nombres. Elle présente les outils de base pour la résolution de quelques équations diophantiennes à l'aide d'outils comme les
entiers algébriques. Il est, avec
Cox 1989, à l'origine de la rédaction du paragraphe « Équation diophantienne ».
- (en) Jean-Pierre Serre, Lectures on the Mordell-Weil Theorem, Friedrick Vieweg & Son, 1997 (ISBN 978-3-52828968-3)
Ce petit livre (218 pages) montre comment la géométrie algébrique permet de résoudre des équations diophantiennes, il est d'un niveau nettement supérieur aux précédents et couvre le paragraphe sur l'usage de la géométrie algébrique en théorie des nombres, même si le paragraphe est rédigé pour être accessible à un vaste public, alors que cette référence ne l'est pas.
- Jean Trignan, Constructions géométriques & courbes remarquables, Vuibert, (ISBN 978-2-71177124-0)
Ce livre traite de la géométrie et fait largement usage des techniques issues de la
géométrie analytique. On y trouve l'étude des courbes paramétrées, une étude des coniques ou encore la résolution de l'équation algébrique par l'intersection d'un cercle et d'une parabole. Cette référence, plutôt didactique, couvre les aspects élémentaires des deux paragraphes sur la géométrie.
Notes
- En termes modernes, on remarque que la fonction est continue et définie sur un compact, ce qui montre l'existence d'un sommet (cf. l'article « Théorème isopérimétrique »).
- Le raisonnement de l'époque consistait à montrer que toute solution est nécessairement un triangle dont deux côtés adjacents sont de longueurs égales. Ce résultat montre l'unicité d'une éventuelle solution, mais pas son existence. François Dress indique p. 43 : « O. Perron a fait observer que le même schéma de démonstration prouverait que "le nombre 1 est le plus grand nombre entier", puisqu'à tout nombre entier a différent de 1 on peut en effet associer un nombre entier plus grand, son carré a2. Cet argument montre seulement que le nombre 1 est le seul candidat possible, et l'erreur de cette "démonstration" est évidemment qu'ici le maximum n'existe pas. » F. Dress et al., « Quelques grands problèmes en mathématiques [archive] », Bulletin de la Société mathématique de France, vol. 115, 1987, p. 35-57.
- Une démonstration se trouve dans l'article « Isopérimétrie ».
- Cette équation peut servir d'exemple introductif, elle est intégralement traitée dans le site vidéo : « Équation du second degré paramétrée »(Archive.org • Wikiwix • Archive.is • http://www.kewego.fr/video/iLyROoaft5ZT.html" rel="nofollow" class="external text">Google • Que faire ?) Exercice de mathématiques Terminale S.
- Le mot analogue signifie ici en termes techniques : exprimable sous forme de radicaux. Pour plus de détails, voir l'article « Théorème d'Abel ».
- La méthode est encore efficace si son opposé, c'est-à-dire 〈ax,y〉, est un produit scalaire.
- Le terme « optimal » signifie ici soit un maximum, soit un minimum.
- Les détails des calculs sont accessibles en vidéo pour un exemple analogue sur le site : Équation du cercle [archive] par vidéomaths.
- Les informations contenues dans ce paragraphe sont disponibles sur le site : La naissance de la géométrie analytique : la Géométrie de Descartes (1637) [archive], IREM de Rennes.
- Pas moins d'un livre de 350 pages est nécessaire pour traiter tous les cas : Cox 1989.
- Pour plus de détails, voir l'article « Racine carrée de deux ».
- « Même famille » ne signifie pas que Wiles utilise le théorème de Faltings, pour sa démonstration. Pour comprendre les travaux de Faltings, on peut se reporter à : D. Ara, Conjecture de Mordell-Lang relative [archive], d'après Hrushovski, École Normale Supérieure. Pour comprendre la preuve originale de Wiles voir (en) A. Wiles, « Modular elliptic curves and Fermat's last theorem [archive] », Annals of Mathematics, vol. 141, no 3, 1995, p. 443-551.
- Newton a développé initialement sa méthode pour les équations algébriques indépendamment de leur caractères résolubles : I. Newton De analysi per aequationes numero terminorum infinitas écrit en 1669 et publié en 1711 par William Jones.
- Toutes ces méthodes sont présentées et analysées dans Brezinski et Redivo-Zaglia 2006.
- On trouve une courte introduction à l'analyse fonctionnelle dans la référence de cette note. Elle commence par l'étude des espaces de Hilbert (chap. 8, p. 147) et termine par celle de l'opérateur de Fredholm (chap. 9, p. 203) : Serge Lang, Analyse réelle, InterEditions, Paris, 1977 (ISBN 2729600590).
- Initialement, « Le directeur de l’Observatoire de Paris, Jean-Dominique Cassini, semble ignorer les théories de Newton et de Halley. » 50 ans plus tard, son fils Jacques se rallie à la conception newtonienne et héliocentrique du système solaire. Il écrit : « ...nous n’avons pas cru devoir nous écarter du sentiment le plus communément reçu des Astronomes, que ce sont des Planètes qui font leurs révolutions autour du Soleil, à l’égard duquel elles [les comètes] décrivent des Orbes fort excentriques. » F. Michel, Les comètes observées en France au début du XVIIIe siècle [archive].
- Ce n'est que la formulation qui est plus simple. On attribue à Birkhoff l'affirmation suivante : « Le continu, c’est plus simple que le discret » : Daniel Perrin, La suite logistique et le chaos [archive], Université Paris-Sud 11 Orsay, p. 8.
- Si l'on souhaite ne pas négliger l'influence des planètes, l'équation différentielle devient complexe : P. Iglesias, « Les origines du calcul symplectique chez Lagrange [archive] », Le journal de maths des élèves de l'École normale supérieure de Lyon.
- La vitesse scalaire correspond à la norme de la dérivée de φ, ou encore, pour une automobile, au scalaire précisé par l'indicateur de vitesse.
- Ces hypothèses de régularité du domaine ne sont pas générales ; on étudie parfois des domaines dont la frontière est une fractale. Un article célèbre à ce sujet est (en) M. Kac, « Can you hear the fractal dimension of a drum? », Amer. Math. Month., vol. 73, 1966, p. 1-23.
- On ignore même si elles possèdent des solutions acceptables (ne présentant pas de singularités) ; c'est le sujet de l'un des problèmes du prix du millénaire.
- Une étude de la dynamique des vagues est proposée dans (en) D. J. Acheson, Elementary Fluid Dynamics, Oxford University Press, 1990 (ISBN 0198596790), p. 56-110.
- Une étude simple est proposée dans Perrin, op. cit.
- Pour comprendre le comportement un peu étrange de la suite dans ce cas particulier, on peut se reporter au gros livre de plus de 600 pages, traitant des questions de cette nature : (en) Welington de Melo (de) et Sebastian van Strien, One-Dimensional Dynamics, Springer, 1996 (ISBN 978-3-54056412-6).
Références
- Cette équation provient du livre de Recorde (en) The Whetstone of Witte, publié en 1557,p. 237 [archive] . Voir à ce sujet (en) John J. O'Connor et Edmund F. Robertson, « Robert Recorde », dans MacTutor History of Mathematics archive, université de St Andrews (lire en ligne [archive])..
- Cette définition s'inspire de Gilles Lachaud, « Équation, mathématique », dans Encyclopædia Universalis (lire en ligne [archive]).
- Une autre source propose une définition du même esprit : « A statement of equality between two expressions. Equations are of two types, identities and conditional equations (or usually simply "equations") ». (en) « Equation », dans Mathematics Dictionary, Glenn James (de) et Robert C. James (de) (éd.), Van Nostrand, 1968, 3e éd. (1re éd. 1948), p. 131.
- Voir, par exemple la définition proposée dans l'article « Inéquation » de l'encyclopédie en ligne Encarta.
- C'est le cas par exemple, pour certaines équation étudiés dans l'enseignement pré-universitaire : Équations - Inéquations [archive] par L. Pecqueux, sur le site mathocollege.free.
- (en) The Algebra of Mohammed Ben Musa, edited and translated by Frederic Rosen, 1831 [lire en ligne [archive]], p. 104.
- (en) « Equation », dans Michiel Hazewinkel, Encyclopædia of Mathematics, Springer, (ISBN 978-1556080104, lire en ligne [archive]) - An updated and annotated translation of the Soviet Mathematical Encyclopaedia, Reidel, 1988, vol. 3 (ISBN 1556080107), p. 399. L'article, non signé, précise être « basé sur l'article du même nom de la Grande Encyclopédie Soviétique. »
- On trouve encore une définition ou l'idée de question est sous-jacente dans l'article « équations » d'Encarta : « égalité entre deux expressions mathématiques dont on cherche si elle est vérifiée pour certaine(s) valeurs(s) de la variable appelée inconnue. »
- Voir par exemple : Équation cartésienne d'un cercle dans le plan [archive], sur le site homeomath.
- J. P. Guichard CultureMATH. François Viète ENS Ulm Paris (2007) (partiellement disponible sur Viète inventeur de l'algèbre nouvelle [archive])
- Cet exemple s'inspire de F. Vandebrouck, Introduction de la notion de paramètre au lycée [archive], IREM de Paris VII, 2008.
- Ce résultat est attribué à Zénodore au IIe siècle av. J.-C. : (en) Paul J. Nahin, When Least Is Best: How Mathematicians Discovered Many Clever Ways to Make Things as Small (or as Large) as Possible, Princeton University Press, 2007 (ISBN 978-0-69113052-1), p. 47 [archive].
- L'analyse numérique est un large domaine qui traite en particulier la résolution d'équations de différente nature, en page 2 de cette référence, on trouve : « Ce cours est une introduction aux méthodes d'analyse numérique ... afin de résoudre les équations algébriques ou différentielles » : P. Viot, Méthodes d'analyse numérique [archive] (cours en ligne d'un bon niveau mathématique DEA).
- L'usage d'une notation indiquant une indéterminée plutôt qu'une variable n'est pas rare en algèbre ; c'est ainsi qu'est définie l'équation polynomiale dans : Laurent Lafforgue, « La théorie de Galois et l’arithmétique [archive] », images des Maths, CNRS, 2004.
- Voir à ce sujet P. Freguglia, « Sur la théorie des équations algébriques entre le XVIe et le XVIIe siècle », Bollettino di storia delle scienze matematiche, vol. 14, no 2, 1994, p. 259-298.
- Il existe plusieurs formulations de ce théorème. Dans R. et A. Douady, p. 283, il est formulé par : « Le corps ℂ des nombres complexes est algébriquement clos. » Les énoncés ont l'air différents mais l'article « Théorème de d'Alembert-Gauss » montre que les deux sont équivalents.
- Niels Henrik Abel, Mémoire sur les équations algébriques, où l'on démontre l'impossibilité de la résolution de l'équation générale du cinquième degré 1824.
- Évariste Galois, « Sur les conditions de résolubilité des équations algébriques », Journal de Liouville, 1846.
- On le trouve par exemple encore à la fin du XIXe siècle : Charles-Ange Laisant, « Démonstration nouvelle du théorème fondamental de la théorie des équations [archive] », Bulletin de la S.M.F., vol. 1, 1887.
- On la trouve dans l'article de Christian Gilain, « Sur l'histoire du théorème fondamental de l'algèbre: théorie des équations et calcul intégral », Archive for History of Exact Sciences, vol. 42, no 2, p. 91-136.
- Elle est utilisée dans l'article « équations, théorie des » d'Encarta.
- V. F. Bayart, Méthode du pivot de Gauss [archive], sur bibmath.net, précise : « Ces formules ne sont cependant jamais utilisées en pratique car elles conduisent à des calculs beaucoup plus longs que la méthode du pivot de Gauss ».
- Karine Chemla et Guo Shuchun, Les neuf chapitres : Le classique mathématique de la Chine ancienne et ses commentaires [détail de l’édition].
- A. Gazagnes, « Un problème de restes et sa résolution par Qin Jiushao au XIIIe siècle », dans Bulletin de l'APMEP, no 444, 2003, p. 51-62.
- N. Soualem, La méthode du gradient conjugué [archive], 2005, sur le site math-linux.
- On trouve une définition générale de la géométrie analytique dans : Géométrie analytique [archive], sur le site science.ch.
- La théorie du degré est traitée p. 262 à 296 de manière plus poussée dans Berger Gostiaux.
- Le site suivant définit et montre des exemples d'équations cartésiennes : N. Drakos et R. Moore, Équation cartésienne [archive] du site geothalg.
- Ce vocabulaire ainsi qu'un exemple illustré sont présents dans la vidéo Équation paramétrique de droite spatiale par S. Maniez, sur le site videomath. On trouve aussi ce vocabulaire dans des documents plus académiques où l'on trouve « Elles possèdent l'avantage d'avoir une équation paramétrique » : L. Garnier et S. Foufou, Détermination des équations implicites d'une supercyclide [archive], LE2I CNRS UFR Sciences, Université de Bourgogne.
- Une analyse locale de la représentation des sous-variétés de Rn est traitée dans Berger Gostiaux p. 56 et 101. Le cas des courbes plus générales que des sous-variétés de dimension 1 est traité localement p. 300-333 et de manière globale p. 334-372.
- Voir à ce sujet : La première inconnue [archive] par l'IREM de Poitiers, p. 27.
- Ce terme est fréquent, on le trouve par exemple à : J. Dieudonné et Pierre Dugac, Abrégé d'histoire des mathématiques, 1700-1900, Hermann (édition de 1996) (ISBN 2705660240), p. 227 dans l'édition de 1986.
- D. Richard, « Algorithme d'Euclide et équations diophantiennes » [archive], Université de Clermont1.
- (en) R. Rivest, A. Shamir et L. Adleman, « A Method for Obtaining Digital Signatures and Public-Key Cryptosystems [archive] », Communications of the ACM, vol. 21, no 2, 1978, p. 120-126.
- Cette question est traitée dans : B. Rittaud, Le fabuleux destin de √2, Le Pommier, 2006 (ISBN 2746502755). On trouve aussi une référence plus académique : (en) Tom M. Apostol, « Irrationality of The Square Root of Two — A Geometric Proof », The American Mathematical Monthly, vol. 107, no 9, novembre 2000, p. 841–842.
- La première preuve, comportant encore des lacunes au sens de la rigueur demandée pour les preuves actuelles, se trouve dans la référence : Johann Heinrich Lambert, « Mémoire sur quelques propriétés remarquables des quantités transcendantes circulaires et logarithmiques », Mémoires de l'Académie des sciences de Berlin, vol. 17, 1761, p. 265-322.
- Cette transcendance est montrée pour la première fois dans (de) Karl Weierstrass, « Zu Hrn. Lindemanns Abhandlung: 'Über die Ludolph'sche Zahl' », Sitzungber. Königl. Preuss. Akad. Wissensch. zu Berlin, vol. 2, 1885, p. 1067-1086.
- Pour les détails de l'histoire de cette équation sous une forme vulgarisée, voir : Simon Singh, Le Dernier Théorème de Fermat, Hachette Littérature, 1999 (ISBN 978-2-01278921-0) ; une version plus académique est : (en) H. M. Edwards, « The background of Kummer's proof of Fermat's Last Theorem for regular primes », Arch. History Exact Sci., vol. 14, 1975.
- Ce site montre comment chercher le nombre de zéros, les intervalles les contenant, ainsi que des méthodes d'approximations dans un premier temps pour des polynômes, puis pour des fonctions quelconques : J. P. Calvi Thèmes d'analyse numérique [archive], Laboratoire de mathématiques Émile Picard, Université Paul-Sabatier.
- Ce site définit et présente la méthode du point fixe ; il étudie aussi sa vitesse de convergence : Point fixe, et théorèmes du point fixe [archive] par V. et F. Bayart, sur bibmath.net.
- Ce site présente la méthode de Newton et analyse sa vitesse de convergence : Antoine Chambert-Loir, Autour de la méthode de Newton [archive], Université de Rennes I.
- Ce site présente la méthode de Newton et de quasi-Newton et explique pourquoi la méthode de quasi-Newton est plus rapide : R. Tapiero, Méthodes newtoniennes [archive], Université de Lyon I.
- Cette approche est commune à Aubin 1987 et Brezis.
- On trouve le nom de cette équation ainsi qu'une étude dans Brezis, p. 99.
- Le complété de l'espace Hp est construit dans Aubin 1987, vol. 1, chap. 6, p. 142-168.
- C'est ainsi que procède Aubin 1987, chap. 5, p. 117-137.
- Cette distinction est décrite de manière un plus générale, dans le contexte des espaces de Sobolev dans Brezis, p. 119.
- Cette description est largement simplifiée par rapport aux méthodes réellement utilisées, même si l'usage de suites définies par récurrence est exact : (en) M. Fouchard et al., « Methods to study the dynamics of the Oort cloud comets II : modelling the galactic tide », Lecture Notes in Physics, vol. 729, p. 271-293.
- Pour l'étude du comportement asymptotique d'un système dynamique régi par une équation aux dérivées partielles particulières, voir : Chao-Jiang Xu « Régularité des solutions d'équations aux dérivées partielles non linéaires associées à un système de champs de vecteurs [archive] », Annales de l'Institut Fourier, vol. 37, no 2, 1987, p. 105-113.
- C'est le titre choisi pour le livre de I. M. Guelfand et G. E. Chilov, Les Distributions. Tome 3 : Théorie des équations différentielles, Dunod, 1965.
- Pour une approche élémentaire, voir : V. & F. Bayart, Introduction aux équations différentielles [archive] sur bibmath.net. Pour une vision plus complète, on peut se référer au gros livre (> 600 pages) : (en) Hector O. Fattorini et Adalbert Kerber, The Cauchy Problem, Cambridge University Press, 1984 (ISBN 978-0-52109686-7) [lire en ligne [archive]].
- Ces expressions sont explicitées dans Brezis, p. 204.
- On lit « Les écoulements turbulents, et les mouvements de l’atmosphère sont particulièrement turbulents, peuvent être modélisés par les équations de Navier-Stokes » dans le site : Sur une idée de Philippe Courtier (Météo-France) et Claude Basdevant (ENS-École Polytechnique-Paris) Une météo turbulente [archive] sur le site de la SMF.
- Voir référence précédente.
- L'article original est : J. Fourier, « Mémoire sur la propagation de la chaleur dans les corps solides [archive] », Mémoires de l'Académie royale des sciences de l'Institut de France, années 1821 et 1822, t. V, p. 153 à 246, 1826.
- Cette citation provient de « Dérivées partielles - Théorie linéaire (équations aux) », dans Encyclopædia Universalis (lire en ligne [archive]).
- Universalis, Dérivées partielles, op. cit. précise : « En contraste, les équations non linéaires présentent un foisonnement de problèmes et de méthodes dont peu sont générales ».
- Ce site précise « La plus importante limitation d'un modèle est sa résolution spatiale ». Cette résolution spatiale correspond à la précision de la connaissance de l'état initial J. Poitevin et A. Beuraud, « Modélisation & Prévision numérique, § Les limites de la prévision numérique », sur Météo France (CNRM) (version du 6 juillet 2010 sur l'Internet Archive).
- Millennium Problems [archive] par le site officiel du Clay Mathematics Institute.
- On trouve l'explication de cette figure dans Dubois et Chaline 2006.
- C'est le cas si c est un réel non nul de l'intervalle ]–2, 2[ : Ensemble de Julia [archive] par C. Vercken, de l'École nationale supérieure des télécom Paris.
- Ce site étudie la suite récurrente du paragraphe et définit la dimension fractale. Elle est indiquée comme équivalente à la dimension de Hausdorff-Besicovitch dans les cas simples : Dimension fractale par J. P. Louvet, de l'université de Bordeaux I.
- Depuis 1991, on sait que cette frontière est génériquement (c'est-à-dire qu'il existe de rares exceptions) de dimension de Hausdorff égale à 2 : (en) Mitsuhiro Shishikura (en), The Hausdorff dimension of the boundary of the Mandelbrot set and Julia sets, Annals of Mathematics (2), vol. 147, no 2, 1998, p. 225-267, arXiv:math/9201282 [archive].
- Ces informations sont disponibles au paragraphe Les nombres complexes et les fractales dans Quelques informations sur les fractales par J. P. Louvet, de l'université de Bordeaux I.
- Il existe plusieurs définitions différentes. Celle choisie ici est celle que l'on trouve dans (en) R. L. Devaney, An Introduction to Chaotic Dynamical Systems, Westview Press, 2e éd., 2003 (ISBN 0813340853), p. 48-52.
- Voir par exemple Perrin, op. cit., p. 16-25.
- Perrin, op. cit., p. 43.
- Ce résultat est beaucoup plus récent : (en) Mikhail Lyubich, « Dynamics of quadratic polynomials I, II », Acta Math., vol. 178, no 2, 1997, p. 185-297.
- Ce résultat est l'œuvre de (en) M. V. Jakobson, « Absolutely continuous invariant measures for one-parameter families of one-dimensional maps », Commun. Math. Phys., vol. 81, 1981, p. 39-88.
- (en) M. Lyubich, « Almost every real quadratic map is either regular or stochastic », Ann. Math. (2), vol. 156, no 1, 2002, p. 1-78.
- V. Isoz, Équation de Lorenz [archive], Sciences.ch (Génie marin et météo).
Liens externes
Fonction (mathématiques)
Pour les articles homonymes, voir Fonction.
Diagramme de calcul pour la fonction
x ↦ 2 x − 1 x + 3
En mathématiques, une fonction permet de définir un résultat (le plus souvent numérique) pour chaque valeur d’un ensemble appelé domaine. Ce résultat peut être obtenu par une suite de calculs arithmétiques ou par une liste de valeurs, notamment dans le cas de relevé de mesures physiques, ou encore par d’autres procédés comme les résolutions d’équations ou les passages à la limite. Le calcul effectif du résultat ou son approximation repose éventuellement sur l’élaboration de fonction informatique.
Dans l’enseignement scolaire, le terme « fonction » concerne spécifiquement les fonctions réelles d’une variable réelle. De nombreuses fonctions dites usuelles sont ainsi définies comme les fonctions affines, la racine carrée ou l’exponentielle, et peuvent être combinées à l’aide des opérations arithmétiques, de la composition ou de la définition par morceaux.
Ces fonctions satisfont diverses propriétés portant sur la régularité, les variations, l’intégrabilité...
En théorie des ensembles, une fonction ou application est une relation entre deux ensembles pour laquelle chaque élément du premier est en relation avec un unique élément du second1. Parfois, on distingue la notion de fonction en affaiblissant la condition comme suit : chaque élément du premier ensemble est en relation avec au plus un élément du second.
En théorie des types, une fonction est la description de la méthode pour obtenir le résultat à partir de ses paramètres. Autrement dit une fonction est l'algorithme qui permet de la calculer.
Le terme de fonction s'utilise parfois pour des extensions de la notion comme les classes de fonctions p-intégrables ou les distributions telle la fonction de Dirac.
Vocabulaire et notations
Par défaut, une fonction est souvent notée f ou F , et si d'autres notations de fonctions sont nécessaires au sein d'un même raisonnement, on utilise en général les lettres suivantes dans l'alphabet latin, voire dans l'alphabet grec en commençant par φ ou ψ.
f ( 7 ) = 2 × 7 − 1 7 + 3 = 13 10
Calcul de la valeur en 7 de la fonction
définie par l’expression
f ( x ) = 2 x − 1 x + 3
Une fonction est souvent définie par son expression, dépendant en général d’une ou plusieurs variables, le plus souvent x ou t . En remplaçant les variables par des valeurs explicites dans l’expression, on obtient une valeur de la fonction.
Dans le cadre de l’analyse réelle, les fonctions ont des variables réelles, mais certaines valeurs réelles ne peuvent être employées dans l’expression et sont appelées valeurs interdites. C’est le cas par exemple de zéro pour la fonction inverse, car on ne peut pas diviser par zéro. Par défaut, on considère souvent que la fonction est définie partout en dehors des valeurs interdites. Cependant, on peut aussi spécifier un domaine de définition qui rassemble toutes les valeurs possibles pour les variables (assimilé à l’ensemble de départ ou source pour une application) et un ensemble d'arrivée (but) qui contient toutes les valeurs possibles de la fonction.
R ∗ → R x ↦ 1 x
Ces informations peuvent être résumées par un diagramme comme suit, où la flèche entre les ensembles source et but est une simple flèche vers la droite (→), tandis que celle entre la variable et l’expression est munie d’un taquet (↦) :
- s o u r c e → b u t v a r i a b l e ( s ) ↦ e x p r e s s i o n
ou, pour une fonction f définie sur un ensemble E à valeurs dans un ensemble F :
- E → F x ↦ f ( x )
Une fonction peut être définie par plusieurs expressions valables sur des domaines disjoints, comme la fonction valeur absolue : x ↦ { x s i x ≥ 0 − x s i x < 0
Le domaine de définition d’une fonction f est classiquement noté D f . L'ensemble image, c'est-à-dire l'ensemble des valeurs possibles pour le résultat, est alors noté im ( f ) ou f ( D f ) , et par définition inclus dans l’ensemble but. Étant donné une valeur x dans le domaine de définition, et y un élément de l’ensemble but tel que y = f ( x ) , on dit que y est l’(unique) image de x et que x est un antécédent de y . Par exemple, 9 est l'image de 3 par la fonction carré, et 3 est donc un antécédent de 9 (mais ce n'est pas le seul, puisque −3 est aussi un antécédent de 9).
Étude
Typologie
Les méthodes d'analyse des fonctions diffèrent selon la nature de la variable et du résultat. On distingue notamment :
Représentation graphique
Représentation graphique d’une fonction
f définie sur
R ∖ { − 3 } par :
f ( x ) = 2 x − 1 x + 3 .La courbe (bleue) est séparée en deux composantes par une droite verticale asymptote (rouge) d’équation
x = − 3 .
L’ensemble des couples ( x , f ( x ) ) définit le graphe de la fonction. Dans le cas d’une fonction réelle d'une variable réelle, ce graphe est inclus dans le plan R 2 et se présente comme une courbe appelée courbe représentative, sur laquelle on peut faire figurer les extrema locaux, certaines tangentes ou demi-tangentes, les asymptotes et mettre en évidence les variations et les zones de convexité ou concavité. Cette représentation permet aussi de visualiser les points d’annulation ou zéros de la fonction, son signe, et éventuellement une majoration ou minoration, sa parité et sa périodicité.
Une fonction définie par une liste de valeurs numériques peut être représentée par un nuage de points, une courbe polygonale ou un diagramme en barres.
Pour une fonction réelle de deux variables, le graphe correspond en général à une surface dans l’espace R 3 , sur laquelle on peut faire apparaitre des lignes de niveau, en utilisant éventuellement un code couleur pour mettre en évidence le relief.
Pour une fonction vectorielle ou holomorphe, on peut représenter un champ de vecteur ou utiliser la coloration de régions.
-
-
Courbe polygonale représentant une fonction définie par une série chronologique
-
Surface représentative d’une fonction de 2 variables
-
Champ de vecteurs dans le plan
-
Coloration de régions pour la fonction complexe zêta de Riemann
Modes de définition
Quatre définitions équivalentes de la fonction exponentielle
Une fonction peut être définie point par point par une expression explicite faisant intervenir d’autres fonctions de référence, des limites ou d’autres procédés algorithmiques. Il peut s’agir par exemple de la réciproque d’une autre fonction. Une même fonction peut d’ailleurs être définie par des formules différentes dont on montre l’égalité, comme dans le cas de la fonction exponentielle.
Une fonction peut aussi être définie globalement par une équation ou un système d'équations. En particulier, on définit une fonction implicite si l’ensemble des solutions d’une équation à deux inconnues x et y peut correspondre au graphe d’une fonction, c’est-à-dire si pour toute valeur de x il existe au plus une solution de la forme ( x , y ) . Une fonction peut aussi être définie de proche en proche par une équation différentielle voire une équation aux dérivées partielles, ou par récurrence dans le cas d’une fonction arithmétique.
On peut encore définir une fonction sur un ensemble dense dans un autre et étendre la définition par continuité. Ce procédé permet notamment de justifier l’existence de la courbe de Peano et d’autres fonctions continues mais nulle part dérivable. Il peut être utilisé aussi pour définir des fonctions sur un corps de nombres p-adiques.
Tous ces procédés de détermination mathématique s’accompagnent de problèmes de calcul effectif, qui s’étudient dans le cadre de l’analyse numérique.
Analyse
L’analyse mathématique s’entend le plus souvent dans l’étude d’une fonction numérique, avec la recherche de son signe et de ses variations, la détermination d’éventuels majorant ou minorant, points fixes et limites, voire le calcul de son intégrale.
Plus généralement, on peut essayer de déterminer si une fonction est injective, c’est-à-dire si tout élément de l’ensemble d’arrivée a au plus un antécédent. Dans ce cas, on s’intéresse à la détermination de l’ensemble image, car la fonction admet alors une réciproque de son ensemble image vers son ensemble de définition. La précision de l’ensemble de définition est ici cruciale, comme dans le cas de la fonction carré (qui est n’est pas injective si elle est définie sur R , mais qui l’est par restriction à l’ensemble R + ) ou de la fonction exponentielle (injective en tant que fonction d’une variable réelle, mais pas en tant que fonction d’une variable complexe).
Pour une fonction arithmétique, donc définie sur l’ensemble des entiers naturels, on s’intéresse notamment aux relations entre l’image d’un produit et les images des facteurs (surtout lorsque ceux-ci sont premiers entre eux).
Image directe et image réciproque
Étant donné un sous-ensemble A de l’ensemble de départ, l’image directe f ( A ) est l’ensemble des images des éléments de A par f. Réciproquement, étant donnée un sous-ensemble B de l’ensemble d’arrivée, sa préimage ou image réciproque f − 1 ( B ) est l’ensemble des antécédents des éléments de B par f.
Ces notions permettent notamment d’exprimer la continuité d’une fonction entre espaces topologiques, de caractériser l’existence de limites, de justifier qu’une fonction est mesurable afin de pouvoir envisager son intégrabilité.
Historique de la notion
La définition du concept de fonction a évolué depuis son introduction par Leibniz à la fin du XVIIe siècle2. Il s'agissait alors d'associer un objet à chaque point d'une courbe, par exemple la tangente. En identifiant chaque point de la courbe avec son ordonnée, Jean Bernoulli puis Euler redéfinissent ensuite ce terme pour décrire une expression composée d'une variable et d'éventuels paramètres constants (réels). Les opérations utilisées comprennent non seulement les opérations algébriques élémentaires, les séries et produits infinis mais aussi l'exponentielle, le logarithme et les lignes trigonométriques, considérés comme des opérations transcendantes.
Le lien entre l'expression d'une fonction et sa courbe représentative conduit Euler à élargir la notion en admettant des définitions par morceaux puis des courbes qui ne peuvent être obtenues par des expressions analytiques. La condition de continuité est formalisée par Bolzano et Cauchy au début du XIXe siècle. En 1829, l'étude des séries de Fourier conduit Dirichlet à considérer des fonctions plus générales, telle que l'indicatrice des rationnels3,4.
Parallèlement, le domaine de la variable s'ouvre aux nombres complexes. Au début du XXe siècle, les fonctions acceptent plusieurs variables, puis peuvent être définies sur un ensemble quelconque. Sous l'impulsion de Fréchet, la valeur d'une fonction suit la même généralisation. La théorie de l'intégration et l'analyse fonctionnelle vont plus loin en considérant des fonctions presque partout définies, nécessaires pour obtenir une structure d'espace de Banach sur les espaces Lp de fonctions p -intégrables.
En analyse complexe, le prolongement analytique des fonctions holomorphes entraîne la prise en compte de fonctions multivaluées sur l'ensemble des complexes, réalisées formellement comme des fonctions classiques définies sur une surface de Riemann.
Notes et références
- Définition que l'on trouve par exemple dans Paul Halmos, Introduction à la théorie des ensembles [détail des éditions], p. 40.
- Georges Papy, Mathématique moderne, vol. 1, Didier, , p. 315 : « Le mot de fonction a été introduit par Leibniz en 1694 ».
- Lejeune-Dirichlet, « Sur la convergence des séries trigonométriques qui servent à représenter une fonction arbitraire entre des limites données », J. reine angew. Math., vol. 4, , p. 157-169 (lire en ligne [archive]).
- Le nom de Dirichlet est associé à une définition plus moderne de fonction par Hermann Hankel. Voir (de) H. Hankel, Untersuchungen über die unendlich oft oscillirenden und unstetigen Functionen, (lire en ligne [archive]), p. 5. Sur cette évolution de la notion de fonction, on pourra lire : Imre Lakatos, Preuves et réfutations, Hermann, 1984, p. 194.
Voir aussi
Articles connexes
Bibliographie
- Christian Houzel, « Fonction (notion de) », Dictionnaire des mathématiques – algèbre, analyse, géométrie, Encyclopædia Universalis et Albin Michel, Paris, 1997.
- Stella Baruk, « Fonction », Dictionnaire des mathématiques élémentaires, Éditions du Seuil, 1995.