
La
méthode des moindres carrés, indépendamment élaborée par
Legendre en 1805 et
Gauss en 1809, permet de comparer des
données expérimentales, généralement entachées d?
erreurs de mesure à un
modèle mathématique censé décrire ces données.
Ce modèle peut prendre diverses formes. Il peut s?agir de
lois de conservation que les quantités mesurées doivent respecter. La méthode des moindres carrés permet alors de minimiser l?impact des erreurs expérimentales en « ajoutant de l?information » dans le processus de mesure.
Dans le cas le plus courant, le modèle théorique est une famille de fonctions ?(
x'';) d?une ou plusieurs variables muettes ''x, indexées par un ou plusieurs paramètres
inconnus. La méthode des moindres carrés permet de sélectionner parmi ces fonctions, celle qui reproduit le mieux les données expérimentales. On parle dans ce cas d?
ajustement par la méthode des moindres carrés. Si les paramètres
ont un sens
physique la procédure d?ajustement donne également une
estimation indirecte de la valeur de ces paramètres.
La méthode consiste en une prescription (initialement empirique) qui
est que la fonction ?(
x;
) qui décrit « le mieux »
les données est celle qui minimise la somme quadratique des déviations
des mesures aux prédictions de ?(
x''; ). Si par exemple, nous disposons de ''N'' mesures, (''yi '') ''i'' = 1, ''N les paramètres
« optimaux » au sens de la méthode des moindres carrés sont ceux qui minimisent la quantité :
:
où les
sont les
résidus'' au modèle, i.e. les écarts entre les points de mesure et le modèle . peut être considéré comme une mesure de la ''distance entre les données expérimentales et le modèle théorique qui prédit ces données. La prescription des moindres carrés commande que cette distance soit minimale.
Si, comme c'est généralement le cas, on dispose d'une estimation de l'écart-type ?
i'' du bruit qui affecte chaque mesure ''y
i, on l'utilise pour « peser » la contribution de la mesure au ?². Une mesure aura d'autant plus de poids que son incertitude sera faible:
:
Les quantités
, inverses des variances des mesures sont appelés
poids des mesures.
La quantité ci-dessus est appelée
khi carré' ou '''khi-deux. Son nom vient de la
loi statistique qu'elle décrit, si les erreurs de mesure qui entachent les ''y
i'' sont distribuées suivant une
Loi normale (ce qui est très courant). Dans ce dernier cas, la méthode des moindres carrés permet de plus d?estimer quantitativement l?adéquation du modèle aux mesures, pour peu que l'on dispose d'une estimation fiable des erreurs ?
''i. Si le modèle d?erreur est non gaussien, il faut généralement recourir à la méthode du
maximum de vraisemblance, dont la méthode des moindres carrés est un cas particulier.
Son extrême simplicité fait que cette méthode est très couramment utilisée de nos jours en sciences expérimentales. Une application courante est le
lissage'' des données expérimentales par une fonction empirique (fonction linéaire, polynomes ou splines). Cependant son usage le plus important est probablement la mesure de quantités physiques à partir de données expérimentales. Dans de nombreux cas, la quantité que l?on cherche à mesurer n?est pas observable et n?apparaît qu?indirectement comme paramètre d?un modèle théorique f(''x'', ). Dans ce dernier cas de figure, il est possible de montrer que la méthode des moindres carrés permet de construire un estimateur de , qui vérifie certaines conditions d?optimalité. En particulier, lorsque le modèle f(''x,
) est linéaire en fonction de
, le
Théorème de Gauss-Markov garantit que la méthode des moindres carrés permet d'obtenir l'estimateur non-biaisé le moins dispersé. Lorsque le modèle est une fonction non-linéaire des paramètres
l'estimateur est généralement
biaisé. Par ailleurs, dans tous les cas, les estimateurs obtenus sont extrêmement sensibles aux points aberrants : on traduit ce fait en disant qu?ils sont
non robustes. Plusieurs techniques permettent cependant de « robustifier » la méthode.
Histoire

.
Le jour du Nouvel An de
1801, l'astronome italien
Giuseppe Piazzi a découvert l'astéroïde
Cérès. Il a alors pu suivre sa trajectoire durant 40 jours. Durant cette année, plusieurs scientifiques ont tenté de prédire sa trajectoire sur la base des observations de Piazzi (à cette époque, la résolution des
équations non linéaires de Kepler de la
cinématique est un problème très difficile). La plupart des prédictions furent erronées; et le seul calcul suffisamment précis pour permettre à
Zach, un astronome allemand, de localiser à nouveau Cérès à la fin de l'année, fut celui de
Carl Friedrich Gauss, alors âgé de 24 ans (il avait déjà réalisé l'élaboration des concepts fondamentaux en 1795, lorsqu'il était alors âgé de 18 ans). Mais sa méthode des moindres carrés ne fut publiée qu'en 1809, lorsqu'elle parut dans le tome 2 de ses travaux sur la
Mécanique céleste ,
Theoria Motus Corporum Coelestium in sectionibus conicis solem ambientium. Le mathématicien français
Adrien-Marie Legendre a développé indépendamment la même méthode en 1805.
En 1829, Gauss a pu donner les raisons de l'efficacité de cette méthode ; en effet, la méthode des moindres carrés est justement optimale à l'égard de bien des critères. Cet argument est maintenant connu sous le nom du
théorème de Gauss-Markov.
Formalisme
Deux exemples simples
Moyenne d'une série de mesures indépendantes
L'exemple le plus simple d'ajustement par la méthode des moindres carrés
est probablement le calcul de la moyenne
d'un ensemble de mesures
indépendantes entachées d'erreurs gaussiennes. La prescription des moindres carrés revient à minimiser
la quantité :
:::
où les
sont les
poids des mesures
.
Cette quantité est une forme quadratique définie positive. Son minimum
se calcule par différenciation :
. Cela donne
la formule classique :
:::
Autrement dit, l'estimateur par moindres carrés de la moyenne
d'une série de mesures entachées d'erreurs gaussiennes (connues) est leur moyenne pesée, i.e. leur moyenne empirique dans laquelle chaque mesure est pondérée par l'inverse du carré de son incertitude. Le théorème de Gauss-Markov garantit qu'il s'agit du meilleur estimateur non-biaisé de
.
La moyenne estimée
fluctue en fonction des séries de mesures
effectuées. Comme chaque mesure est affectée d'une erreur aléatoire, on concoit que la moyenne d'une première série de N mesures diffèrera de la moyenne d'une seconde série de N mesures, même si celles-ci sont réalisées dans des conditions identiques. Il importe de pouvoir quantifier l'amplitude de telles fluctuations, car cela détermine la precision de la détermination de la moyenne m. Chaque mesure
peut être considérée comme une réalisation d'une variable aléatoire
, de moyenne
et de d'écart-type
. L'estimateur de la moyenne obtenu par la méthode des moindres carrés, combinaison linéaire de variables aléatoires, est lui-même une variable aléatoire :
:::
.
L'écart-type des fluctuations de
est donné par (combinaison linéaire de variables aléatoires indépendantes):
:::
Sans grande surprise, la précision de la moyenne d'une série de
mesures est donc déterminée par le nombre de mesures, et la précision de chacune de ces mesures. Dans le cas où chaque mesure est affectée de la même incertitude
la formule précédente se simplifie en :
:::
La précision de la moyenne s'accroit donc comme la racine carrée du nombre de mesures. Par exemple, pour doubler la précision, il faut quatre fois plus de données ; pour la multiplier par 10, il faut 100 fois plus de données.

Un autre exemple est l'ajustement d'une loi linéaire du type
sur des mesures indépendantes, fonction d'un paramètre connu
. Ce type de situation se rencontre par exemple lorsque l'on veut calibrer un appareil de mesure simple (ampèremètre, thermomètre) dont le fonctionnement est linéaire.
est alors la mesure instrumentale (déviation d'une aiguille, nombre de pas d'un
ADC, ...) et
la grandeur physique qu'est censé mesurer l'appareil, généralement mieux connue, si l'on utilise une source de calibration fiable. La méthode des moindres carrés permet alors de mesurer la loi de calibration de l'appareil, d'estimer l'adéquation de cette loi aux mesures de calibration (
i.e.'' dans le cas présent, la linéarité de l'appareil) et de propager les erreurs de calibration aux futures mesures effectuées avec l'appareil calibré. À noter qu'en général, les erreurs (et corrélations) portant sur les mesures ''et les mesures
doivent être prises en compte. Nous traiterons ce cas dans la section suivante.
La prescription des moindres carrés s'écrit pour ce type de modèle:
:::
Le minimum de cette expression est atteint pour
, ce qui donne:
:::
La détermination des paramètres "optimaux" (au sens des moindres carrés)
et
se ramène donc à la résolution d'un système d'équations linéaires. Il
s'agit là d'une propriété très intéressante, liée au fait que le
modèle lui-même est linéaire. On parle d'
ajustement ou de
régression linéaire. Dans le cas général, la détermination du minimum du
est un problème plus compliqué, et généralement coûteux en temps de calcul (cf. sections suivantes).
La valeur des paramètres
et
dépend des mesures
réalisées. Comme ces mesures sont entachées d'erreur,
on conçoit bien que si l'on répète
fois les
mesures de
calibration, et que l'on réalise à l'issue de chaque série
l'ajustement décrit plus haut, on obtiendra
valeurs numériquement
différentes de
et
. Les paramètres de l'ajustement
peuvent donc être considérés comme des
variables aléatoires, dont la loi est fonction du modèle ajusté et de la loi des
.
On montre que la dispersion qui affecte les valeurs de
et
dépend du nombre de points de mesure,
, et
de la dispersion qui affecte les mesures (moins les
mesures sont précises, plus
et
fluctueront). Par
ailleurs,
et
ne sont généralement pas des
variables
indépendantes. Elles sont généralement corrélées, et leur
corrélation dépend du modèle ajusté (nous avons supposé les
indépendants).
Ajustement d'un modèle linéaire quelconque
Un modèle
est linéaire, si sa dépendance en
est linéaire. Un tel modèle s'écrit :
:
où les
sont
n'' fonctions quelconques de la variable ''x. Un tel cas est très courant en pratique: les deux modèles étudiés plus haut sont linéaires. Plus généralement tout modèle polynomial est linèaire, avec
. Enfin, de très nombreux modèles utilisés en sciences expérimentales sont des développement sur des bases fonctionnelles classiques (splines, base de Fourier, bases d'ondelettes etc.)
Si nous disposons de
N mesures,
, le
peut être écrit sous la forme :
:
Nous pouvons exploiter la linéarité du modèle pour exprimer le
sous une forme matricielle plus simple. En effet, en définissant :
:
on montre facilement que le
s'écrit sous la forme:
:::
La matrice
est appelée
matrice jacobienne'' du problème. C'est une matrice rectangulaire, de dimension ''N'' x ''n'', avec généralement N >> n. Elle contient les valeurs des fonctions de base pour chaque point de mesure. La matrice diagonale est appelée ''matrice des poids. C'est l'inverse de la matrice de covariance des
. On montre que si les
sont corrélés, la relation ci-dessus est toujours valable.
n'est simplement plus diagonale, car les covariances entre les
ne sont plus nulles.
En différentiant la relation ci-dessus par rapport à chaque
, on obtient :
:::
et le minimum du
est dont atteint pour
égal à :
:::
On retrouve la propriété remarquable des problèmes linéaires, qui est que le modèle optimal peut-être obtenu en une seule operation, à savoir la résolution d'un système
.
Ajustement de modèles non-linéaires
Dans de nombreux cas, la dépendance du modèle en
est non-linéaire. Par exemple, si
, ou
. Dans ce cas, le formalisme décrit à la section précédente ne peut pas être appliqué directement. L'approche généralement employée consiste alors à partir d'une estimation de la solution, à linéariser le
en ce point, résoudre le problème linéarisé, puis itérer. Cette approche est équivalente à l'algorithme de minimisation de
Gauss-Newton. D'autres techniques de minimisation existent. Certaines comme l'
Algorithme de Levenberg-Marquardt, sont des raffinements de l'algorithme de Gauss-Newton. D'autres sont appliquables lorsque les dérivées du
sont difficiles ou coûteuses à calculer.
Une des difficultés des problèmes de moindres carrés non-linéaires est l'existence fréquente de plusieurs minimas locaux. Une exploration systématique de l'espace des paramètres peut alors se révéler nécessaire.
Ajustement sous contraintes
Ajustement de modèles implicites
Interprétation statistique
Le critère du ?²
Optimalité de la méthode des moindres carrés
Robustesse
Sensibilité aux points aberrants
Techniques de robustification
Articles connexes
Test du ?²
Loi du ?²
Apprentissage supervisé
Simulation de profil
Portail mathématiques
Catégorie:Estimation (statistique)
Methode des moindres carres
Lien AdQ|de
cs:Metoda nejmen?ích ?tverc?
de:Methode der kleinsten Quadrate
en:Least squares
es:Mínimos cuadrados
fi:Pienimmän neliösumman menetelmä
gl:Mínimos cadrados
he:???? ???????? ???????
hu:Legkisebb négyzetek módszere
it:Metodo dei minimi quadrati
ja:?????
nl:Kleinste-kwadratenmethode
pl:Metoda najmniejszych kwadratów
pt:Método dos mínimos quadrados
ru:????? ?????????? ?????????
su:Kuadrat leutik
sv:Minstakvadratmetoden
tr:En küçük kareler yöntemi
vi:Bình ph??ng t?i thi?u
zh:?????méthode_des_moindres_carrésMéthode des moindres carrés32470