Une planche de Galton illustre le fait que la loi binomiale tende vers la loi normale .
En théorie des probabilités , selon le théorème de Moivre-Laplace , si la variable
X
n
{\displaystyle X_{n}}
suit une loi binomiale d'ordre
n
{\displaystyle n}
et de paramètre
p
∈
]
0
,
1
[
{\displaystyle p\in ]0,1[}
, alors la variable
Z
n
=
X
n
−
n
p
n
p
(
1
−
p
)
{\displaystyle Z_{n}={\frac {X_{n}-np}{\sqrt {np(1-p)}}}}
converge en loi vers une loi normale centrée et réduite
N
(
0
,
1
)
{\displaystyle {\mathcal {N}}(0,1)}
.
Abraham de Moivre fut le premier à établir ce théorème en 1733 dans le cas particulier :
p
=
1
2
{\displaystyle p={\frac {1}{2}}}
; et Laplace a pu le généraliser en 1812 pour toute valeur de
p
{\displaystyle p}
comprise entre 0 et 1. Il s'agit d'un cas particulier du théorème central limite .
La démonstration repose sur l'identification de la loi limite par l'étude des fonctions caractéristiques des variables binomiales.
Démonstration du théorème de Moivre-Laplace
Soit
X
n
{\displaystyle X_{n}}
une suite de variables binomiales
X
n
∼
B
(
n
,
p
)
{\displaystyle X_{n}\sim {\mathcal {B}}(n,\,p)}
.
La fonction caractéristique de
X
n
{\displaystyle X_{n}}
est :
φ
X
n
(
t
)
=
(
p
e
i
t
+
q
)
n
{\displaystyle \varphi _{X_{n}}(t)=\left(p\mathrm {e} ^{\mathrm {i} t}+q\right)^{n}}
Celle de
Z
n
=
X
n
−
n
p
n
p
q
{\displaystyle Z_{n}={\frac {X_{n}-np}{\sqrt {npq}}}}
est :
φ
Z
n
(
t
)
=
(
p
e
i
t
n
p
q
+
q
)
n
e
−
i
t
n
p
n
p
q
{\displaystyle \varphi _{Z_{n}}(t)=(p\mathrm {e} ^{\frac {\mathrm {i} t}{\sqrt {npq}}}+q)^{n}\mathrm {e} ^{\frac {-\mathrm {i} tnp}{\sqrt {npq}}}}
Calculons le logarithme de cette fonction :
ln
φ
Z
n
(
t
)
=
n
ln
[
(
p
e
i
t
n
p
q
+
q
)
]
−
i
t
n
p
n
p
q
=
n
ln
[
(
p
(
e
i
t
n
p
q
−
1
)
+
1
)
]
−
i
t
n
p
n
p
q
{\displaystyle \ln \varphi _{Z_{n}}(t)=n\ln \left[(p\mathrm {e} ^{\frac {\mathrm {i} t}{\sqrt {npq}}}+q)\right]-{\frac {\mathrm {i} tnp}{\sqrt {npq}}}=n\ln \left[(p(\mathrm {e} ^{\frac {\mathrm {i} t}{\sqrt {npq}}}-1)+1)\right]-{\frac {\mathrm {i} tnp}{\sqrt {npq}}}}
.
On développe l'exponentielle au 2e ordre, il vient :
ln
φ
Z
n
(
t
)
≈
n
ln
[
1
+
p
(
i
t
n
p
q
−
t
2
2
n
p
q
)
]
−
i
t
n
p
n
p
q
{\displaystyle \ln \varphi _{Z_{n}}(t)\approx n\ln \left[1+p\left({\frac {\mathrm {i} t}{\sqrt {npq}}}-{\frac {t^{2}}{2npq}}\right)\right]-{\frac {\mathrm {i} tnp}{\sqrt {npq}}}}
.
On développe ensuite le logarithme au 2e ordre, on trouve :
ln
φ
Z
n
(
t
)
≈
n
(
i
p
t
n
p
q
−
p
t
2
2
n
p
q
+
p
2
t
2
2
n
p
q
)
−
i
t
n
p
n
p
q
=
−
t
2
2
q
+
p
t
2
2
q
=
t
2
2
q
(
p
−
1
)
=
−
t
2
2
{\displaystyle \ln \varphi _{Z_{n}}(t)\approx n\left({\frac {\mathrm {i} pt}{\sqrt {npq}}}-{\frac {pt^{2}}{2npq}}+{\frac {p^{2}t^{2}}{2npq}}\right)-{\frac {\mathrm {i} tnp}{\sqrt {npq}}}=-{\frac {t^{2}}{2q}}+{\frac {pt^{2}}{2q}}={\frac {t^{2}}{2q}}(p-1)=-{\frac {t^{2}}{2}}}
.
On a démontré que :
ln
φ
Z
n
(
t
)
≈
−
t
2
2
{\displaystyle \ln \varphi _{Z_{n}}(t)\approx {\frac {-t^{2}}{2}}}
et on déduit que
φ
Z
n
(
t
)
≈
e
−
t
2
2
{\displaystyle \varphi _{Z_{n}}(t)\approx \mathrm {e} ^{\frac {-t^{2}}{2}}}
.
C'est la fonction caractéristique de la loi normale centrée réduite
N
(
0
,
1
)
{\displaystyle {\mathcal {N}}(0,1)}
.
Autrement dit, si
X
n
{\displaystyle X_{n}}
suit une loi binomiale de paramètres n et p et si
Φ
{\displaystyle \Phi }
est la fonction de répartition de
N
(
0
,
1
)
{\displaystyle {\mathcal {N}}(0,1)}
alors, pour tout réel t , on a :
lim
n
→
∞
P
(
X
n
−
n
p
n
p
q
≤
t
)
=
Φ
(
t
)
{\displaystyle \lim _{n\to \infty }\operatorname {P} \left({\frac {X_{n}-np}{\sqrt {npq}}}\leq t\right)=\Phi (t)}
ce qui signifie que, pour n assez grand ,
P
(
X
n
−
n
p
n
p
q
≤
t
)
≈
Φ
(
t
)
{\displaystyle \operatorname {P} \left({\frac {X_{n}-np}{\sqrt {npq}}}\leq t\right)\approx \Phi (t)}
ce qui donne, en posant
t
=
x
−
n
p
n
p
q
{\displaystyle t={\frac {x-np}{\sqrt {npq}}}}
, l'approximation suivante pour la probabilité d'avoir au plus
x
{\displaystyle x}
succès :
P
(
X
n
≤
x
)
≈
Φ
(
x
−
n
p
n
p
(
1
−
p
)
)
{\displaystyle \operatorname {P} (X_{n}\leq x)\approx \Phi \left({\frac {x-np}{\sqrt {np(1-p)}}}\right)}
Cette approximation est bonne en général pour
n
p
(
1
−
p
)
≥
10
{\displaystyle np(1-p)\geq 10}
.
Pratiquement, il faut cependant faire attention au fait que les variables
X
n
{\displaystyle X_{n}}
sont discrètes. Graphiquement, cela se traduit par le fait que les extrémités des bâtons du diagramme de la loi binomiale
X
n
∼
B
(
n
,
p
)
{\displaystyle X_{n}\sim {\mathcal {B}}(n,\,p)}
sont proches de la courbe de densité de la loi normale
N
(
n
p
,
n
p
q
)
{\displaystyle {\mathcal {N}}(np,npq)}
.
On peut obtenir une valeur approchée de
P
(
X
n
=
x
)
{\displaystyle \mathrm {P} (X_{n}=x)}
par le calcul de la surface sous la courbe de densité comprise entre les droites d'abscisse
x
−
1
2
{\displaystyle x-{\frac {1}{2}}}
et
x
+
1
2
{\displaystyle x+{\frac {1}{2}}}
.
P
(
X
n
=
x
)
≈
P
(
x
−
1
2
−
n
p
n
p
q
≤
N
≤
x
+
1
2
−
n
p
n
p
q
)
{\displaystyle \operatorname {P} (X_{n}=x)\approx \operatorname {P} \left({\frac {x-{\frac {1}{2}}-np}{\sqrt {npq}}}\leq N\leq {\frac {x+{\frac {1}{2}}-np}{\sqrt {npq}}}\right)}
P
(
X
n
≤
x
)
≈
P
(
N
≤
x
+
1
2
−
n
p
n
p
q
)
{\displaystyle \operatorname {P} (X_{n}\leq x)\approx \operatorname {P} \left(N\leq {\frac {x+{\frac {1}{2}}-np}{\sqrt {npq}}}\right)}
On appelle cette procédure la « correction de continuité ».
On considère la suite de variables
X
n
∼
B
(
50
,
0
,
3
)
{\displaystyle X_{n}\sim {\mathcal {B}}(50,\,0{,}3)}
; on a alors
n
p
=
15
{\displaystyle np=15}
;
n
q
=
35
{\displaystyle nq=35}
D'après les tables, la valeur exacte pour
P
(
X
n
=
10
)
=
0,038
619
{\displaystyle \mathrm {P} (X_{n}=10)=0{,}038\,619}
.
La formule d'approximation avec une loi
N
(
n
p
,
n
p
q
)
=
N
(
15
,
10
,
5
)
{\displaystyle {\mathcal {N}}(np,{\sqrt {npq}})={\mathcal {N}}(15,{\sqrt {10{,}5}})}
donne le résultat :
P
(
9
,
5
−
15
10
,
5
≤
N
≤
10
,
5
−
15
10
,
5
)
{\displaystyle \operatorname {P} \left({\frac {9{,}5-15}{\sqrt {10{,}5}}}\leq N\leq {\frac {10{,}5-15}{\sqrt {10{,}5}}}\right)}
soit
P
(
−
1
,
7
≤
N
≤
−
1
,
39
)
=
P
(
1
,
39
≤
N
≤
1
,
7
)
=
0,955
4
−
0,917
7
=
0,037
7
{\displaystyle \operatorname {P} (-1{,}7\leq N\leq -1{,}39)=\operatorname {P} (1,39\leq N\leq 1{,}7)=0{,}955\,4-0{,}917\,7=0{,}037\,7}
L'erreur d'approximation est faible.
Pour
P
(
X
n
≤
10
)
=
0,078
9
{\displaystyle \mathrm {P} (X_{n}\leq 10)=0{,}078\,9}
, l'approximation usuelle fournit
P
(
N
≤
−
1
,
39
)
=
P
(
N
≥
1
,
39
)
=
1
−
P
(
N
≤
1
,
39
)
=
0,082
3
{\displaystyle \mathrm {P} (N\leq -1{,}39)=\mathrm {P} (N\geq 1{,}39)=1-\mathrm {P} (N\leq 1{,}39)=0{,}082\,3}
Sans correction de la continuité de l'approximation, on aurait :
P
(
N
≤
10
−
15
10
,
5
)
=
P
(
N
≤
−
1
,
54
)
=
1
−
P
(
N
≤
1
,
54
)
=
0,061
8
{\displaystyle \operatorname {P} \left(N\leq {\frac {10-15}{\sqrt {10{,}5}}}\right)=\operatorname {P} (N\leq -1{,}54)=1-\operatorname {P} (N\leq 1{,}54)=0{,}061\,8}
Cette dernière valeur est assez imprécise.
Denis Lantier, Didier Trotoux, « La Loi des grands nombres : le théorème de De Moivre-Laplace », dans Contribution à une approche historique de l'enseignement des mathématiques : actes de la 6e université d'été interdisciplinaire sur l'histoire des mathématiques , Besançon, Presses universitaires de Franche-Comté/université de Franche-Comté, coll. « Les publications de l'IREM de Besançon », 1995, 490 p. (ISBN 2-909963-136 et 978-2909963136 ) , p. 259-294 [lire en ligne ] [PDF] .