Centrális határeloszlás-tétel

A normális eloszlás közelítése szimmetrikus (fent) és ferde (lent) Binomiális eloszlásokkal. A közelítés pirossal, a normális eloszlás zölddel van ábrázolva

A centrális határeloszlás-tétel (CHT) azt mondja ki, hogy adott feltételek mellett, elegendően nagy számú és független valószínűségi változó középértéke (várható értéke) jó közelítéssel normális eloszlású, ha a független valószínűségi változók jól meghatározott középértékkel és szórásnégyzettel rendelkeznek.^[1] Ha nem tesszük fel ezt a két utóbbi feltételt, akkor csak azt tudjuk, hogy a határeloszlás stabil.^[2]

A centrális határeloszlás-tételnek számos változata van. Az általános formájában a valószínűségi változók hasonló eloszlásúaknak kell lenniük. Vannak olyan változatok, ahol a normális eloszlás középértékéhez történő konvergencia a nem azonos eloszlást mutató valószínűségi változóknál is előfordul, bizonyos feltételek mellett, például Ljapunov-feltétel vagy Lindenberg-feltétel. Ezek kizárják, hogy az egyes tagok túl nagy hatással legyenek az összegre.

A valószínűségi elméletben a centrális határeloszlás-tétel az úgynevezett gyenge konvergenciájú halmaz része. Ez arról a tényről szól, hogy sok független és azonos eloszlású valószínűségi változó összege egy attraktor eloszlás kis halmazához közelít. Ha a független és azonos eloszlású valószínűségi változók szórásnégyzete véges, akkor az attraktor eloszlás a normális eloszlás. Ezzel ellentétben, ha a valószínűségi változó négyzetes törvény szerinti elnyúló farok résszel rendelkezik, a szórásnégyzet végtelen, akkor az alfa-stabil eloszlás felé tart, alfa stabilitás paraméterrel, ahogy a változók száma nő.^[3]

Az elnevezés Pólya György egy 1920-as dolgozatára megy vissza, aminek címe németül Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem.^[4]

Klasszikus CHT

Legyenek X₁, ..., X_n egy n elemszámú minta tagjai, egy független és azonos eloszlású valószínűségi változók sorozata, µ várható értékkel és σ² szórásnégyzettel. Tegyük fel, hogy a minták átlaga:

S_{n}:={\frac {X_{1}+\cdots +X_{n}}{n}}

A nagy számok törvénye szerint a mintaátlagok majdnem biztosan a µ várható értékhez konvergálnak, ahogy n → ∞. A klasszikus CHT leírja a középérték, µ körüli sztochasztikus fluktuáció méretét és eloszlási formáját a konvergencia során. Pontosabban azt állítja, hogy ahogy n nő, a minta átlaga S_n és annak várható értéke (µ) közötti különbség eloszlása, ha megszorozzuk a n tényezővel (azaz n(S_n − µ)), akkor közelít a normális eloszláshoz, 0 középértékkel és σ² szórásnégyzettel. Ha n elég nagy, akkor S_n eloszlása közel normális eloszlású µ középértékkel és σ²/n szórásnégyzettel. Az elmélet hasznossága az, hogy ${\sqrt {n}}$ (S_n − µ) közelít a normálishoz, tekintet nélkül az egyedi X_i-k eloszlásának formáitól.

Formálisabban, az $n$ -edik összeg $S_{n}=X_{1}+X_{2}+\cdots +X_{n}$ . Az $S_{n}$ várható értéke $n\mu$ , szórásnégyzete $n\sigma ^{2}$ . Az összeget standardizálva

Z_{n}={\frac {S_{n}-n\mu }{\sigma {\sqrt {n}}}},

ami pontonként tart az $N(0,1)$ standard normális eloszláshoz, ha $n\to \infty$ . Ez azt jelenti, hogy $\Phi (z)$ -vel jelölve a standard normális eloszlás eloszlásfüggvényét, minden $z$ valós számra

\lim _{n\to \infty }P(Z_{n}\leq z)=\Phi (z).

Egy másik írásmóddal

\lim _{n\rightarrow \infty }P\left({\frac {{\overline {X}}_{n}-\mu }{\sigma /{\sqrt {n}}}}\leq z\right)=\Phi (z),

ahol

{\overline {X}}_{n}={\frac {S_{n}}{n}}={\frac {X_{1}+\cdots +X_{n}}{n}}

az első

$n$ tag átlaga.

Alkalmazás, példa

A mellékelt ábrán látható, hogy a hatoldalú kocka dobásának eloszlása az n növelése függvényében, az eloszlás tart a normális eloszláshoz.

Statisztikai alkalmazásokban a konvergencia a mintanagyság növelésével gyorsítható.

Az USA-ban 1973 és 1978 között vizsgált baleseti halálok eloszlása is tart a normális eloszlás felé a CHT miatt.

Számos esetet publikáltak, ahol a CHT törvénye működik.^[5]

Az úgynevezett véletlenszerű bolyongáskor követett útvonalak eloszlásai is tendálnak a normális eloszlás felé^[6] Nagy számú pénzérme feldobásakor a „fej” eredmények normális eloszlást mutatnak az összes fejre viszonyítva (vagy írásra). Elektronikus zajok természete is normális eloszlást mutat elegendően nagy számú kísérletnél. Általánosságban is elmondható, hogy minél több mérést végzünk független változókkal egyenlő befolyással (körülmények között), akkor az eloszlás tart a normális eloszlás felé. Számos statisztikai eredmény és számítógépes megoldás mutatja a konvergenciát a centrális határeloszlás szerint.^[7]

A CHT rövid története

Az első verzió Abraham de Moivre francia matematikus nevéhez kötődik (1733).^[8] A publikációt teljesen elfelejtették, majd 1812-ben a híres francia matematikus Pierre-Simon Laplace vette elő a homályból az elméletet. Az elmélet fontosságát egy orosz matematikus, Alekszandr Mihajlovics Ljapunov ismerte fel 1901-ben, és bizonyította a tétel működését, a valószínűségi elmélet területén. A ’centrális határ-eloszlás’ elnevezést Pólya György használta először egy publikációjában 1920-ban.^[9]^[10] Az elmélet kifejtéséhez számos matematikus, statisztikus járult hozzá (Anders Hald, Augustin Cauchy, Friedrich Bessel, Siméon Denis Poisson, Paul Pierre Lévy, Harald Cramér). Az első bizonyítások Bernstein, Pafnutyij Lvovics Csebisov, Id. Andrej Andrejevics Markov és Alekszandr Mihajlovics Ljapunov neveihez fűződik, 1935 körül.^[10]^[11] Érdekesség a történetben, hogy Alan Turing disszertációjában (King's College, University of Cambridge) a CHT bizonyítása szerepelt. Ezt a disszertációt sohasem publikálták.^[12]^[13]^[14]

A CHT bizonyítása

A bizonyítást többnyire a karakterisztikus függvények tulajdonságairól szóló általánosabb tételekre alapozzák. Elegendő tudni a $Z_{n}$ sorozat elemeinek momentumait illetve kumulánsait, amelyekkel meghatározható a karakterisztikus függvény Taylor-sora.

Elemi úton is belátható. Ehhez megvizsgálják az $\operatorname {E} (f(Z_{n}))$ alakú várható értékeket, amelyek egyrészt megfelelnek egy egy zárt $[a,b]$ intervallum indikátorfüggvénye esetén a $P(a\leq Z_{n}\leq b)$ valószínűségnek, másrészt jól approximálhatók egy elegendően sima $f$ függvénnyel. Ez az eljárás Jarl Waldemar Lindebergtől származik.^[15]

Az elmélet kiterjesztése

A Berry–Esseen-tétel erősíti a tétel eredményét: Ha létezik a $\operatorname {E} ((X_{1}-\mu )^{3})$ harmadik centrális momentum, és véges, akkor az eloszlás egyenletesen konvergál a normális eloszláshoz, és a konvergencia sebessége legalább $1/{\sqrt {n}}$ .

Független Bernoulli-eloszlású valószínűségi változók esetén az összeg binomiális eloszlású. Ekkor a Moivre-Laplace-tétel a centrális határeloszlás tételéből adódik.

Ugyanolyan stabil eloszlások esetén már végesben teljesül a tétel, hiszen a stabilitás miatt az összeg és a lenormált összeg is szintén a stabil eloszlás családjából való. Normális eloszlás esetén ez is teljesül. Vannak más stabil eloszlások is, de ez az egyetlen, aminek véges a szórása.

Magasabb dimenzióban a tétel hasonlóan teljesül. A határeloszlás ott is stabil, emiatt véges szórású esetekben a határeloszlás több dimenziós normális eloszlás lesz.

Vannak olyan változatok, amelyekben megengedett az összefüggés bizonyos valószínűségi változók között. A Lindenberg- és a Ljapunov-feltételek olyan csoportokat képeznek, amelyeken belül a valószínűségi változók függetlenek, és csak különböző csoportokba tartozó változók között lehet összefüggés. A csoportképzés módját sémának nevezik, tehát a fenti feltételek sémákat alkotnak.

A klasszikus elmélet bizonyítása

CHT variánsok

Ljapunov CHT^[16]
Lindeberg CHT^[17]
Több dimenziós CHT^[18]
CHT egymástól nem független változók esetén^[19]

Jegyzetek

↑ Rice, John (1995), Mathematical Statistics and Data Analysis (Second ed.), Duxbury Press, ISBN 0-534-20934-3)
↑ John P. Nolan. Stable Distributions – Models for Heavy Tailed Data [archivált változat]. Boston: Birkhauser, 22. o. (2011). Hozzáférés ideje: 2018. július 20. [archiválás ideje: 2006. október 30.]
↑ Voit, Johannes (2003), The Statistical Mechanics of Financial Markets, Springer-Verlag, p. 124, ISBN 3-540-00978-7
↑ Jeff Miller: Earliest Known Uses of Some of the Words of Mathematics.
George Pólya: Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem, Mathematische Zeitschrift, 8, 1920, S. 171–181 (online)
↑ Dinov, Christou & Sanchez (2008)
↑ SOCR CLT Activity wiki
↑ Marasinghe, M., Meeker, W., Cook, D. & Shin, T.S. (1994 August), "Using graphics and simulation to teach statistical concepts", Paper presented at the Annual meeting of the American Statistician Association, Toronto, Canada.
↑ Henk, Tijms (2004), Understanding Probability: Chance Rules in Everyday Life, Cambridge: Cambridge University Press, p. 169, ISBN 0-521-54036-4
↑ Pólya, George (1920), "Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem", Mathematische Zeitschrift (in German) 8 (3–4): 171–181, doi:10.1007/BF01206525
↑ ^a ^b Le Cam, Lucien (1986), "The central limit theorem around 1935", Statistical Science 1 (1): 78–91, doi:10.2307/2245503
↑ Bernstein, S.N. (1945) On the work of P.L.Chebyshev in Probability Theory, Nauchnoe Nasledie P.L.Chebysheva. Vypusk Pervyi: Matematika. (Russian) [The Scientific Legacy of P. L. Chebyshev. First Part: Mathematics, Edited by S. N. Bernstein.] Academiya Nauk SSSR, Moscow-Leningrad, 174 pp.
↑ Hodges, Andrew (1983) Alan Turing: the enigma. London: Burnett Books., pp. 87-88.
↑ Zabell, S.L. (2005) Symmetry and its discontents: essays on the history of inductive probability, Cambridge University Press. ISBN 0-521-44470-5. (pp. 199 ff.)
↑ Aldrich, John (2009) "England and Continental Probability in the Inter-War Years", Electronic Journ@l for History of Probability and Statistics, vol. 5/2, December 2009. (Section 3)
↑ Jarl Waldemar Lindeberg: Eine neue Herleitung des Exponentialgesetzes in der Wahrscheinlichkeitsrechnung, Mathematische Zeitschrift, Band 15, 1922, S. 211–225 (Online-Version).
Siehe auch Jörg Bewersdorff: Statistik – wie und warum sie funktioniert. Ein mathematisches Lesebuch. Vieweg+Teubner Verlag 2011, ISBN 978-3-8348-1753-2, doi:10.1007/978-3-8348-8264-6, S. 139–146.
↑ Billingsley (1995, p.362)
↑ P. Billingsley (1986). Probability and measure (2 ed.). p. 369.
↑ Van der Vaart, A. W. (1998), Asymptotic statistics, New York: Cambridge University Press, ISBN 978-0-521-49603-2, LCCN .V22 1998 QA276 .V22 1998
↑ Johnson, Oliver Thomas (2004) Information theory and the central limit theorem, Imperial College Press, 2004, ISBN 1-86094-473-6. (p. 88)

Fordítás

Ez a szócikk részben vagy egészben a Zentraler Grenzwertsatz című német Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

Források

Simonovits András: Válogatott fejezetek a matematika történetéből. (hely nélkül): Typotex Kiadó. 2009. 109–113. o. ISBN 978-963-279-026-8
Barany, Imre & Vu, Van: Central limit theorems for Gaussian polytopes. (hely nélkül): The Annals of Probability (Institute of Mathematical Statistics) 35 (4). 2007. 1593–1621. o.
Durrett, Richard: Probability: theory and examples (4th ed.). (hely nélkül): Cambridge University Press. 2004. ISBN 0521765390
Hans Fischer: A History of the Central Limit Theorem: From Classical to Modern Probability Theory. New York: Springer. 2011. ISBN 978-0-387-87856-0 doi:10.1007/978-0-387-87857-7

További információk

Kapcsolódó szócikkek

[1] Rice, John (1995), Mathematical Statistics and Data Analysis (Second ed.), Duxbury Press, ISBN 0-534-20934-3)

[2] John P. Nolan. Stable Distributions – Models for Heavy Tailed Data [archivált változat]. Boston: Birkhauser, 22. o. (2011). Hozzáférés ideje: 2018. július 20. [archiválás ideje: 2006. október 30.]

[3] Voit, Johannes (2003), The Statistical Mechanics of Financial Markets, Springer-Verlag, p. 124, ISBN 3-540-00978-7

[4] Jeff Miller: Earliest Known Uses of Some of the Words of Mathematics.
George Pólya: Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem, Mathematische Zeitschrift, 8, 1920, S. 171–181 (online)

[5] Dinov, Christou & Sanchez (2008)

[6] SOCR CLT Activity wiki

[7] Marasinghe, M., Meeker, W., Cook, D. & Shin, T.S. (1994 August), "Using graphics and simulation to teach statistical concepts", Paper presented at the Annual meeting of the American Statistician Association, Toronto, Canada.

[8] Henk, Tijms (2004), Understanding Probability: Chance Rules in Everyday Life, Cambridge: Cambridge University Press, p. 169, ISBN 0-521-54036-4

[9] Pólya, George (1920), "Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem", Mathematische Zeitschrift (in German) 8 (3–4): 171–181, doi:10.1007/BF01206525

[Cam,_Lucien_1986-10] Le Cam, Lucien (1986), "The central limit theorem around 1935", Statistical Science 1 (1): 78–91, doi:10.2307/2245503

[11] Bernstein, S.N. (1945) On the work of P.L.Chebyshev in Probability Theory, Nauchnoe Nasledie P.L.Chebysheva. Vypusk Pervyi: Matematika. (Russian) [The Scientific Legacy of P. L. Chebyshev. First Part: Mathematics, Edited by S. N. Bernstein.] Academiya Nauk SSSR, Moscow-Leningrad, 174 pp.

[12] Hodges, Andrew (1983) Alan Turing: the enigma. London: Burnett Books., pp. 87-88.

[13] Zabell, S.L. (2005) Symmetry and its discontents: essays on the history of inductive probability, Cambridge University Press. ISBN 0-521-44470-5. (pp. 199 ff.)

[14] Aldrich, John (2009) "England and Continental Probability in the Inter-War Years", Electronic Journ@l for History of Probability and Statistics, vol. 5/2, December 2009. (Section 3)

[15] Jarl Waldemar Lindeberg: Eine neue Herleitung des Exponentialgesetzes in der Wahrscheinlichkeitsrechnung, Mathematische Zeitschrift, Band 15, 1922, S. 211–225 (Online-Version).
Siehe auch Jörg Bewersdorff: Statistik – wie und warum sie funktioniert. Ein mathematisches Lesebuch. Vieweg+Teubner Verlag 2011, ISBN 978-3-8348-1753-2, doi:10.1007/978-3-8348-8264-6, S. 139–146.

[16] Billingsley (1995, p.362)

[17] P. Billingsley (1986). Probability and measure (2 ed.). p. 369.

[18] Van der Vaart, A. W. (1998), Asymptotic statistics, New York: Cambridge University Press, ISBN 978-0-521-49603-2, LCCN .V22 1998 QA276 .V22 1998

[19] Johnson, Oliver Thomas (2004) Information theory and the central limit theorem, Imperial College Press, 2004, ISBN 1-86094-473-6. (p. 88)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]