Hi-kvadratna raspodela
Funkcija gustine verovatnoće | |
Funkcija kumulativne raspodele | |
Notacija | ili |
---|---|
Parametri | (poznati kao „stepeni sloboda”) |
Nositelj | ako je , inače |
CDF | |
Prosek | |
Medijana | |
Modus | |
Varijansa | |
Koef. asimetrije | |
Kurtoza | |
Entropija | |
MGF | |
CF | [1] |
PGF |
U teoriji verovatnoće i statistici, hi-kvadratna raspodela (takođe hi-kvadrat ili χ2-raspodela) sa k stepena slobode je distribucija sume kvadrata k nezavisnih standardno normalnih randomnih promenljivih. Hi-kvadratna distribucija je specijalni slučaj gama distribucije i jedna je od od najšire korištenih distribucija verovatnoće u inferencijskoj statistici, naročito u testiranju hipoteza ili u konstrukciji intervala pouzdanosti.[2][3][4][5] Kada se pravi razlika od opštije necentralne hi-kvadratne raspodele, ova distribucija se ponekad naziva centralnom hi-kvadratnom raspodelom.
Hi-kvadratna raspodela se koristi u uobičajenim hi-kvadratnim testovima[6][7] za adekvatnost uklapanja posmatrane distribucije u teorijski očekivanu, nezavisnost dva kriterijuma klasifikacije kvalitativnih podataka, i procenu intervala pouzdanosti za populaciju standardnih devijacija normalne distribucije iz standardne devijacije uzorka. Mnogi drugi statistički testovi takođe koriste ovu distribuciju, kao što je Fridmanova analiza varijanse po rangovima.
Definicija
[uredi | uredi izvor]Ako su Z1, ..., Zk nezavisnе, standardno normalne randomne promenljive, onda je suma njihovih kvadrata,
distribuirana u skladu sa hi-kvadratnom distribucijom sa k stepeni slobode. Ovo se obično označava sa
Hi-kvadratna distribucija ima jedan parametar: k, pozitivni integer koji specificira broj stepeni slobode (broj Zi vrednosti).
Tabela χ2 vrednosti vs p-vrednosti
[uredi | uredi izvor]p-vrednost je verovatnoća opservacije statističkog testa bar kao ekstrema u hi-kvadratnoj distribuciji. Shodno tome, pošto kumulativna funkcija raspodele (CDF) za odgovarajuće stepene slobode (df) daje verovatnoću da je dobijena vrednost manje ekstremna od ove tačke, oduzimanje CDF vrednosti od 1 daje p-vrednost. Mala p-vrednost, ispod izabranog nivoa značaja, ukazuje na statistički značaj, tj. dovoljan dokaz da se odbaci nulta hipoteza. Nivo značaja od 0,05 se često koristi kao granica između značajnih i neznačajnih rezultata.
Donja tabela daje broj p-vrednosti koje odgovaraju sa χ2 za prvih 10 stepeni slobode.
Stepeni slobode (df) | χ2 vrednost[8] | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
1 | 0,004 | 0,02 | 0,06 | 0,15 | 0,46 | 1,07 | 1,64 | 2,71 | 3,84 | 6,63 | 10,83 |
2 | 0,10 | 0,21 | 0,45 | 0,71 | 1,39 | 2,41 | 3,22 | 4,61 | 5,99 | 9,21 | 13,82 |
3 | 0,35 | 0,58 | 1,01 | 1,42 | 2,37 | 3,66 | 4,64 | 6,25 | 7,81 | 11,34 | 16,27 |
4 | 0,71 | 1,06 | 1,65 | 2,20 | 3,36 | 4,88 | 5,99 | 7,78 | 9,49 | 13,28 | 18,47 |
5 | 1,14 | 1,61 | 2,34 | 3,00 | 4,35 | 6,06 | 7,29 | 9,24 | 11,07 | 15,09 | 20,52 |
6 | 1,63 | 2,20 | 3,07 | 3,83 | 5,35 | 7,23 | 8,56 | 10,64 | 12,59 | 16,81 | 22,46 |
7 | 2,17 | 2,83 | 3,82 | 4,67 | 6,35 | 8,38 | 9,80 | 12,02 | 14,07 | 18,48 | 24,32 |
8 | 2,73 | 3,49 | 4,59 | 5,53 | 7,34 | 9,52 | 11,03 | 13,36 | 15,51 | 20,09 | 26,12 |
9 | 3,32 | 4,17 | 5,38 | 6,39 | 8,34 | 10,66 | 12,24 | 14,68 | 16,92 | 21,67 | 27,88 |
10 | 3,94 | 4,87 | 6,18 | 7,27 | 9,34 | 11,78 | 13,44 | 15,99 | 18,31 | 23,21 | 29,59 |
P vrednost (verovatnoća) | 0,95 | 0,90 | 0,80 | 0,70 | 0,50 | 0,30 | 0,20 | 0,10 | 0,05 | 0,01 | 0,001 |
Ove vrednosti se mogu izračunati procenom funkcije kvantila (takođe poznate kao „inverzni CDF” ili „ICDF”) raspodele hi-kvadrata;[9] e. g., χ2 ICDF za p = 0,05 i df = 7 daje 14,06714 ≈ 14,07 kao u gornjoj tabeli.
Reference
[uredi | uredi izvor]- ^ M.A. Sanders. „Characteristic function of the central chi-square distribution” (PDF). Архивирано из оригинала (PDF) 2011-07-15. г. Приступљено 2009-03-06.
- ^ Abramowitz, Milton; Stegun, Irene Ann, ур. (1983) [јун 1964]. „поглавље 26”. Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematics Series. 55 (Ninth reprint with additional corrections of tenth original printing with corrections (December 1972); first изд.). Washington D.C.; New York: United States Department of Commerce, National Bureau of Standards; Dover Publications. стр. 940. ISBN 978-0-486-61272-0. LCCN 64-60036. MR 0167642. LCCN 65-12253.
- ^ NIST (2006). Engineering Statistics Handbook – Chi-Squared Distribution
- ^ Johnson, N. L.; Kotz, S.; Balakrishnan, N. (1994). „Chi-Square Distributions including Chi and Rayleigh”. Continuous Univariate Distributions. 1 (Second изд.). John Wiley and Sons. стр. 415—493. ISBN 978-0-471-58495-7.
- ^ Mood, Alexander; Graybill, Franklin A.; Boes, Duane C. (1974). Introduction to the Theory of Statistics (Third изд.). McGraw-Hill. стр. 241–246. ISBN 978-0-07-042864-5.
- ^ „Chi-Square - Sociology 3112 - Department of Sociology - The University of utah”. soc.utah.edu. Приступљено 2022-11-12.
- ^ Pearson, Karl (1900). „On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling” (PDF). Philosophical Magazine. Series 5. 50 (302): 157—175. doi:10.1080/14786440009463897.
- ^ Chi-Squared Test Архивирано на сајту Wayback Machine (18. новембар 2013) Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. In turn citing: R. A. Fisher and F. Yates, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV. Two values have been corrected, 7.82 with 7.81 and 4.60 with 4.61
- ^ R Tutorial: Chi-squared Distribution
Literatura
[uredi | uredi izvor]- Hald, Anders (1998). A history of mathematical statistics from 1750 to 1930. New York: Wiley. ISBN 978-0-471-17912-2.
- Elderton, William Palin (1902). „Tables for Testing the Goodness of Fit of Theory to Observation”. Biometrika. 1 (2): 155—163. doi:10.1093/biomet/1.2.155.
- Hazewinkel Michiel, ур. (2001). „Chi-squared distribution”. Encyclopaedia of Mathematics. Springer. ISBN 978-1556080104.
- Pierre Simon de Laplace (1812). Analytical Theory of Probability.
- A. Kolmogoroff (1933). Grundbegriffe der Wahrscheinlichkeitsrechnung. ISBN 978-3-642-49888-6. doi:10.1007/978-3-642-49888-6.
- Patrick Billingsley (1979). Probability and Measure. New York, Toronto, London: John Wiley and Sons.
- Olav Kallenberg; Foundations of Modern Probability, 2nd ed. Springer Series in Statistics. (2002). 650 pp. ISBN 0-387-95313-2
- Henk Tijms (2004). Understanding Probability. Cambridge Univ. Press.
- Olav Kallenberg; Probabilistic Symmetries and Invariance Principles. Springer -Verlag, New York (2005). 510 pp. ISBN 0-387-25115-4
- Durrett, Rick (2019). Probability: Theory and Examples, 5th edition. UK: Cambridge University Press. ISBN 9781108473682.
- Gut, Allan (2005). Probability: A Graduate Course. Springer-Verlag. ISBN 0-387-22833-0.
- Pearson, Karl (1893). „Contributions to the mathematical theory of evolution [abstract]”. Proceedings of the Royal Society. 54: 329—333. JSTOR 115538. doi:10.1098/rspl.1893.0079 .
- Pearson, Karl (1895). „Contributions to the mathematical theory of evolution, II: Skew variation in homogeneous material”. Philosophical Transactions of the Royal Society. 186: 343—414. Bibcode:1895RSPTA.186..343P. JSTOR 90649. doi:10.1098/rsta.1895.0010 .
- Pearson, Karl (1901). „Mathematical contributions to the theory of evolution, X: Supplement to a memoir on skew variation”. Philosophical Transactions of the Royal Society A. 197 (287–299): 443—459. Bibcode:1901RSPTA.197..443P. JSTOR 90841. doi:10.1098/rsta.1901.0023 .
- Pearson, Karl (1916). „Mathematical contributions to the theory of evolution, XIX: Second supplement to a memoir on skew variation”. Philosophical Transactions of the Royal Society A. 216 (538–548): 429—457. Bibcode:1916RSPTA.216..429P. JSTOR 91092. doi:10.1098/rsta.1916.0009 .
- Corder, G. W.; Foreman, D. I. (2014), Nonparametric Statistics: A Step-by-Step Approach, New York: Wiley, ISBN 978-1118840313
- Greenwood, Cindy; Nikulin, M. S. (1996), A guide to chi-squared testing, New York: Wiley, ISBN 0-471-55779-X
- Nikulin, M. S. (1973), „Chi-squared test for normality”, Proceedings of the International Vilnius Conference on Probability Theory and Mathematical Statistics, 2, стр. 119—122
- Bagdonavicius, V.; Nikulin, M. S. (2011), „Chi-squared goodness-of-fit test for right censored data”, The International Journal of Applied Mathematics and Statistics, стр. 30—50[потребан је пун навод]
- „Chi-squared Statistic”. Practical Cryptography. Архивирано из оригинала 18. 2. 2015. г. Приступљено 18. 2. 2015.
- „Using Chi Squared to Crack Codes”. IB Maths Resources. British International School Phuket. 15. 6. 2014.
- Ryabko, B. Ya.; Stognienko, V. S.; Shokin, Yu. I. (2004). „A new test for randomness and its application to some cryptographic problems” (PDF). Journal of Statistical Planning and Inference. 123 (2): 365—376. doi:10.1016/s0378-3758(03)00149-6. Приступљено 18. 2. 2015.
- Feldman, I.; Rzhetsky, A.; Vitkup, D. (2008). „Network properties of genes harboring inherited disease mutations”. PNAS. 105 (11): 4323—432. Bibcode:2008PNAS..105.4323F. PMC 2393821 . PMID 18326631. doi:10.1073/pnas.0701722105 .
- „chi-square-tests” (PDF). Архивирано из оригинала (PDF) 29. 6. 2018. г. Приступљено 29. 6. 2018.
Spoljašnje veze
[uredi | uredi izvor]- Earliest Uses of Some of the Words of Mathematics: entry on Chi squared has a brief history
- Course notes on Chi-Squared Goodness of Fit Testing from Yale University Stats 101 class.
- Mathematica demonstration showing the chi-squared sampling distribution of various statistics, e. g. Σx², for a normal population
- Lin, Jinn-Tyan (1988). „Approximating the Cumulative Chi-Square Distribution and its Inverse”. Journal of the Royal Statistical Society. Series D (The Statistician). 37 (1): 3—5. JSTOR 2348373. doi:10.2307/2348373. Simple algorithm for approximating cdf and inverse cdf for the chi-squared distribution with a pocket calculator]
- Values of the Chi-squared distribution