Pređi na sadržaj

Hi-kvadratna raspodela

S Vikipedije, slobodne enciklopedije
Hi-kvadrat
Funkcija gustine verovatnoće
Funkcija kumulativne raspodele
Notacija ili
Parametri (poznati kao „stepeni sloboda”)
Nositelj ako je , inače
PDF
CDF
Prosek
Medijana
Modus
Varijansa
Koef. asimetrije
Kurtoza
Entropija
MGF
CF      [1]
PGF

U teoriji verovatnoće i statistici, hi-kvadratna raspodela (takođe hi-kvadrat ili χ2-raspodela) sa k stepena slobode je distribucija sume kvadrata k nezavisnih standardno normalnih randomnih promenljivih. Hi-kvadratna distribucija je specijalni slučaj gama distribucije i jedna je od od najšire korištenih distribucija verovatnoće u inferencijskoj statistici, naročito u testiranju hipoteza ili u konstrukciji intervala pouzdanosti.[2][3][4][5] Kada se pravi razlika od opštije necentralne hi-kvadratne raspodele, ova distribucija se ponekad naziva centralnom hi-kvadratnom raspodelom.

Hi-kvadratna raspodela se koristi u uobičajenim hi-kvadratnim testovima[6][7] za adekvatnost uklapanja posmatrane distribucije u teorijski očekivanu, nezavisnost dva kriterijuma klasifikacije kvalitativnih podataka, i procenu intervala pouzdanosti za populaciju standardnih devijacija normalne distribucije iz standardne devijacije uzorka. Mnogi drugi statistički testovi takođe koriste ovu distribuciju, kao što je Fridmanova analiza varijanse po rangovima.

Definicija

[uredi | uredi izvor]

Ako su Z1, ..., Zk nezavisnе, standardno normalne randomne promenljive, onda je suma njihovih kvadrata,

distribuirana u skladu sa hi-kvadratnom distribucijom sa k stepeni slobode. Ovo se obično označava sa

Hi-kvadratna distribucija ima jedan parametar: k, pozitivni integer koji specificira broj stepeni slobode (broj Zi vrednosti).

Tabela χ2 vrednosti vs p-vrednosti

[uredi | uredi izvor]

p-vrednost je verovatnoća opservacije statističkog testa bar kao ekstrema u hi-kvadratnoj distribuciji. Shodno tome, pošto kumulativna funkcija raspodele (CDF) za odgovarajuće stepene slobode (df) daje verovatnoću da je dobijena vrednost manje ekstremna od ove tačke, oduzimanje CDF vrednosti od 1 daje p-vrednost. Mala p-vrednost, ispod izabranog nivoa značaja, ukazuje na statistički značaj, tj. dovoljan dokaz da se odbaci nulta hipoteza. Nivo značaja od 0,05 se često koristi kao granica između značajnih i neznačajnih rezultata.

Donja tabela daje broj p-vrednosti koje odgovaraju sa χ2 za prvih 10 stepeni slobode.

Stepeni slobode (df) χ2 vrednost[8]
1 0,004 0,02 0,06 0,15 0,46 1,07 1,64 2,71 3,84 6,63 10,83
2 0,10 0,21 0,45 0,71 1,39 2,41 3,22 4,61 5,99 9,21 13,82
3 0,35 0,58 1,01 1,42 2,37 3,66 4,64 6,25 7,81 11,34 16,27
4 0,71 1,06 1,65 2,20 3,36 4,88 5,99 7,78 9,49 13,28 18,47
5 1,14 1,61 2,34 3,00 4,35 6,06 7,29 9,24 11,07 15,09 20,52
6 1,63 2,20 3,07 3,83 5,35 7,23 8,56 10,64 12,59 16,81 22,46
7 2,17 2,83 3,82 4,67 6,35 8,38 9,80 12,02 14,07 18,48 24,32
8 2,73 3,49 4,59 5,53 7,34 9,52 11,03 13,36 15,51 20,09 26,12
9 3,32 4,17 5,38 6,39 8,34 10,66 12,24 14,68 16,92 21,67 27,88
10 3,94 4,87 6,18 7,27 9,34 11,78 13,44 15,99 18,31 23,21 29,59
P vrednost (verovatnoća) 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,01 0,001

Ove vrednosti se mogu izračunati procenom funkcije kvantila (takođe poznate kao „inverzni CDF” ili „ICDF”) raspodele hi-kvadrata;[9] e. g., χ2 ICDF za p = 0,05 i df = 7 daje 14,06714 ≈ 14,07 kao u gornjoj tabeli.

Reference

[uredi | uredi izvor]
  1. ^ M.A. Sanders. „Characteristic function of the central chi-square distribution” (PDF). Архивирано из оригинала (PDF) 2011-07-15. г. Приступљено 2009-03-06. 
  2. ^ Abramowitz, Milton; Stegun, Irene Ann, ур. (1983) [јун 1964]. „поглавље 26”. Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematics Series. 55 (Ninth reprint with additional corrections of tenth original printing with corrections (December 1972); first изд.). Washington D.C.; New York: United States Department of Commerce, National Bureau of Standards; Dover Publications. стр. 940. ISBN 978-0-486-61272-0. LCCN 64-60036. MR 0167642. LCCN 65-12253. 
  3. ^ NIST (2006). Engineering Statistics Handbook – Chi-Squared Distribution
  4. ^ Johnson, N. L.; Kotz, S.; Balakrishnan, N. (1994). „Chi-Square Distributions including Chi and Rayleigh”. Continuous Univariate Distributions. 1 (Second изд.). John Wiley and Sons. стр. 415—493. ISBN 978-0-471-58495-7. 
  5. ^ Mood, Alexander; Graybill, Franklin A.; Boes, Duane C. (1974). Introduction to the Theory of Statistics (Third изд.). McGraw-Hill. стр. 241–246. ISBN 978-0-07-042864-5. 
  6. ^ „Chi-Square - Sociology 3112 - Department of Sociology - The University of utah”. soc.utah.edu. Приступљено 2022-11-12. 
  7. ^ Pearson, Karl (1900). „On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling” (PDF). Philosophical Magazine. Series 5. 50 (302): 157—175. doi:10.1080/14786440009463897. 
  8. ^ Chi-Squared Test Архивирано на сајту Wayback Machine (18. новембар 2013) Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. In turn citing: R. A. Fisher and F. Yates, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV. Two values have been corrected, 7.82 with 7.81 and 4.60 with 4.61
  9. ^ R Tutorial: Chi-squared Distribution

Literatura

[uredi | uredi izvor]

Spoljašnje veze

[uredi | uredi izvor]