Jensen-egyenlőtlenség
A Jensen-egyenlőtlenség elegáns közös kiterjesztését adja számos matematikai egyenlőtlenségnek.
Ha egy véges vagy végtelen intervallumon az függvény konvex, , valamint nem negatív számok, amelyekre teljesül a összefüggés, akkor
Ha f szigorúan konvex, akkor egyenlőség csakis az esetben teljesül.
Ha f konkáv, akkor az állítás fordított irányú egyenlőtlenséggel teljesül, azaz:Például az függvény szigorúan konvex a valós számok halmazán, így ha tetszőleges, , akkor
ami éppen a számtani és négyzetes közép közötti egyenlőtlenség. Egyenlőség akkor és csak akkor áll fenn, ha
Hasonlóképpen a konkáv x log x függvényt használva azt kapjuk, hogy bármely pozitív számokra
Mivel a jobb oldal logaritmusa, a számtani és mértani közép közötti egyenlőtlenséget kapjuk.
Jensen egyenlőtlensége
[szerkesztés]A matematikában Jensen egyenlőtlensége, amit a dán matematikusról, Johan Jensenről, neveztek el, összefüggésbe hozza egy konvex függvény értékét a konvex függvény integráljával. Ezt 1906-ban bizonyította Jensen. Az általánosságára tekintettel az egyenlőtlenség megjelenik sok alakban, ami a kontextustól függ (és amiknek egy része az alábbiakban kerül bemutatásra).
Az egyenlet véges képlete volt a logója a Matematikai Tudományok Intézetének a Koppenhágai Egyetemen 2006-ig.
Állítások
[szerkesztés]Jensen egyenlőtlenségének klasszikus képlete magába foglal különféle számokat és súlyokat. Az egyenlőtlenséget ki lehet fejezni eléggé általánosságban használva a mértékelméletet vagy egyenértékű valószínűségszerű jelölést. Ebben a valószínűség szerinti felállításban az egyenlőtlenséget tovább lehet általánosítani a teljes érvényességéig.
A véges képlet
[szerkesztés]Ha egy φ függvény konvex egy valós intervallumon, ahol -k ezen intervallum elemei és -k a súlyok, Jensen egyenlőtlenségét ki lehet fejezni a következő formában:
- .
Az egyenlőtlenség iránya nyilvánvalóan fordított, ha φ konkáv.
Konkrét eset, ha a súlyok mind egyenlőek 1-gyel, akkor:
- .
Konkáv log(x) függvény (megjegyzés: használhatjuk Jensen egyenlőtlenséget a függvény konvexitásának vagy konkávitásának bizonyítására, valós intervallumon.) Behelyettesítve -et az előző képletbe, a számtani és mértani közép közötti egyenlőtlenséget kapjuk:
- .
Ha a változó x egy másik t változó függvénye xi = g(ti). Általánosan a következőt kapjuk: ai–ket felváltja egy nem negatív integrálható f(x)függvény, mint például egy valószínűségi eloszlás, a szummákat pedig integrálok.
Az elméleti mértéktér és a valószínűség szerinti képlet
[szerkesztés]Legyen (Ω,A,μ) egy mértéktér μ(Ω) = 1. Ha g egy valós értékű függvény, ami μ szerint integrált φ pedig egy mérhető konvex függvény, akkor:
Valószínűségelméletben legyen egy valószínűségtér , X egy integrált valós értékű változó és φ egy mérhető konvex függvény. Akkor:
Ekkor a valószínűségelméletben, a mértéknek (μ) megfeleltethető egy valószínűség , μ-nek egy várható érték , és g a függvénynek egy véletlen változó X.
Általánosan az egyenlőtlenség egy valószínűség szerint
[szerkesztés]Általánosan legyen T egy valós vektortér, X egy T értékű integrálható véletlen változó. Az integrálhatóság azt jelenti, hogy bármely T elem számára T: , z eleme T létezik egy T elem, úgy hogy . Ekkor minden mérhető konvex φ függvényre és minden σ-algebra-rára :
Ez a kijelentés általánosítja az előzőt, amikor a T vektortér a tengely és a triviális σ-algebra .
Bizonyítások
[szerkesztés]A Jensen-egyenlőtlenség grafikus bizonyítása egy lehetséges esetben. A szaggatott görbe az X tengely mentén X feltételezett eloszlása, míg a szaggatott görbe az Y tengely mentén a megfelelő eloszlású Y értékek. Vegyük észre, hogy X egyre növekedő értékei mellett Y(X) egyre jobban növeli az eloszlást.
Jensen egyenlőtlenségének bizonyítása különféle módon történhet, és három különböző fent említett, különböző állításoknak megfelelő bizonyítás ajánlott. Ám mielőtt megkezdenénk ezeket a matematikai bizonyításokat, érdemes elemezni a grafikus bizonyítást a valószínűség szerinti eset alapján, ahol X egy valós szám, (lásd az ábrát). Elfogadva az X értékeknek egy feltételezett eloszlását, azonnal azonosíthatjuk az és a képe értéket a grafikonon. Észrevehetjük a megfelelő értékek eloszlása egyre inkább nő az X növekedő értékeik mellett, és az Y eloszlása szélesebb, az X > X0 intervallumban, és keskenyebb X <X0 intervallumban bármilyen X0 számára; különösen igaz ez esetére. Következésképpen beláttuk, hogy Y mindig el fog mozdulni felfelé, tekintettel pozíciójára. Ezzel bebizonyítottuk az egyenlőtlenséget, azaz:
Egyenlőség akkor áll fenn, amikor nem szigorúan konvex, például amikor ez egy egyenes. A bizonyításokat ez az intuitív elképzelés a következőkben fogalmazza meg:
1. bizonyítás (véges képlet)
[szerkesztés]Ha λ1 és λ2 két tetszőleges pozitív valós számok, melyekre λ1 + λ2 = 1, akkor konvexitása miatt:
- -re.
Általánosan: ha λ1 , λ2 , …, λn pozitív valós számok, melyekre λ1 + … + λn = 1, akkor
bármennyi x1 , …, xn számára. A Jensen-egyenlőtlenségnek ezt a véges képletét teljes indukcióval bizonyíthatjuk be. Ha n = 2 az állítás igaz. Tegyük fel, hogy n-re igaz az állítás, és bizonyítsuk n + 1-re. Ha legalább egy λi λ>0 például λ> 1 ; akkor konvexitás miatt:
Mivel , felhasználva feltevésünket a képlet utolsó kifejezésében megkapjuk az eredményt, név szerint a Jensen-féle véges képletű egyenlőtlenséget.
Azért, hogy megkapjuk az általános egyenlőtlenséget ebből a véges képletből, használjunk egy sűrűségérvet. A véges képletet újra fel lehet írni úgy, mint:
ahol μn egy mérték, amit a Dirac-delták egy tetszőleges kombinációja ad:
Mivel a konvex függvények folytonosak, és mivel a Dirac-delták kombinációi gyengén sűrűek az általános állítást egyszerűen megkapjuk.
2. bizonyítás (elméleti-határ képlet)
[szerkesztés]Legyen g egy valós értékű μ-integrálható függvény egy Ω mértéktérben, és legyen φ, egy konvex függvény a valós számok halmazán. Határozzuk meg φ jobb oldali deriváltját:
Mivel φ konvex, a jobb oldali hányados ahogy a t közelíti a 0-t jobbról, egyre csökken és alulról korlátos.
Ha t < 0, a határértéke mindig létezik.
Legyen:
Akkor minden x -re ax + b ≤ φ(x). Ha x > x0 , és t = x − x0 > 0. Akkor,
Tehát,
ahogyan azt bizonyítani akartuk. x < x0 esetében hasonlóan bizonyíthatjuk. Ha ax + b = φ(x0).
φ(x 0 ) akkor átírhatjuk a képletet
- - alakúra.
De mivel μ(Ω) = 1, tehát minden valós k számra
Így:
3. Bizonyítás (általános egyenlőtlenség egy valószínűség szerint)
[szerkesztés]Legyen X egy integrálható valószínűségi változó, az értéket egy valós T vektortérből veszi. Mivel konvex, minden -re
ahogy θ megközelíti a 0+ -t, ez az érték csökken. φ deriváltja X szerint az Y irányába:
Látható, a differenciál lineáris y-ban van és mivel korábban beláttuk, hogy a jobb oldal infimuma kisebb mint az értéke a θ = 1 –nél.
Egy tetszőleges sub-σ-algebrára az utolsó egyenlőtlenség szerint, ha fennáll, akkor
Ebből következve megkapjuk az eredményt, mivel:
Alkalmazások és speciális esetek
[szerkesztés]Képlet, amely magában foglal egy valószínűség szerinti sűrűség függvényt
[szerkesztés]Tételezzük fel, hogy Ω egy valós sorozat mérhető alhalmaza és f(x) egy nem negatív függvény, melyre:
Probabilisztikus nyelvben, f egy valószínűségi sűrűség-függvény.
Jensen egyenlőtlensége a következő állítássá válik:
Bármilyen g valós értékű függvény és φ konvex a g tartománya fölött, akkor
Ha g(x) = x, akkor az egyenlőtlenségnek ez a formája redukálódik egy általában használt speciális esetre:
Alternatív véges képlet
[szerkesztés]Ha Ω véges halmaz , és ha μ egy megszámlálható mérték az Ω-án, akkor az általános alak redukálódik egy összegekről szóló állításra:
feltéve ha
Van egy képlet Ω –re is.
Statisztikus fizika
[szerkesztés]Jensen egyenlőtlensége a statisztikai fizikában különös fontosságú akkor, amikor a konvex függvény exponenciális. Adva van:
ahol a zárójel a várható értékekre utal tekintettel néhány valószínűségi eloszlásra a véletlenszerű X változóban.
A bizonyítás ebben az esetben nagyon egyszerű (cf. Chandler, Sec. 5.5). A következő egyenlőtlenséget alkalmazva:
Kapjuk a végső exponenciális egyenlőtlenséget:
Információelmélet
[szerkesztés]Ha p(x) x valószínűségi változó valódi eloszlás, és q(x) másik eloszlás, akkor Jensen egyenlőtlenségét alkalmazva Y(x) = q(x)/p(x)-re a véletlen változóra, a függvény legyen φ(y) = −log(y) így a Gibbs-egyenlőtlenséget kapjuk.
Ez megmutatja, hogy az átlagos üzenethossz minimalizált, amikor kódokat jelölnek ki valódi valószínűségek alapján. Az a nemnegatív mennyiség, (q-nak távolsága p-től) a Kullback–Leibler-távolság.
Rao–Blackwell-tétel
[szerkesztés]Ha L egy konvex függvény, akkor Jensen egyenlőtlenségéből, megkapjuk, hogy:
Tehát ha δ(X) torzítatlan becslés θ paraméterre T(X) egy elégséges statisztika θ-ra, egy kisebb várt veszteség birtokában L, számolás útján elérhető. Megadható olyan L becslés, mely hatásosabb mint δ(X).
torzítatlan θ-ra, és X függvénye.
Ezt az eredményt a Rao–Blackwell-tételként ismerik.
Kapcsolódó szócikkek
[szerkesztés]Források
[szerkesztés]- Walter Rudin (1987): Valós és komplext elemzés. McGraw-Hill. ISBN 0-07-054234-1
- David Chandler (1987): Bevezetés a modern statisztikus mechanikába. Oxford. ISBN 0-19-504277-8
- Jensen, Johan Ludwig William Valdemar (1906): "Sur les fonctions* convexes* et les inégalités* entre* les valeurs* moyennes*". Acta Mathematica 30: 175-193
További információk
[szerkesztés]- Eric W Weisstein: Jensen egyenlőtlenség - A matematika világa
- Jensen egyenlőtlensége logóként szolgált a Koppenhágai Egyetem Matematikai Szakosztálya számára.