Kérdés:
A statisztikai modell és a valószínűségi modell közötti különbségek?
Honglang Wang
2012-06-23 23:40:02 UTC
view on stackexchange narkive permalink

Az alkalmazott valószínűség a valószínűség fontos ága, ideértve a számítási valószínűséget is. Mivel a statisztikák a valószínűségelméletet használják az adatok kezelésére szolgáló modellek felépítésére, megértésem szerint kíváncsi vagyok, mi a lényeges különbség a statisztikai modell és a valószínűségi modell között? A valószínűségi modellnek nincs szüksége valós adatokra? Köszönöm.

Egy válasz:
user10525
2012-06-24 00:46:28 UTC
view on stackexchange narkive permalink

A Valószínűségi modell a $ (\ Omega, {\ mathcal F}, {\ mathbb P}) $ hármasból áll, ahol a $ \ Omega $ a mintaterület, $ {\ mathcal Az F} $ egy $ \ sigma $ −algebra (események), a $ {\ mathbb P} $ pedig a $ {\ mathcal F} $ valószínűségének mértéke.

Intuitív magyarázat . A valószínűségi modell értelmezhető ismert véletlen változóként $ X $. Például legyen a $ X $ normálisan elosztott véletlen változó, átlagos $ 0 $ és variancia $ 1 $. Ebben az esetben a $ {\ mathbb P} $ valószínűségmérő a kumulatív elosztási függvényhez (CDF) $ F $ -

$$ F (x) = {\ mathbb P} (X \ leq x) = {\ mathbb P} (\ omega \ in Omega: X (\ omega) \ leq x) = \ int _ {- \ infty} ^ x \ dfrac {1} {\ sqrt {2 \ pi}} \ exp \ left ({- \ dfrac {t ^ 2} {2}} \ right) dt. $$

Általánosítások . A valószínűségi modell meghatározása a valószínűség matematikai meghatározásától függ, lásd például Szabad valószínűség és Kvantum valószínűség.

A Statisztikai modell a valószínűségi modellek $ {\ \ mathcal S} $ összessége, vagyis a $ \ Omega $ mintaterületen található valószínűségi mértékek / eloszlások halmaza.

Ezt a valószínűségeloszlás-halmazot általában egy bizonyos jelenség modellezésére választják ki, amelyből adataink vannak.

Intuitív magyarázat . Egy statisztikai modellben mind a paraméterek, mind az eloszlás, amelyek egy bizonyos jelenséget leírnak, ismeretlenek. Példa erre a Normál eloszlások családja, átlagos $ \ mu \ in {\ mathbb R} $ -val és $ \ sigma ^ 2 \ szórással {\ mathbb R _ +} $ -ban, vagyis mindkét paraméter ismeretlen, és Ön általában az adatkészletet a paraméterek becsléséhez szeretné használni (azaz kiválasztani a $ {\ mathcal S} $ elemét). Ez a disztribúciókészlet tetszőleges $ \ Omega $ és $ {\ mathcal F} $ esetén választható, de ha nem tévedek, egy valós példában csak az ugyanazon a $ (\ Omega, {\ mathcal F }) $ ésszerű megfontolni.

Általánosítások . Ez a cikk a statisztikai modell nagyon formális meghatározását nyújtja, de a szerző megemlíti, hogy "A Bayes-modellhez egy további összetevőre van szükség egy előzetes eloszlás formájában. Bár a Bayes-formulációk nem az elsődleges fontosságúak ebben a cikkben ". Ezért a statisztikai modell meghatározása attól függ, hogy milyen modellt használunk: paraméteres vagy nem paraméteres. A paraméteres beállításban is a definíció a paraméterek kezelésének módjától függ (pl. Klasszikus vagy Bayes-i).

A különbség a következő: egy valószínűségi modellben pontosan ismeri a valószínűség mértékét , például egy $ \ mbox {Normal} (\ mu_0, \ sigma_0 ^ 2) $, ahol $ \ mu_0, \ sigma_0 ^ 2 $ ismert paraméterek, míg egy statisztikai modellben az eloszlások halmazát vesszük figyelembe, például $ \ mbox {Normal} (\ mu, \ sigma ^ 2) $, ahol a $ \ mu, \ sigma ^ 2 $ ismeretlen paraméterek.

Egyik sem igényel adatkészletet, de azt mondanám, hogy a modellezéshez általában statisztikai modellt választanak.

Így a Valószínűségi Modellek matematikai úton vizsgálják a modellek tulajdonságait, míg a statisztikai modellek csak az adatok felhasználásával választják ki a megfelelő valószínűségi modellt. Jobb?
@HonglangWang Ez bizonyos mértékig helyes. A fő különbség az, hogy a valószínűségi modell csak egy (ismert) eloszlás, míg a statisztikai modell a valószínűségi modellek összessége; az adatok felhasználásával kiválasztanak egy modellt ebből a halmazból, vagy egy kisebb modellcsoportot, amely jobban (bizonyos értelemben) jobban leírja a jelenséget (az adatok fényében).
(+1) Ez egy szép válasz, bár van néhány hozzászólásom. Először is, azt hiszem, ez egy kicsit eladhatja a probabilist. Egyáltalán nem ritka, hogy egy valószínűségi modellben egy valószínűségi terek halmazát vesszük figyelembe, sőt, a lehetséges mértékek akár * véletlenszerűek is lehetnek (megfelelő nagyobb térre felépítve). Másodszor, egy Bayes-i (különösen) ezt a választ kissé zavarónak találhatja, mivel a Bayes-i statisztikai modell gyakran egyetlen valószínűségmodellként tekinthető a megfelelő terméktérre $ \ Omega \ times \ Theta $.
@gung Kicsit módosítottam a válaszomat, hogy megpróbáljam kitölteni néhány kérdését. Nehéz meghatározni ezeket a modelleket mindenféle közönség számára. Például a bíboros hivatalosabb meghatározásokat kér, míg Ön inkább egy intuitívabbat szeretne. Megpróbáltam mindkét irányba megjegyzéseket foglalni, de egyáltalán nem célja ennek a témának a teljes lefedése (ami meglehetősen kiterjedt, sőt ellentmondásos).
@Procrastinator, Úgy gondolom, hogy jó munkát végzett, és biztosan elismerem, hogy ezeknek a dolgoknak a megmagyarázása nagyon nehéz lehet, ha a közönségének bimodális terjesztése van. Nagyra értékelem a pontosításokat; Még mindig kíváncsi vagyok egy kicsit a normálisra: tehát a $ \ mathbb P $ a normális CDF, igazam van, hogy a $ \ Omega $ a valódi szám? Mi a $ \ mathcal F $ a normál értéknek? Nekem ez a legtitokzatosabb.
@gung Ez egy inkább az elmélethez kapcsolódó kérdés. Az első kérdéseddel kapcsolatban a $ {\ mathbb P} $ értéket valóban a CDF határozza meg. Most a $ \ Omega $ értelmezése a bonyolult, mert formailag a $ {\ mathbb P} (X \ leq x) $ jelentése $ {\ mathbb P} (\ omega \ in Omega: X (\ omega) \ leq x) $, akkor a $ \ Omega $ nem megfigyelhető értékek. A $ {\ mathcal F} $ egy $ \ sigma- $ algebra, amely a Borel $ \ sigma- $ algebra előzetes képe $ X $ alatt, ez megint nem figyelhető meg. Nem tudom, hogyan magyarázzam ezt intuitív szinten.
Úgy látom, ez valóban segít egy kicsit. Még egyszer köszönöm, +1.
@gung: Érdemes megfontolnia kérdéseinek és kétségeinek megfogalmazását, és külön kérdésként való közzétételt, ha még nem áll rendelkezésre másolat. Egészségére.
@gung $ \ Omega $ az * alkalmazástól * függ; az elmélet nem határozza meg. Például a $ \ Omega $ lehet egy Brown-mozgáshalmaz, amely leírja egy pénzügyi derivatív árát, és $ X $ lehet egy fix időpontban elért érték, $ t $. Egy másik alkalmazásban a $ \ Omega $ lehet egy sor ember, a $ X $ pedig az alkar hossza. Általában a $ \ Omega $ a * fizikai * vizsgálati objektumok matematikai modellje, a $ X $ pedig az objektumok numerikus tulajdonsága. A $ \ mathcal {F} $ a lehetséges események összessége: azok a helyzetek, amelyeknek valószínûséget szeretnénk tulajdonítani.
Az @whuber, +1, a normális eloszlás esetét figyelembe véve, azt jelentené, hogy $ \ mathcal F $ a valós szám?
Az @gung $ \ mathcal {F} $ egy * szigma algebra *: részhalmazok ("események") gyűjteménye. A pénzügyi alkalmazásban ez ártörténetek összessége; az alkar mérési alkalmazásban az események * emberek halmazai lennének. * Erről többet beszélhetünk, ha szeretne egy csevegőszobában.


Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...