Kérdés:
A statisztika teljességének jelentése?
Tim
2013-03-24 04:25:13 UTC
view on stackexchange narkive permalink

A Wikipédiából:

A $ s $ statisztika állítólag teljes az $ X $ eloszlásához, ha minden mérhető függvényhez $ g $ (ami független kell lennie a $ be $ paramétertől, a következő implikáció érvényes: $$ \ mathbb {E} _ \ theta [g (s (X))] = 0, \ forallθ \ text {arra utal, hogy} P_θ (g (s ( X)) = 0) = 1, \ forall θ. $$ A $ s $ statisztika állítólag korlátozottan teljes, ha a következtetés érvényes az összes korlátozott $ g $ függvényre.

I olvassa el és állapítsa meg Xi'an és phaneron véleményét, miszerint a teljes statisztika azt jelenti, hogy "ez alapján csak egy elfogulatlan becslő lehet".

  1. De én nem értem, mit mond a Wikipedia ugyanezen cikk elején:

    Lényegében ez (a teljesség egy statisztika tulajdonsága) olyan feltétel, amely biztosítja, hogy a valószínűségeloszlás paraméterei a modellt képviselő mind becsülhető a statisztika alapján: biztosítja, hogy a t-nek megfelelő eloszlások t o a paraméterek különböző értékei különböznek egymástól.

    • A teljesség milyen értelemben (és miért) "biztosítja, hogy a paraméterek különböző értékeinek megfelelő eloszlások megkülönböztessék" ? "az eloszlások" egy teljes statisztika eloszlása?

    • Milyen értelemben (és miért) teszi a teljesség "biztosítja, hogy a modellt reprezentáló valószínűségi eloszlás paraméterei mind elérhetőek legyenek a statisztika alapján becsüljük meg? "

  2. [Opcionális: Mit jelent a" korlátozott teljesség "a teljességhez képest?]

Ellenőrizze ezt a másik kérdést: http://stats.stackexchange.com/questions/41881/what-is-complete-sufficient-statistics
@Zen:Tköszönöm! Miért van szükségünk akkor a "korlátozott teljességre"?
Mindkettő olyan technikai (szabályszerűségi) feltétel, amely értelmesebb annak a tételnek a bizonyításában, amelyben részt vesznek. Ennélfogva tanácsom a Lehmann-Scheffé-tétel, a Bahadur-tétel és a Basu-tétel bizonyítékainak tanulmányozása lenne.
Nagyon szkeptikus vagyok, hogy a teljesség önmagában magában foglalja a paraméterek azonosíthatóságát: kezdjen el egy teljes statisztikát a $ \ theta $ által indexelt disztribúciócsaládról, és adjon hozzá egy extra és haszontalan $ \ eta $ paramétert.Ekkor a statisztika teljes marad.
Lásd még a megfelelő válaszomat [itt] (https://stats.stackexchange.com/questions/196601/what-is-the-intuition-behind-defining-completeness-in-a-statistic-as-being-impos)
Három válaszokat:
Lhunt
2015-01-02 01:41:42 UTC
view on stackexchange narkive permalink

Ez egy nagyon jó kérdés, amellyel már jó ideje küzdök. Így döntöttem a gondolkodás mellett:

Vegyük a definíció kontrapozitívját a Wikipédiában leírtak szerint (ami egyáltalán nem változtatja meg a logikai jelentést):

\ begin {align} {\ rm If} \ quad & \ neg \ \ all \ theta \ P (g (T (x)) = 0) = 1 \\ {\ rm then} \ quad & \ neg \ \ forall \ theta \ E (g (T (x))) = 0 \ end {align}

Más szavakkal, ha van olyan paraméterérték, hogy $ g (T (x)) $ szinte biztosan nem $ 0 $, akkor van egy olyan paraméterérték, hogy a statisztika várható értéke nem $ 0 $.

Hmm. Mit is jelent ez?

Tegyük fel a kérdést, mi történik, ha a $ T (x) $ NEM teljes ...

A NEM teljes $ T (x) $ statisztika legalább egy paraméterértékkel rendelkezik, így a $ g (T (x)) $ nem biztos, hogy $ 0 $ ehhez az értékhez, és mégis várható értéke $ 0 $ az összes paraméterértéknél (beleértve ezt is).

Más szavakkal, vannak olyan $ \ theta $ értékek, amelyekre a $ g (T (x)) $ nem triviális eloszlású (körülötte van némi véletlenszerű variáció), és mégis a $ várható értéke A g (T (x)) $ ennek ellenére mindig $ 0 $ - nem mozdul el, függetlenül attól, hogy a $ \ theta $ mennyiben különbözik.

Teljes statisztika, másrészt meg fog mozdulni a várható értékén, ha $ g (T (x)) $ nem triviálisan oszlik el, és $ 0 $ -ra összpontosul valamilyen $ \ theta $ esetében.

Másképp fogalmazva, ha találunk egy $ g (\ cdot) $ függvényt, ahol a várható érték nulla valamilyen $ \ theta $ értéknél (mondjuk $ \ theta_0 $), és ennek nem triviális eloszlása ​​van, ha ezt az értéket $ \ theta $, akkor kell még egy va odakint $ \ theta $ (mondjuk $ \ theta_1 \ ne \ theta_0 $), ami más elvárást eredményez $ g (T (x)) $ számára.

Ez azt jelenti, hogy ezt a statisztikát ténylegesen felhasználhatjuk hipotézisek teszteléséhez és informatív becsléshez adataink feltételezett eloszlásának összefüggésében. Szeretnénk a $ \ theta $ feltételezett értéke köré összpontosítani, és elérni, hogy 0 várakozással számoljon a feltételezett $ \ theta $ értékre, de a $ \ theta $ összes többi értékére nem. De ha a statisztika nem teljes, akkor előfordulhat, hogy ezt nem tudjuk megtenni: előfordulhat, hogy nem tudjuk elutasítani a $ \ theta $ feltételezett értékeit. De akkor nem tudunk konfidencia intervallumokat építeni és statisztikai becslést végezni.

Üdvözöljük a webhelyen, és köszönjük, hogy közreműködtek ebben.Megvállaltam a szabadságot, hogy formázzuk válaszát a webhelyünk által biztosított $ \ LaTeX $ jelöléssel.Ha nem tetszik, gördítsd vissza bocsánatkérésemmel.(Ha tetszik, további információ található a [itt] formázásról (http://stats.stackexchange.com/help/formatting).) Mivel új vagy itt, miért ne [regisztrálnod] (http: //stats.stackexchange.com/help/account) fiókját, és vegye fel a [túránkat] (http://stats.stackexchange.com/tour), amely információkat tartalmaz az új felhasználók számára.
Bjørn Kjos-Hanssen
2015-01-02 03:03:06 UTC
view on stackexchange narkive permalink

Geometriai szempontból a teljesség ilyet jelent: ha a $ g (T) $ vektor merőleges a p.d.f-re. $ f_ \ theta $ / $ T $ minden egyes $ \ theta $, $$ \ mathbb E_ \ theta g (T) = \ langle g (T), f_ \ theta \ rangle = 0 $$, majd $ g (T) = 0 $, azaz a $ f_ \ theta $ függvények a $ \ theta $ változtatásához átfogják a $ T $ függvényeinek teljes terét. Tehát bizonyos szempontból természetesebb lenne azt mondani, hogy

$ \ theta $ teljes $ T $

, mint amit mondunk,

$ T $ elkészült a $ \ theta $ fájlhoz.

Így nem olyan furcsa, hogy egy állandó függvény "teljes" lenne!


Talán egy példa segít.

Tegyük fel, hogy a $ X $ és a $ Y $ függetlenek és azonos eloszlású Bernoulli ($ \ theta $) véletlen változók veszik az értékeket $ \ {0, 1 \} $, és $ Z = XY $. Ekkor a $ Z $ hiányos a (z) $ \ theta $ esetében, mert a $ g = \ text {identity} $, $$ \ mathbb E_ \ theta (Z) = 0 $$ összes $ 0< \ theta<1 $ értékre, de ennek ellenére $ \ mathbb P_ \ theta (Z = 0) \ ne 1 $.

Ez megmutatja, hogy mit jelent a "cxompleteness" Hilbert térbeállításokban
Semoi
2017-06-15 16:52:37 UTC
view on stackexchange narkive permalink

Nagyon hasznosnak találtam ezt:

Definíció: A statisztikát $ T $ teljes -nek nevezzük, ha $ E_ \ theta [g (T)] = 0 $ mindenki számára $ \ theta $ és néhány $ g $ függvény azt jelenti, hogy $ P_ \ theta (g (T) = 0) = 1 $ az összes $ \ theta $ esetében.

Gondoljon erre, mint a vektorok analógjára, és arra, hogy a {$ v_1, \ ldots, v_n $} vektorok alkotják-e a vektortér teljes halmazát (= alapját).

  • Ha az egész teret lefedik, akkor bármelyik $ v $ lineáris kombinációként írható fel ezeknek a vektoroknak: $ v = \ sum_j a_j \ cdot v_j $.
  • Továbbá, ha a $ w $ vektor merőleges az összes $ v_j $ -ra, akkor $ w = 0 $.

A teljességdefinícióval való kapcsolat megteremtése érdekében vegyük fontolóra egy diszkrét valószínűségeloszlás esetét. A teljesség feltételének kiírásával kezdjük $$ 0 = E_ \ theta [g (t)] = \ sum_t g (t) \ cdot P_ \ theta (T = t) = \ sum_j g (t_j) \ cdot P_ \ theta (T = t_j) = \ begin {bmatrix} g (t_1) \\ g (t_2) \\ \ ldots \\ g (t_n) \\ \ end {bmatrix} \ cdot \ begin {bmatrix} p_ \ theta (t_1) \\ p_ \ theta (t_2) \\ \ ldots \\ p_ \ theta (t_n) \\ \ end {bmatrix} $$ az összes $ \ theta $. Itt az összeget két vektor skaláris szorzataként fejeztük ki $$ (g (t_1), g (t_2), ...) $$ és $$ (p_ \ theta (t_1), p_ \ theta (t_2), ...) $$, $ p_ \ theta (t_j) = P_ \ theta (T = t_j) \ ne 0 $ - csak ezt vesszük figyelembe pozitív valószínűség, mert ha $ p (t_j) = 0 $, ez nem mond semmit a $ g (t_j) $ függvényről. Most látjuk a fent tárgyalt ortogonalitási feltétel analógiáját.

Elvileg előfordulhat, hogy a $ g (t_j) $ értéke nem nulla, de nullára összegezhetõ. Amint azonban Lhunt kijelentette, ez csak akkor lehetséges, ha

  • a $ (p_ \ theta (t_1), p_ \ theta (t_2), ...) valószínűségi vektor egyáltalán nem változik, ha a $ \ theta $ változik,
  • vagy ha "egyszerű módon" változik, pl. az összes $ j $ egyik értékéről egy másikra ugrik az összes $ j $ értékre,
  • vagy ha "összefüggő módon" változik, amit rémálommal lehetne kezelni.

Így a kifejezések kereszttörlése csak akkor lehetséges, ha a valószínűségeloszlás vagy "unalmas bázisvektorok halmazát", vagy rémálmot nyújt.

Ezzel szemben, ha a valószínűségeloszlás "elegendő gazdag alapvektor-halmazt ad", akkor a várakozási érték egyenlete $ g (t_j) = 0 $ szinte mindenhol . szinte mindenhol alatt azt értjük, hogy lehet egy nulla valószínűségi halmaz, ahol $ g (t_j) \ ne 0 $ - pl.folyamatos valószínűségi eloszlás esetén ez egyetlen pont halmaza lehet.

Azt is látjuk, hogy a terminológia kissé félrevezető.Helyesebb lenne a $ p_ \ theta (\ cdot) $ teljesnek nevezni a disztribúciócsaládot (nem pedig a $ T $ statisztikát) - ahogy az eredeti kérdés is kimondta.A teljesség mindenképpen azt jelenti, hogy a $ \ theta $ összes lehetséges értékének disztribúcióinak összegyűjtése kellően gazdag vektorkészletet biztosít.



Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...