Mivel kiszámítható a konfidencia intervallum a p-értékekhez, és mivel az intervallumbecslés ellentéte a pontbecslés: Pontérték-e a p-érték?
Mivel kiszámítható a konfidencia intervallum a p-értékekhez, és mivel az intervallumbecslés ellentéte a pontbecslés: Pontérték-e a p-érték?
A pontbecslések és a konfidencia intervallumok olyan paraméterekre vonatkoznak, amelyek leírják az eloszlást, pl. átlag vagy szórás.
De más minta statisztikákkal ellentétben, mint a minta átlaga és a minta szórása, a p-érték nem hasznos becslése egy érdekes eloszlási paraméternek. Tekintse meg a @whuber válaszát a technikai részletekért.
A tesztstatisztika p-értéke megadja annak valószínűségét, hogy a tesztstatisztika várható értékétől való eltérés legalább akkora legyen, mint azt a a minta, feltételezve, hogy a nullhipotézis igaz. Ha a teljes eloszlás megvan, akkor vagy összhangban áll a nullhipotézissel, vagy nem. Ezt az indikátor változóval írhatjuk le (ismét lásd a @whuber válaszát).
De a p-érték nem használható a mutató változó hasznos becslőjeként, mert nem következetes, mivel a p -érték nem konvergál a minta méretének növekedésével, ha a nullhipotézis igaz. Ez egy meglehetősen bonyolult alternatív módszer annak megállapítására, hogy egy statisztikai teszt elutasíthatja vagy elutasíthatja a nullát, de soha nem erősíti meg.
Igen, lehet (és vitatták), hogy a p-érték pontbecslés.
Az eloszlás bármely tulajdonságának azonosítása érdekében a p- becsülheti az értéket, feltételeznünk kell, hogy aszimptotikusan elfogulatlan. De aszimptotikusan a nullhipotézis átlagos p-értéke $ 1/2 $ (ideális esetben egyes teszteknél ez más nem null szám lehet), és bármely más esetén hipotézis ez: $ 0 $ . Így a p-érték a nullhipotézis mutatófüggvényének fele becslőjének tekinthető.
Igaz, hogy némi kreativitásra van szükség egy p-érték ilyen módon történő megtekintéséhez. Kicsit jobban tehetnénk, ha a szóban forgó becslőt úgy tekintenénk meg, mint a p-érték segítségével meghozott döntést : a mögöttes eloszlás a nullhipotézis vagy az alternatív hipotézis tagja? Nevezzük ezt a lehetséges döntések halmazát $ D $ . Jack Kiefer írja
Feltételezzük, hogy van olyan kísérlet, amelynek eredményét a statisztika megfigyelheti. Ezt az eredményt egy véletlenszerű változó vagy véletlenszerű vektor írja le $ X $ .... A $ X $ valószínűségi törvénye ismeretlen a statisztikus számára, de ismert, hogy a $ F $ A (z) $ X $ span> egy meghatározott osztályú $ \ Omega $ elosztási függvény tagja. ...
A statisztikai probléma állítólag a pontbecslés problémája, ha a $ D $ a gyűjtemény a $ F $ valamilyen valós vagy vektor által értékelt tulajdonságának lehetséges értéke, amely a $ F $ függvényében ésszerű módon.
Ebben az esetben, mivel a $ D $ diszkrét, az "ésszerűen sima" egyáltalán nem korlátozás. Kiefer terminológiája ezt tükrözi, amikor a diszkrét döntési terekkel rendelkező statisztikai eljárásokat "tesztként" nevezi meg "pontbecslők" helyett.
Bár érdekes felfedezni az ilyen definíciók korlátait (és korlátait), mint ez a kérdés felkér minket, hogy tegyük meg, talán nem kellene túlságosan is ragaszkodnunk ahhoz, hogy a p-érték pontbecslő, mert a becslők és a tesztek közötti különbségtétel hasznos és konvencionális is.
A Christian Robert erre a kérdésre hívta fel a figyelmet egy 1992-es cikkre, ahol társszerzőkkel pontosan ezt a nézőpontot vették fel, és elemezték a p-érték mint az indikátorfüggvény becslőjének elfogadhatóságát . Lásd az alábbi hivatkozások linkjét. A cikk kezdődik,
A hipotézisek tesztelésének megközelítései a tesztelés problémáját általában a döntéshozatal, nem pedig a becslés egyikeként kezelték. Pontosabban, egy formális hipotézis-teszt következtetést von le arról, hogy a hipotézis igaz-e, és nem nyújt bizonyítékot ahhoz, hogy társuljon ehhez a következtetéshez. Ebben a cikkben a hipotézis tesztelést becslési problémának tekintjük a döntés-elméleti keretek között ....
[Kiemelés tőlem.]
Jiunn Tzon Hwang, George Casella, Christian Robert, Martin T. Wells és Roger H. Farrell, A tesztelés pontosságának becslése . Ann. Stat. 20. kötet, 1. szám (1992), 490-509. Nyílt hozzáférés.
Jack Carl Kiefer, Bevezetés a statisztikai következtetésekbe . Springer-Verlag, 1987.
$ p $ -értékeket nem használják bármely érdekes paraméter becslésére, hanem hipotézis tesztelésre. Érdekelhet például a $ \ mu $ populáció becslése a rendelkezésére álló minta alapján, vagy érdekelheti annak intervallumbecslése, de a hipotézis tesztelési forgatókönyvben inkább összehasonlítaná a minta átlagát $ a népesség értéke $ \ mu $, hogy lássa, különböznek-e. Valójában a hipotézis tesztelési forgatókönyvben nem érdekli az adott értékük, sokkal inkább, ha valamilyen küszöb alatt vannak (pl. $ P < 0,05 $). A $ p $ -values-val nem annyira érdekelnek a pontértékeik, sokkal inkább azt szeretné tudni, hogy adatai elegendő bizonyítékot szolgáltatnak-e a nullhipotézis ellen. Hipotézis tesztelési szcenárióban nem hasonlítanád össze a különböző $ p $ értékeket, hanem inkább mindegyiket felhasználnád külön döntések meghozatalára a hipotézisekkel kapcsolatban. Nem igazán akar semmit sem tudni a hajótest hipotéziséről, amennyire tudja, el tudja-e utasítani vagy sem. Ez értékeiket elválaszthatatlanná teszi a döntési kontextustól, és ezért eltérnek a pontbecsléstől, mert a pontbecslésekkel önmagukban érdekelnek az értékeik.