Mindkét teszt implicit módon modellezi az életkor-válasz összefüggést, de különböző módon teszik ezt. Melyiket választja, attól függ, hogyan választja meg a kapcsolatot. A választásnak egy mögöttes elmélettől kell függenie, ha van ilyen; hogy milyen információkat szeretne kinyerni az eredményekből; és a minta kiválasztásának módjáról. Ez a válasz sorrendben tárgyalja ezt a három szempontot.
Leírom a t-tesztet és a logisztikai regressziót olyan nyelv használatával, amely azt feltételezi, hogy jól körülhatárolt embercsoportot tanul, és következtetéseket kíván levonni a minta ennek a populációnak.
Bármilyen statisztikai következtetés alátámasztása érdekében feltételezzük, hogy a minta véletlenszerű.
-
A t-teszt feltételezi, hogy a "nem" válaszadó mintában szereplő emberek a véletlenszerű válaszadók a populáció összes nem válaszadójának véletlenszerű mintája, és hogy a "válasz" válaszban szereplő emberek a populáció összes igen válaszadójának véletlenszerű mintája .
A t-teszt további technikai feltételezéseket tesz a korcsoportok megoszlására a populáció két csoportján belül. A t-teszt különféle verziói léteznek a valószínűsíthető lehetőségek kezelésére.
-
A logisztikai regresszió feltételezi, hogy minden adott korú ember egyszerű véletlenszerű minta az adott korú emberek a népességben. A különálló korcsoportok eltérő arányú "igen" válaszokat mutathatnak. Ezeket az arányokat, ha log szorzóként (nem pedig egyenes arányokként) fejezzük ki, feltételezzük, hogy lineárisan összefüggenek az életkorral (vagy az élet bizonyos meghatározott funkcióival).
A logisztikai regresszió könnyen kiterjeszthető az életkor és a válasz közötti nemlineáris kapcsolatok befogadására. Egy ilyen kiterjesztés használható a kezdeti lineáris feltételezés hitelességének értékelésére. Nagy adatállományokkal lehet megvalósítani, amelyek elegendő részletességgel rendelkeznek a nem-linearitások megjelenítéséhez, de valószínűleg nem lesz sok haszna kis adatkészleteknél. Egy általános ökölszabály - miszerint a regressziós modelleknek tízszer annyi megfigyeléssel kell rendelkezniük, mint a paraméterek - azt sugallja, hogy lényegesen több mint 20 megfigyelésre van szükség a nemlinearitás felismeréséhez (amihez a lineáris függvény metszésén és meredekségén kívül egy harmadik paraméterre is szükség van. ).
A t-teszt kimutatja, hogy az átlagos életkor különbözik-e a nem és az igen válaszadók között a populációban. A logisztikai regresszió becsli, hogy a válaszarány hogyan változik életkoronként. Mint ilyen, rugalmasabb és képes részletesebb információk szolgáltatására, mint a t-teszt. Másrészt általában kevésbé hatékony, mint a t-teszt, annak alapvető célja, hogy kimutassák a csoportok átlagos életkora közötti különbséget.
Lehetséges, hogy a tesztpárok mindegyikét bemutatják a szignifikancia és a nem szignifikancia négy kombinációja. Ezek közül kettő problematikus:
-
A t-teszt nem szignifikáns, de a logisztikai regresszió igen. Amikor mindkét teszt feltételezése megalapozott, egy ilyen Az eredmény gyakorlatilag lehetetlen, mert a t-teszt nem próbálja kimutatni a logisztikai regresszió által felvetett olyan specifikus kapcsolatot. Ha azonban ez a kapcsolat eléggé nemlineáris ahhoz, hogy a legidősebb és legfiatalabb alanyok megosszák az egyik véleményüket, a középkorúak pedig egy másik véleményt, akkor a logisztikai regresszió kiterjesztése a nemlineáris kapcsolatokra képes felismerni és számszerűsíteni ezt a helyzetet, amelyet egyetlen t-teszt sem tud kimutatni. .
A t-teszt jelentős, de a logisztikai regresszió nem, mint a kérdésben. Ez gyakran előfordul, különösen akkor, ha van egy fiatalabb, egy idősebb válaszadó egy csoportja , és kevés ember van közöttük. Ez nagy különbséget eredményezhet a nem és az igen válaszolók válaszaránya között. A t-teszt könnyen felismeri. A logisztikai regresszió azonban vagy viszonylag kevés részletes információval rendelkezik arról, hogy a válaszarány valójában hogyan változik az életkor előrehaladtával, vagy pedig meggyőző információval rendelkezik: a "teljes szétválás" esete, ahol minden idős ember egyféleképpen reagál, a fiatalabbak pedig másképp - de ebben az esetben mindkét tesztnek nagyon alacsony a p-értéke.
Ne feledje, hogy a kísérleti tervezés érvénytelenítheti a teszt néhány feltételezését. Például, ha rétegesen választottuk ki az életkorukat, akkor megkérdőjelezhetővé válik a t-teszt feltételezése (miszerint az egyes csoportok az életkor egyszerű véletlenszerű mintáját tükrözik). Ez a tervezés a logisztikai regresszióra támaszkodhat. Ha ehelyett két csoportja volt, az egyik nem válaszoló és az egyik igen válaszadó, és véletlenszerűen választottak ki azok közül az életkoruk megállapításához, akkor a logisztikai regresszió mintavételi feltevései kétségesek, míg a t-teszté megalapozott. Ez a kialakítás a t-teszt valamilyen formájának használatát javasolja.
(A második terv itt butaságnak tűnhet, de olyan körülmények között, ahol az "életkor" helyett valami nehéz, költséges vagy időigényes jellemző van fogyasztása mérhető lehet vonzó.)