Két csoportom van. Jelentős különbség van a KW teszt szerint. De be kell jelentenem a csoportok átlagát vagy átlagát?
Két csoportom van. Jelentős különbség van a KW teszt szerint. De be kell jelentenem a csoportok átlagát vagy átlagát?
A Wilcoxon / Kruskal-Wallis teszt nem az átlagra vagy a mediánra vonatkozik, bár a medián közelebb állhat ahhoz, amit a teszt tesztel. A tesztnek megfelelő becslő a Hodges-Lehmann becslő. Lásd: http://en.wikipedia.org/wiki/Mann-whitney és http://en.wikipedia.org/wiki/Hodges%E2%80%93Lehmann_estimate. Az R-ben egyszerűen elvégezheti a számításokat - lásd például: http://biostat.mc.vanderbilt.edu/WilcoxonSoftware.
A Kruskal-Wallis teszt állítólag azt teszteli, hogy a medián minden csoportban azonos-e. Ezen egyszerű szabály szerint jelentenie kell a mediánt, ez a válaszom a kérdésére.
Ez azonban alkalmat ad arra, hogy megmutassam, hogy a KW valójában nem a medián tesztje. A teszt alternatív hipotézise nem az, hogy az egyik eloszlás eltérő mediánnal rendelkezik. Ez az, hogy az egyik disztribúció pontosan ugyanolyan alakú, mint a többi, de felfelé vagy lefelé tolódik.
Itt van egy kis R kódrészlet, amely ezt demonstrálja. Két mintát hozok létre ugyanazzal a mediánnal (nevezetesen 0), és alkalmazom a Kruskal-Wallis tesztet.
set.seed (123) x <- exp (rnorm (100)) y <- exp (rnorm (100)) x <- x - medián (x) y <- medián (y) - y # Az x-nek és y-nek is mediánja 0.kruskal.test (list (x, y))
Kiderült, hogy a p-érték 0,005676, ami két nagyon azonos mediánnal rendelkező minta esetében nagyon alacsonynak tűnik. A minták ugyanis olyan disztribúciókból származnak, amelyek ellentétes irányban nagyon ferdeek (a x
minta jobb farka nehéz, a bal oldalon pedig y
).
Rossz a KW teszt? Nem. Helytelen elvetni a nullhipotézist, miszerint a mintákat ugyanabból a disztribúcióból veszik.
Tehát a következtetés az, hogy nem következtethet arra, hogy mediánban van különbség, csak azért, mert elutasítja a nullát hipotézis et. A nullhipotézist el is utasíthatja a függetlenség hiánya miatt, vagy az előző példában bemutatott módon, mivel az eloszlások nem azonos alakúak.
Úgy gondolom, hogy a medián jelentése közben mindezt nem kell megemlíteni. , de ezeket az elemeket érdemes szem előtt tartania minden alkalommal, amikor elvégzi a tesztet.