Kérdés:
Ha több összehasonlítást terveznek, akkor is korrigálnia kell több összehasonlítást?
DrJay
2017-01-10 15:56:35 UTC
view on stackexchange narkive permalink

Áttekintek egy olyan papírt, amely> 15 külön 2x2 Chi Square tesztet hajtott végre.Azt javasoltam, hogy korrigálniuk kell a többszörös összehasonlításra, de azt válaszolták, hogy az összes összehasonlítást megtervezték, és ezért erre nincs szükség.

Úgy érzem, hogy ez nem lehet helyes, de nem találok olyan forrásokat, amelyek kifejezetten kimondanák, hogy ez a helyzet.

Valaki tud ebben segíteni?


Frissítés:

Köszönöm nagyon hasznos válaszait.Válaszul arra, hogy @ gung további információkat kért a tanulmányról és az elemzésekről, kétféle résztvevő (hallgatók, nem diákok) számlálási adatait hasonlítják össze két körülmények között, három időszakon keresztül.A többszörös 2x2 Chi Square tesztek összehasonlítják az egyes periódusokat, minden feltételben, az egyes résztvevő típusok szerint (ha van értelme; pl. Hallgatók, 1. feltétel, 1. időszak és 2. időszak), tehát minden elemzés ugyanazt a hipotézist teszteli.

Sokan, akik több összehasonlítást végeznek, úgy tervezik, hogy mindet elvégzik * a priori *.Azért teszik, mert ellenőrizni akarják a teljes I. típusú hibaarányt.Bizonyos helyzetekben ésszerű lehet, ha nem korrigálják a többszörös összehasonlítást, de nem csak az a kérdés, hogy mindet eleve elvégezzük.
Mondana egy kicsit többet a tanulmányról, azok adatairól és azok elemzéseiről?A> 15 megegyezik-e az összes lehetséges összehasonlítással, vagy csak kis% -ot jelent?Mennyi adatuk van?Mennyire hihető, hogy a hipotézisek mind a priori voltak?Jelentősek mind?A chi-négyzet tesztek függetlenek-e egymástól?Vegye figyelembe az @peuhp's válaszban felvetett néhány kérdést is.
Mivel "őket" valószínűleg jelentős eredmények megtalálása érdekli, válaszuk öncélú.Ezért az a terhük, hogy megmutassák, miért jogszerű a megközelítésük, és nem az, hogy Ön azt igazolja, hogy törvénytelen.Minden kísérlet annak bizonyítására, hogy a többszörös összehasonlítások kijavítása elhanyagolható, kudarcot vall, amint figyelembe veszi az egész papírra kiterjedő hamis pozitív arányt, ezért "nekik" vagy (hamisan) el kell kerülniük a kérdés minden megfontolását, vagy pedig megfelelő érvet kell adniuk arra, hogy miértszándékozott közönségüket nem foglalkoztatja.
Nagyon megkísértem, hogy válaszoljak egy linkre [erre az XKCD-sávra] (https://xkcd.com/882/) (amely, mint megjegyezheti, több teszt teljesen megtervezett sorozatát foglalja magában ...).
Négy válaszokat:
peuhp
2017-01-10 16:27:02 UTC
view on stackexchange narkive permalink

Ez az IMHO összetett kérdés, és szeretnék három megjegyzést fűzni ehhez a helyzethez.

Először és általában inkább arra összpontosítanék, hogy szembesüljön-e egy megerősítő vizsgálattal egy sor jól formált érvelési kontextusban vagy magyarázó tanulmányban meghatározott hipotézisek, amelyek során sok valószínű indikátor figyelhető meg, mint az, hogy tervezik-e vagy sem (mert egyszerűen megtervezheti az összes lehetséges összehasonlítást).

Másodszor arra is összpontosítanék, hogy a kapott p-értékeket miként tárgyalják meg. Egyenként használják-e egy sor végleges következtetés kiszolgálására, vagy közösen tárgyalják őket bizonyítékként és bizonyíték hiányában?

Végül megvitatnám annak lehetőségét, hogy a> 15 különálló khi-négyzet tesztből származó> 15 hipotézis valójában egyetlen hipotézis (esetleg egyetlen) kifejezése, amelyeket összefoglalhatunk.

Általánosabban, függetlenül attól, hogy a hipotézis előre meg van-e határozva, vagy sem, a több összehasonlítás javítása vagy sem, az az, hogy mi szerepel az I. típusú hibában. Azáltal, hogy nem javítja ki az MC-t, csak az I. összehasonlítási típusú hibaarány-vezérlőt tartja meg. Tehát számos összehasonlítás esetén magas az I. típusú hibaaránya családonként, és így hajlamosabbak a hamis felfedezésekre.

(+1) Érdemes lehet megfogalmazni, hogy a kísérleti hibaarányt nem a tizenöt egyedi összehasonlítás tervezi;másrészt a többszörös összehasonlítással végzett korrekció során nem kell figyelembe venni a protokollban nem szereplő tizenöt után lehetséges összehasonlításokat.
@Scortchi Köszönjük a közreműködést, de nem értem, mit értesz azon, hogy "kísérletileg a hibaarányt nem szabályozza a tervezett tizenöt egyedi összehasonlítás"?
Csak az az alapvető szempont, hogy * ha * a null értéke alatt szeretné ellenőrizni annak valószínűségét, hogy egy vagy több I. típusú hibát elkövetjen az összes teszten, akkor többszörös összehasonlítási eljárást kell használnia.Csak azért említem, mert korábban már zűrzavarral találkoztam az ügyben.
Ne feledje, hogy pontosan ugyanez a probléma merült fel egy legutóbbi szálban: [Többszörös összehasonlítások Post Hoc alkalmazása] (http://stats.stackexchange.com/q/255354/17230).
@Scortchi.Ok, köszönöm ezt a pontosítást és a hozzászólást, ezt valóban egyértelműen meg kell határozni a válaszomban.Hozzáadja ezt.
David C. Norris
2017-01-11 02:02:59 UTC
view on stackexchange narkive permalink

Ha az „előre megfontolt” szót helyettesíti a „tervezett” szóval, ez segíthet eloszlatni a szerzők által felvetett érvet. Tekintsük ugyanazon adatok két különböző statisztikai elemzését:

  1. „előre megfontolt bűncselekmény”, amelyben minden lehetséges hipotézistesztet kombinatív módon előre lefektet egy „statisztikai bűnügyi ötletgazda”, a terv az, hogy megpróbálja mindegyiket szisztematikusan, és válassza ki a legkisebb p-értékű tesztet a „kulcsfontosságú megállapításnak”, amelyet elő kell mozdítania a cikk Eredmények, Beszélgetés és Következtetés szakaszában, sőt a címben is.
  2. A ' szenvedély bűncselekménye ", amelyben a kezdeti szándék csupán az volt, hogy szembeállítsa az adatokat egy hipotézissel, de" hát ... egy dolog máshoz vezet ", és több ad hoc hipotézis teszt" csak megtörténik "a tudományos szenvedély forrósága, hogy "valamit ... bármit! " megtanuljon az adatokból.

Akárhogy is, ez „gyilkosság” - a kérdés az, hogy első vagy második fokozatú-e. Nyilvánvaló, hogy az első morálisan problémásabb. Számomra úgy hangzik, mintha az itt szereplő szerzők megpróbálnának állítani valamit arról, hogy nem gyilkosság volt, mert előre megfontolt volt.

De több összehasonlítás elvégzése nem bűncselekmény, előre megfontolt vagy sem.A P-vadászat az.
mdewey
2017-01-12 18:30:32 UTC
view on stackexchange narkive permalink

Tekintettel a frissítésre a tervezéssel kapcsolatban, azt javaslom, hogy végezzenek valamilyen log-lineáris modellt az összes adat egyszerre történő felhasználására.Az általuk végzett darabos elemzések elvégzése (a) hatástalannak (b) tudománytalannak tűnik, mivel 15 hipotézist tesztel, ahol biztosan kevesebb a valós hipotézis.reflex, de ebben az esetben, ha elutasítanak egy mélyebb elemzési megközelítést, akkor azt javaslom, hogy javítsanak.

Ha az összes teszt ugyanazt a hipotézist teszteli, akkor meta-analitikai eszközzel is fel lehet használni a 15 teszt eredményeinek egybe történő egyesítését.Ön a metaanalízis szakértője, így talán javasolhatna valami konkrétabbat.A legegyszerűbb dolog: láttam, hogy az emberek kiszámítják a p-értéket, amellyel jelentős $ $ $ eredményt kapnak a $ 15 $ tesztekből;de ez függetlenséget feltételez, ami az OP esetében nyilvánvalóan nem igaz.
@amoeba Úgy gondolom, hogy ez egy utolsó megoldás lenne, mivel nem tehetek róla, hogy jobb elemzésre van szükség, mint a 15+ $ \ chi ^ 2 $ teszt.
Bonferroni
2017-03-05 12:16:22 UTC
view on stackexchange narkive permalink

Ez a cikk közvetlenül foglalkozik a kérdésével: http://jrp.icaap.org/index.php/jrp/article/view/514/417

(Frane, A. V., "A tervezett hipotézis tesztek nem feleslegesen mentesek a multiplicitás kiigazítása alól", Journal of Research Practice, 2015)



Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...