Kérdés:
Milyen feltételek mellett kell használni a többszintű / hierarchikus elemzést?
Patrick
2010-08-22 05:22:34 UTC
view on stackexchange narkive permalink

Milyen feltételek mellett kell fontolóra vennie a többszintű / hierarchikus elemzés alkalmazását az alapvető / hagyományos elemzésekkel szemben (pl. ANOVA, OLS regresszió stb.)? Vannak olyan helyzetek, amelyekben ezt kötelezőnek lehetne tekinteni? Vannak olyan helyzetek, amikor a többszintű / hierarchikus elemzés használata nem megfelelő? Végül, milyen jó források vannak a kezdők számára a többszintű / hierarchikus elemzés elsajátításához?

Lásd még: http://stats.stackexchange.com/a/38430/5739
Nyolc válaszokat:
ars
2010-08-22 05:40:31 UTC
view on stackexchange narkive permalink

Ha az adatok struktúrája természetesen hierarchikus vagy beágyazott, a többszintű modellezés jó jelölt. Általánosságban elmondható, hogy ez az egyik módszer az interakciók modellezésére.

Természetes példa, ha adataid olyan szervezett struktúrából származnak, mint például az ország, az állam, a körzetek, ahol ezeken a szinteken szeretnéd megvizsgálni a hatásokat. Egy másik példa, ahol ilyen struktúrát illeszthet, a longitudinális elemzés, ahol az idő múlásával sok alanytól ismételt méréseket hajtott végre (például valamilyen biológiai válasz egy gyógyszeradagra). A modelled egyik szintje az összes alany csoportos átlagos válaszát feltételezi az idő múlásával. A modell egy másik szintje ezután lehetővé teszi a csoport átlagából származó zavarokat (véletlenszerű effektusokat) az egyéni különbségek modellezéséhez.

Népszerű és jó könyv kezdetként a Gelman regressziós és többszintű / hierarchikus modelleket használó adatelemzése .

Válaszolom ezt a választ, és csak egy további nagyszerű utalást szeretnék hozzáadni a témához: Singer alkalmazott hosszanti adatok elemzésének szövege: Noha a longitudinális elemzésre jellemző, szép áttekintést ad az MLM-ről általában. Szintén jónak és olvashatónak találtam Snidjers és Bosker többszintű elemzését. John Fox szintén szép bevezetőt nyújt ezekhez a modellekhez R-ben.
Köszönöm mindenkinek a válaszait :) Következő kérdésként nem lehetne a legtöbb adatot konceptualizálni úgy, hogy természetesen hierarchikus / beágyazott legyen? Például a legtöbb pszichológiai tanulmányban számos függő változó (kérdőív, ingerválasz stb.) Van fészkelve az egyéneken belül, amelyek további két vagy több (véletlenszerűen vagy nem véletlenszerűen hozzárendelt) csoportba ágyazódnak be. Elfogadná, hogy ez természetesen hierarchikus és / vagy beágyazott adatszerkezetet képvisel?
Ha bármelyik többszintű / hierarchikus guru el tudna szánni néhány percet, nagyon hálás lennék, ha mérlegelne egy másik bejegyzésben feltett elemzési kérdéseket (http://stats.stackexchange.com/questions/1799/recommendations-or -a legjobb gyakorlatok elemzésére-nem-független-adat-specifikációk). Pontosabban, úgy gondolja, hogy az abban a bejegyzésben felvázolt fájdalomérzékelési adatokat hierarchikus elemzésekkel jobban elemeznék, mint nem hierarchikus elemzéseket? Vagy nem okozna különbséget, vagy akár nem is lenne helyénvaló? Köszi: D
Andy W
2010-08-22 07:48:21 UTC
view on stackexchange narkive permalink

A Többszintű Modellezés Központja jó ingyenes online oktatóanyagokkal rendelkezik a többszintű modellezéshez, és szoftveres útmutatókkal rendelkezik a modellek illesztésére az MLwiN szoftverükben és a STATA-ban egyaránt.

Vegyük ezt eretnekségnek, mert a könyvben csak egy fejezetet olvastam, de hierarchikus lineáris modellek: alkalmazások és adatelemzési módszerek Stephen W. Raudenbush, Anthony S. Bryk nagyon ajánlott. Megesküdtem, hogy volt egy könyv az R szoftver használatával végzett többszintű modellezésről a Springer Use R! sorozat, de úgy tűnik, hogy jelenleg nem találom meg (azt hittem, ugyanazok írták, akik az A Kezdő Útmutató R-hez című könyvet írták).

szerkesztés: Az R használata többszintű modellekhez: Mixed Effect Models and Extensions in Ecology with R by Z by Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, Smith, GM

sok sikert

Galit Shmueli
2010-12-13 11:08:36 UTC
view on stackexchange narkive permalink

Itt van egy másik nézőpont a többszintű és a regressziós modellek használatáról: Afshartous és de Leeuw érdekes cikkében azt mutatják, hogy ha a modellezés célja prediktív (vagyis új megfigyelések megjósolása), akkor a modell választása különbözik attól, amikor a cél következtetés (ahol megpróbálja a modellt összehangolni az adatszerkezettel). A hivatkozott cikk

Afshartous, D., de Leeuw, J. (2005). Jóslás többszintű modellekben. J. Educat. Viselkedés Stat. 30. (2): 109–139.

Éppen itt találtam e szerzők egy másik kapcsolódó cikkét: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf

Cyrus S
2010-12-14 01:08:54 UTC
view on stackexchange narkive permalink

Itt van egy példa, ahol a többszintű modell "alapvető" lehet. Tegyük fel, hogy szeretné értékelni az iskolák által nyújtott oktatás "minőségét" a tanulók tesztértékeinek felhasználásával. Az iskola minőségének meghatározásának egyik módja az átlagos tesztteljesítmény, a tanulók jellemzőinek figyelembevétele után. Ezt úgy fogalmazhatná el, hogy $$ y_ {is} = \ alpha_s + X_ {is} \ \ beta_s + \ epsilon_ {is}, $$ ahol $ y_ {is} $ a $ i $ diák folyamatos tesztpontja iskola $ s $, $ X_ {is} $ a tanuló attribútumai, amelyek középpontjában az iskola áll, a $ \ beta_s $ az iskolákra jellemző együttható ezekre az attribútumokra, a $ \ alpha_s $ egy "iskolai hatás", amely az iskola minőségét méri, és $ \ epsilon_ {is} $ a hallgatói szintű sajátosságok a tesztek teljesítésében. Az érdeklődés itt a $ \ alpha_s $ becslésére összpontosít, amelyek mérik azt a "hozzáadott értéket", amelyet az iskola nyújt a diákoknak, miután az attribútumaikat elszámolták. Figyelembe akarja venni a tanuló tulajdonságait, mert nem akarja megbüntetni azt a jó iskolát, amelynek bizonyos hátrányokkal küzdő diákokkal kell megküzdenie, ezért a nyomasztó átlagos teszteredmények megvetették azt a magas "hozzáadott értéket", amelyet az iskola biztosít a diákjai számára.

A modell kéznél a kérdés a becslés egyikévé válik. Ha sok iskolája van, és sok adata van az egyes iskolákhoz, az OLS szép tulajdonságai (lásd Angrist és Pischke, Többnyire ártalmatlan ... , a jelenlegi áttekintéshez) arra utalnak, hogy használni szeretné hogy a szokásos hibák megfelelő kiigazításával a függőségek figyelembevétele érdekében, valamint dummy változók és interakciók alkalmazásával az iskolai szintű hatások és az iskolai specifikus elfogások elérése érdekében. Lehet, hogy az OLS nem hatékony, de annyira átlátható, hogy ezt használva könnyebb meggyőzni a szkeptikus közönséget. De ha az adatai bizonyos szempontból szűkösek, különösen, ha néhány iskolához kevés észrevétel van, érdemes nagyobb "struktúrát" alkalmazni a problémára. Érdemes "kölcsönkérni erőt" a nagyobb mintájú iskoláktól, hogy javítsa azokat a zajos becsléseket, amelyeket akkor kapna a kis mintájú iskolák, ha a becslést struktúra nélkül végeznék. Ezután fordulhat az FGLS-en keresztül becsült véletlenszerű effektusok modelljéhez, vagy esetleg egy közvetlen közelítés a közvetlen valószínűséghez egy adott paraméteres modellnél, vagy akár Bayes egy paraméteres modellnél.

Ebben a példában A többszintű modellt (bármennyire is úgy döntünk, hogy végül illesztjük) az iskolai szintű lehallgatások iránti közvetlen érdeklődés motiválja. Természetesen más helyzetekben ezek a csoportszintű paraméterek nem lehetnek más, mint kellemetlenségek. Az, hogy alkalmazkodni kell-e hozzájuk (és ezért továbbra is működni kell valamiféle többszintű modellel), attól függ, hogy bizonyos feltételes exogenitásfeltevések érvényesek-e. Erre vonatkozóan azt javaslom, hogy keresse meg a paneladat-módszerek ökonometriai szakirodalmát; az onnan érkező betekintések többsége általános csoportosított adatkörnyezetbe kerül.

Ez egy régi szál, de ha ezt elolvassa: a dummy változókkal és interakciókkal ellátott OLS nem kölcsönöz erőt, mint a többi általad említett technika, igaz? Van néhány adatom, ahol két részre bontottam az elemzésemet, és két lm (R lineáris modell) parancsot használtam a két rész modellezéséhez. Bevezettem egy dummy változót a két rész megjelölésére, majd ismét használtam az lm-et ezen az "egységes" modellen, és a válaszok közel vannak, de nem ugyanazok. A kérdésem a következő lenne: "jobb" ez a válasz, vagy egyszerűen más az algoritmus miatt?
@Wayne:, ha a másodikban próbabábukat és az interakciók teljes készletét használta, a pontbecsléseknek meg kell egyezniük. A szokásos hibák eltérhetnek, mivel a második módszer magasabb szabadsági fokokat feltételezhet, de érdemes ellenőrizni, hogy ez helyes modellezési feltételezés-e.
probabilityislogic
2011-05-22 09:40:26 UTC
view on stackexchange narkive permalink

A többszintű modellezés megfelelő, ahogy a neve is sugallja, amikor az adatainak különböző szinteken (egyénileg, idővel, domainenként stb.) vannak hatásai. Az egyszintű modellezés feltételezi, hogy minden a legalacsonyabb szinten történik. Egy másik dolog, amit egy többszintű modell végez, az a korrelációk bevezetése a beágyazott egységek között. Tehát az 1. szintű egységek ugyanazon a 2. szintű egységen belül korrelálnak egymással.

Bizonyos értelemben úgy gondolhatja a többszintű modellezést, hogy megtalálja a középutat az "individualista tévedés" és az "ökológiai tévedés" között. ". Az individualista tévedés az, amikor figyelmen kívül hagyják a "közösségi hatásokat", például a tanár stílusának és a tanuló tanulási stílusának összeegyeztethetőségét (feltételezzük, hogy a hatás egyedül az egyéntől származik, tehát csak az 1. szinten hajtsa végre a regressziót). mivel az "ökológiai tévedés" ellentétes, és ez olyan lenne, mintha feltételeznénk, hogy a legjobb tanárnak a legjobb osztályzattal rendelkező diákjai vannak (és így nincs szükség az 1. szintre, csak teljes mértékben hajtsa végre a regressziót a 2. szinten). A legtöbb beállításban egyik sem megfelelő (a tanító-tanár "klasszikus" példa).

Ne feledje, hogy az iskolai példában "természetes" klaszter vagy szerkezet szerepelt az adatokban. De ez nem elengedhetetlen jellemzője a többszintű / hierarchikus modellezésnek. A természetes csoportosítás azonban megkönnyíti a matematikát és a számításokat. A legfontosabb összetevő az előzetes információ, amely azt állítja, hogy különböző szinteken zajlanak folyamatok. Valójában fürtözési algoritmusokat is kidolgozhat, ha többszintű struktúrát vet ki az adataira, és bizonytalan abban, hogy melyik egység melyik magasabb szinten van. Tehát $ y_ {ij} $ van, a $ j $ al index nem ismert.

user28
2010-08-22 06:04:55 UTC
view on stackexchange narkive permalink

Általánosságban elmondható, hogy a hierarchikus Bayesian (HB) elemzés használata hatékony és stabil egyéni szintű becsléseket eredményez, hacsak az adatai nem olyanok, hogy az egyéni szintű hatások teljesen homogének lennének (irreális forgatókönyv). A HB modellek hatékonysága és stabil paraméterbecslése akkor válik igazán fontossá, ha ritka adatokkal rendelkezik (például kevesebb az obsz, mint az egyéni szinten a paraméterek száma), és ha meg akarja becsülni az egyes szintek becsléseit.

A HB modelleket azonban nem mindig könnyű megbecsülni. Ezért, bár a HB-elemzés általában nem HB-elemzést végez, mérlegelnie kell a relatív költségeket és az előnyöket a múltbeli tapasztalatai és az aktuális prioritásai alapján az idő és a költség szempontjából.

Ennek ellenére, ha nem érdeklődik az egyéni szintű becslések iránt, akkor egyszerűen megbecsülhet egy összesített szintű modellt, de még ezekben az összefüggésekben is sok értelme lehet az aggregáló modellek HB-n keresztüli becslésének az egyedi szintű becslések segítségével.

Összefoglalva, a HB modellek illesztése az ajánlott megközelítés, amennyiben van időd és türelmed hozzájuk illeszteni. Ezután összesített modelleket használhat referenciaértékként a HB-modell teljesítményének felméréséhez.

Köszönöm a részletes választ Srikant :) Jelenleg nem ismerem a Bayes-elemzéseket, de egyike vagyok azoknak a témáknak, amelyeket kivizsgálni akartam. A hierarchikus bayesi elemzés különbözik az ezen az oldalon tárgyalt többi többszintű / hierarchikus elemzéstől? Ha igen, van-e ajánlott forrása az érdekelt felek számára, hogy többet tudjon meg?
Analitikai szempontból HB elemzés = többszintű modellek. A többszintű modellek kifejezést azonban akkor használják, ha különböző szintjei vannak, amelyek természetesen előfordulnak (lásd az @ars példáját). A HB modellek kifejezést akkor használják, ha nem feltétlenül van különböző szintje a helyzetben. Például, ha a fogyasztó különböző marketingváltozókra adott válaszát modellezi (pl. Ár, előlegköltség stb.), Akkor a következő felépítésű lehet a fogyasztói szinten: $ β_i \ sim N (\ bar {\ beta}, \ Sigma ) $ és $ \ bar {\ beta} \ sim N (.,.) $ populációs szinten. Referenciák: Lásd a többi választ.
Chris Beeley
2010-12-13 13:47:49 UTC
view on stackexchange narkive permalink

Snijders és Bosker tanultam, Többszintű elemzés: Bevezetés az alapvető és haladó többszintű modellezésbe. Szerintem nagyon jó a kezdőnél, ennek azért kell lennie, mert vastag vagyok, ahol ezek a dolgok vannak, és volt értelme számomra. könyv.

StatisticsDoc Consulting
2012-11-20 11:01:29 UTC
view on stackexchange narkive permalink

Többszintű modelleket kell alkalmazni, ha az adatok hierarchikus struktúrába vannak ágyazva, különösen akkor, ha jelentős különbségek vannak a függő változó magasabb szintű egységei között (pl. a diákok teljesítményorientációja változik a hallgatók között, valamint a amelyet a diákok beágyaznak). Ilyen körülmények között a megfigyelések inkább csoportosulnak, mintsem függetlenek. A klaszter figyelembevételének elmulasztása a paraméterbecslések hibáinak alulbecsléséhez, elfogult szignifikancia-tesztekhez vezet, és hajlamos elutasítani a nullát, amikor azt meg kell tartani. A többszintű modellek használatának indoklását, valamint az elemzések végrehajtásának alapos magyarázatát

Raudenbush, S. W. Bryk, A. S. (2002) nyújtja. Hierarchikus lineáris modellek: Alkalmazások és adatelemzési módszerek. 2. kiadás. Newbury Park, Kalifornia: Sage.

Az R & B könyv jól integrálható a szerzők HLM szoftvercsomagjával is, amely sokat segít a csomag elsajátításában. Egy klasszikus írásban magyarázatot adunk arra, hogy miért szükségesek a többszintű modellek, és miért előnyösebbek bizonyos alternatívák (például a magasabb szintű egységeket kódoló dummy) helyett.

Hoffman, D.A. (1997). A hierarchikus lineáris modellek logikájának és logikájának áttekintése. Journal of Management, 23, 723-744.

A Hoffman-lap ingyenesen letölthető, ha a Google-on "Hoffman 1997 HLM" -et keres, és online hozzáfér a pdf-hez.



Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 2.0 licencért, amely alatt terjesztik.
Loading...