Miért jósolják a GLM-ek az átlagot és nem az üzemmódot?

nukimov

2015-09-27 19:11:54 UTC

view on stackexchange narkive permalink

Miért jósolja a GLM a jel átlagát, és nem a jel módját? Ez nem mond ellent a GLM mögött álló alapnak, vagyis a legnagyobb valószínűségnek? A GLM modellparamétereinek megoldására szolgáló egyenletek a valószínűség maximalizálásán alapulnak, amelyet a modellezett jel valószínűségeloszlása ír le. Ez a valószínűségeloszlás a mód számára maximális, nem pedig az átlag ra (a normál eloszlás kivétel: mind a mód, mind az átlag megegyezik). Ezért egy GLM-nek meg kell jósolnia a mód ot, nem pedig a jel átlagát ! (A kérdéshez lásd itt.)

Kicsit túl rozsdás vagyok ahhoz, hogy ezt válaszként megadjam, de úgy gondolom, hogy az elképzelés az, hogy létezik feltételezhető feltételes eloszlás, és a GLM biztosítja ennek az elosztásnak a módját.(Tehát ez az átlag modális becslése.)

A címét úgy szerkesztettem, hogy tükrözze a StackExchange modellt - a kérdések kérdések, nem pedig véleménycikkek.(Meg kell próbálnia kerülni, hogy a kérdése törzse egyfajta hörgésnek tűnjön.)

Vegye figyelembe, hogy a valószínûség a paraméterek függvénye, miközben a modell megpróbálja leírni az adatok eloszlását.Nincs következetlenség.Fontolja meg a bináris adatok logisztikai regresszióját, ahol az illesztett arányok 0,2 és 0,475 között mozognak.A Bernoulli-eloszlás módja minden esetben 0 - tehát azt állítja, hogy a modellnek teljes egészében 0-ból kell állnia?Ez sokkal kevésbé hasznos, mint egy átlagos modell.

Csak egy megjegyzés: a válasz módja rendkívül informatív lehet.A legszélsőségesebb példában a Bernoulli-eloszlás módja mindig 0 vagy 1 lesz.

Tudom, hogy nincs ellentmondás, csak meg akarom érteni: a GLM-ek azokra az adatokra vonatkoznak, amelyek az exponenciális család eloszlását követik.Általában maximalizálja az exponenciális családeloszlás általános egyenletét (f (y; theta, phi) = exp {(y * theta - b (theta)) / a (phi) + c (y, phi)}), hogyaz egyenletrendszerhez, amely lehetővé teszi a lineáris modell paramétereinek megszerzését.Ezen eloszlások közül sok (például a Gauss-féle és a gamma) harang alakú, maximálisan az üzemmód felett, nem pedig az átlag felett.Így azt várnám, hogy a * mód * válaszul válaszoljon a „melyik mu maximalizálja az f-t?” Kérdésre.

A legnagyobb valószínűséggel maximalizálandó dolog nem * az adatok eloszlásának sűrűsége, hanem a paraméter valószínűsége.

A GLM-ekben maximalizálandó dolog valóban f (y; theta, phi), vagy ezzel egyenértékűen a log-likelihood log (f) minimalizálva van.Lásd McGullagh és Nelder 1989, 1.1.3. És 2.2.2. Szakasz.F (y; theta, phi) pedig az adatok eloszlása.Azonban egyetértek: a maximalizálási folyamatban az f (h; theta, phi) -et nem y (az adatok), hanem a theta, phi függvényeként kell tekinteni.Ez a magyarázat a látszólagos dilemmámra.Köszönöm az összes megjegyzést.Bár egyik megjegyzésben vagy válaszban sem igazán válasz a kérdésemre, úgyhogy gondolom, magamnak kellene megfogalmaznom.

Úgy gondolom, hogy az Ön által feltett kérdésre adott válasz valóban Glenben, Paulban található, és megjegyzéseim és válaszaim.Esetleg félreértelmezzük, filozofikus a kérdése?* Miért * modellezzük a feltételes elvárást a feltételes mód helyett?

Helyes, a választ Paul most már kifejezetten kifejezi, de ez csak pár szerkesztés után következik be.Nem ez volt a helyzet, mivel magam fogalmaztam meg a választ.Mindenesetre Paul válaszát választottam a legjobbnak.Ezúton is köszönöm mindenkinek!