Kérdés:
Poisson regresszió nagy adatokkal: helytelen megváltoztatni a mértékegységet?
Vivi
2010-07-20 16:08:48 UTC
view on stackexchange narkive permalink

A poisson-eloszlás tényezője miatt nem lesz praktikus a poisson-modellek becslése (például a legnagyobb valószínűség felhasználásával), ha a megfigyelések nagyok. Tehát például, ha megpróbálok megbecsülni egy modellt az öngyilkosságok számának magyarázatára az adott évben (csak éves adatok állnak rendelkezésre), és azt mondom, hogy évente több ezer öngyilkosság van, akkor helytelen-e öngyilkosságokat százakban kifejezni , tehát hogy 2998 29,98 ~ = 30 lenne? Más szavakkal: helytelen a mértékegység megváltoztatása az adatok kezelhetővé tétele érdekében?

öt válaszokat:
Baltimark
2010-07-20 16:54:15 UTC
view on stackexchange narkive permalink

Ha Poisson-disztribúcióval foglalkozik, amelynek nagy értéke \ lambda (annak paramétere), akkor szokás normális közelítést használni a Poisson-eloszláshoz.

Amint ez a webhely említi, rendben van a normál közelítés használata, amikor a \ lambda 20 fölé kerül, és a közelítés javul, mivel a \ lambda még magasabb lesz.

A Poisson-eloszlást csak a nem negatív egész számokból álló állapottérben határozzuk meg, ezért az átméretezés és a kerekítés furcsa dolgokat vezet be az adatokba.

A normál kb. a nagy Poisson-statisztika NAGYON gyakori.

user88
2010-07-20 16:29:53 UTC
view on stackexchange narkive permalink

Poisson esetén ez rossz, mivel a grófok számítanak - egységük egység. Másrészről, ha olyan fejlett szoftvert használ, mint az R, a Poisson-kezelési funkciói tisztában vannak ilyen nagy számokkal, és néhány numerikus trükköt használnak majd ezek kezelésére. egy másik jó megközelítés.

onestop
2010-07-27 17:10:35 UTC
view on stackexchange narkive permalink

A legtöbb statisztikai csomagnak van egy funkciója a faktorial természetes logaritmusának közvetlen kiszámításához (pl. a lfactorial () függvény az R-ben, az lnfactorial () függvény a Stata-ban). Ez lehetővé teszi, hogy az állandó kifejezést felvegye a log-likelihoodba, ha akarja.

Ezenkívül `n!` = `Gamma (n + 1)` n> = 0 értékre. Tehát próbálja meg megkeresni a „Gamma” nevű függvényt, ha ki kell számolnia a faktort (vagy ha a napló valószínűsége)
Curious
2012-02-16 21:34:54 UTC
view on stackexchange narkive permalink

Attól tartok, hogy ezt nem teheti meg. Ahogy @Baltimark állítja, nagy lambdával az eloszlás normálisabb alakú lesz (szimmetrikus), és kicsinyítésével már nem lesz poisson diszubúció. Próbálja ki a következő kódot R-ben:

  poi1 = rpois (100000, lambda = 5) # poissonpoi2 = rpois (100000, lambda = 100) / 20 # kicsinyített poissonpoi2_dens = sűrűség (poi2) hiszt (poi1, törések = 0:30, freq = F, ylim = tartomány (poi2_dens $ y)) sorok (poi2_dens, col = "piros")  

Az eredmény alább van:

enter image description here

Láthatja, hogy a kicsinyített poisson (piros vonal) teljesen eltér a poisson-eloszlástól.

user28
2010-07-20 19:41:34 UTC
view on stackexchange narkive permalink

A maximális valószínűség használatakor egyszerűen figyelmen kívül hagyhatja a „faktoriált”. Itt van az öngyilkossági példád indoklása. Legyen:

λ: Legyen az öngyilkosságok várható száma évente

k i : Legyen az öngyilkosságok száma az i évben.

Akkor maximalizálná a log-likelihood értékét:

LL = ∑ (k i log (λ) - λ - k i !)

A fentiek maximalizálása egyenértékű a következők maximalizálásával k i néven! konstans:

LL ' = ∑ (k i log (λ) - λ)

Megmagyarázhatja, miért a faktoriális kérdés? Hiányzik valami?

Nem hiányzik valami, ha csak annyit próbál meg becsülni, hogy a paraméter egy megfigyelésből áll. Ez mindenképpen az OP kérdésének fő gondolata volt. Ugyanakkor azt is kérdezte általában (ha nem is szigorúan), hogy "hogyan lehet megbecsülni a poisson modelleket". Talán meg akarja tudni a pdf értékét egy adott ponton. Ebben az esetben a normál kb. valószínűleg jobb lesz, mint a paraméter skálázása, és a megfigyelések 100-mal, vagy bármi mással, ha a megfigyelések elég nagyok ahhoz, hogy a tényező kiszámítása kivitelezhetetlen legyen.
@Srikant, igazad van, a paraméterek becsléséhez a faktoriál nem kérdés, de általában meg akarod adni a valószínűség értékét egy adott modellnél, és ehhez a faktoriált kell használnod. Ezenkívül a hipotézis teszteléséhez (például a valószínűség arányának tesztjéhez) szüksége lesz a valószínűség értékére.
@Baltimark: igen, általában azt szeretném tudni, hogy érvényes-e a Poisson mértékegységének megváltoztatása. Tettem ezt a kérdést, és nem tudtam mit mondani.
@Vivi: Nem tudom, miért szeretné kiszámítani a valószínűséget a k_i-vel! tartalmazza, mivel a legtöbb alkalmazásban (pl. valószínűségi arány teszt, bayesi becslés) az állandó nem számít. Mindenesetre nem hiszem, hogy átméretezheti, ahogy javasolta. Ha másként érzem magam, frissítem a válaszomat.
@Srikant, Látom az Ön értelmét, de egyes szoftverek (például az Eviews) alapértelmezés szerint tartalmazzák ezt, és a nagy számok olyan kérdések, amelyek tetszik vagy sem. Gondolom, nagyon utánajártam annak, hogy miért lehet vagy nem lehet megtenni, nem pedig megkerülni, de a vita mégis érdekes és tanulságos volt :)


Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 2.0 licencért, amely alatt terjesztik.
Loading...