Hogyan lehet kiszámítani az illeszkedés jóságát glm-ben

learner

2012-12-21 04:36:26 UTC

view on stackexchange narkive permalink

A következő eredményt kaptam a glm függvény futtatásával.

Hogyan értelmezhetem a következő értékeket:

Null deviancia
Maradék deviancia
AIC

Van valami közük az illeszkedés jóságához? Kiszámolhatom ezekből az eredményekből az alkalmassági érték jóságát, például R-négyzet vagy bármely más mérték?

  Hívás: glm (formula = tmpData $ Y ~ tmpData $ X1 + tmpData $ X2 + tmpData $ X3 + as.numeric (tmpData $ X4) + tmpData $ X5 + tmpData $ X6 + tmpData $ X7) Devianciás maradványok: Min. 1Q Medián 3Q Max -0.52628 -0.24781 -0.02916 0.25581 0.48509 Hiba t érték Pr (> | t |) (Intercept -1.305e-01 1.391e-01 -0.938 0.3482 tmpData $ X1 -9.999e-01 1.059e-03 -944.580 <2e-16 *** tmpData $ X2 -1.001e +00 1.104e-03 -906.787 <2e-16 *** tmpData $ X3 -5.500e-03 3.220e-03 -1.708 0.0877. TmpData $ X4 -1.825e-05 2.716e-05 -0.672 0.5017 tmpData $ X5 1.000e +00 5.904e-03 169.423 <2e-16 *** tmpData $ X6 1.002e + 00 1.452e-03 690.211 <2e-16 *** tmpData $ X7 6.128e-04 3.035e-04 2.019 0.0436 * --- Signif. kódok: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1 (diszperziós paraméter a gaussiai családra 0,08496843-nak tekintjük) Null deviancia: 109217,71 3006 szabadság fokon szabadságfokok (4970 észrevétel hiányzik hiányából) AIC: 1129,8 Fisher pontozási iterációk száma: 2

Tudomásul veszem, hogy ezt az SO-ból vándorolták át, ahol az ember általában nem keresne információkat ezekről a statisztikai kifejezésekről. Nagyszerű forrása van itt! Például megnézheti, mit tanulhat egyes kifejezések, például az [AIC] kereséséből (http://stats.stackexchange.com/search?tab=votes&q=aic). Az ezzel töltött kevés időnek vagy teljes választ kell adnia a kérdésére, vagy legalább arra kell irányítania, hogy konkrétabb kérdést tegyen fel.

Nem kapcsolódik a gaussian glms-hez, de ha van bináris adatokra illesztett bernoulli glm, akkor a maradék devianciát nem használhatja a modell illeszkedésének felmérésére, mert kiderül, hogy az adatok a deviancia képletben törlődnek.Ebben az esetben a maradék devianciák * különbségét * felhasználhatja két modell összehasonlítására, de magát a maradék devianciát nem.

library (ResourceSelection) modell <- glm (tmpData $ Y ~ tmpData $ X1 + tmpData $ X2 + tmpData $ X3 + as.numeric (tmpData $ X4) + tmpData $ X5 + tmpData $ X6 + tmpData $ X7, family = binomial) összefoglaló (modell) hoslem.test (modell $ y, model $ felszerelve)