Kérdés:
R-négyzet a kvantilis regresszióban
rnso
2014-12-15 23:21:18 UTC
view on stackexchange narkive permalink

Kvantilis regressziót használok az adataim 90. percentilisének prediktorainak megtalálásához. Ezt R-ben csinálom a quantreg csomag használatával. Hogyan határozhatom meg a $ r ^ 2 $ értéket a kvantilis regresszióhoz, amely jelzi, hogy a prediktor változók mekkora változékonyságot magyaráznak? változékonyságának magyarázata? " A P értékek szerinti jelentőségi szintek a következő parancs kimenetében érhetők el: summary (rq (formula, tau, data)) . Hogyan szerezhetem az illeszkedés jóságát?

$ R ^ 2 $ nem releváns a kvantilis regresszió szempontjából.
@whuber: Bármilyen alternatív módszer, amellyel megtudhatom, hogy a változékonyság mekkora magyarázattal bír?
Ezt jó lenne feltenni a kérdésre, nem pedig kommentben eltemetni!A "magyarázható változékonyság" (amúgy a variancia szempontjából mérve) lényegében a legkisebb négyzetek fogalma;amit akar, az a statisztikai szignifikancia vagy az illeszkedés megfelelő mércéje.
Bármely érdemjegy esetében meg kell fontolni, mi lenne a jó teljesítmény, mi a gyenge teljesítmény és mi a lényegtelen.Például nem kritika a 90. percentilisről, ha ez a 10. percentilis tetemes előrejelzője.Előfordulhat, hogy benchmarkja bármi lehet, ha nem kvantilis regressziót használ.Ha előrejelzői folyamatosak, ezt nehéz lehet meghatározni.
@whuber: Ezt a kérdés egészében kiegészítettem.A P érték szerinti szignifikancia szint összefoglaló (rq (formula, tau, adatok)) kimenetben érhető el.Hogyan szerezhetem az illeszkedés jóságát?
Kettő válaszokat:
Glen_b
2014-12-16 06:01:38 UTC
view on stackexchange narkive permalink

Koenker és Machado $ ^ {[1]} $ leírják a $ R ^ 1 $ értéket, amely az adott ($ \ tau $) kvantilis illeszkedésének helyi mértéke.

Legyen $ V ( \ tau) = \ min_ {b} \ sum \ rho_ \ tau (y_i-x_i'b) $

Legyen $ \ hat {\ beta} (\ tau) $ és $ \ tilde {\ beta } (\ tau) $ a teljes modell és egy korlátozott modell együttható-becslése, és a $ \ hat {V} $ és $ \ tilde {V} $ legyenek a megfelelő $ V $ kifejezések.

Meghatározzák a $ R ^ 1 (\ tau) = 1- \ frac {\ hat {V}} {\ tilde {V}} $ illeszkedési kritérium jóságát.

Koenker $ kódot ad V $ itt,

  rho <- függvény (u, tau = .5) u * (tau - (u < 0)) V <- sum (rho (f $ resid, f $ tau))  

Tehát, ha a $ V $ értéket kiszámítjuk egy modell számára, amelynek csak elfogása van ($ \ tilde {V} $ - vagy V0 az alábbi kódrészletben), majd egy korlátozás nélküli modellt ($ \ hat {V} $) kiszámolhatunk egy R1 <- 1-Vhat / V0 -ot, amely - legalábbis elméletben - némileg hasonló a szokásos $ R ^ 2 $ -hoz.

Szerkesztés: Természetesen a te esetedben a második argumentum, amely p ut abban a helyen, ahol a f $ tau szerepel a második kódsorban szereplő hívásban, a használt tau bármelyik értéke lesz. Az első sorban szereplő érték csupán az alapértelmezett értéket állítja be.

A variancia elmagyarázása az átlagról valójában nem az, amit kvantilis regresszióval csinálsz, ezért nem szabad elvárnod, hogy valóban egyenértékű mértéked legyen.

Nem hiszem, hogy a $ R ^ 2 $ fogalma fordítana jól kvantilis regresszióra. Különböző többé-kevésbé analóg mennyiségeket határozhat meg, mint itt, de nem számít, mit választ, az OLS regresszióban nem fogja megadni a valódi $ R ^ 2 $ tulajdonságok nagy részét. Tisztában kell lennie azzal, hogy milyen tulajdonságokra van szüksége, és mi nem - bizonyos esetekben előfordulhat, hogy olyan intézkedés van, amely azt csinálja, amit akar.

-

$ [1] $ Koenker, R és Machado, J (1999),
Az illeszkedési és kapcsolódó következtetési folyamatok jósága a kvantilis regresszióhoz,
az Amerikai Statisztikai Szövetség folyóirata, 94 : 448, 1296-1310

A tau = 0,9 legyen 0,5 helyett?
Igen, meg kell, de ha megadod a helyes második argumentumot (amint az a fent említett második sorban történik), akkor ez így működik.Az első sorban szereplő 0,5 értéke egyszerűen alapértelmezett argumentum, ha a függvény meghívásakor nem adja meg a „tau” szót.A bejegyzésben pontosítom.
@Glen_b Köszönöm a magyarázatot.Hacsak nem csinálok valami hülyeséget, úgy tűnik, hogy V a becsült kvantilis súlyozott eltéréseinek összege, nem pedig ál-$ R ^ 2 $.
@Dimitriy Uh, igazad van, valamit kihagytam.Rövidesen megoldom ezt.
@Dimitriy Azt hiszem, most kijavítottam.
Dimitriy V. Masterov
2014-12-16 07:16:41 UTC
view on stackexchange narkive permalink

A Koenker és Machado (1999) által a JASA által javasolt pszeudo- $ R ^ 2 $ mérték az illesztés jóságát méri, összehasonlítva az érdeklődési modell súlyozott eltéréseinek összegét egy modell, amelyben csak az elfogás jelenik meg. Kiszámítása:

$$ R_1 (\ tau) = 1 - \ frac {\ sum_ {y_i \ ge \ hat y_i} \ tau \ cdot \ vert y_i- \ hat y_i \ vert + \ sum_ {y_i< \ hat y_i} (1- \ tau) \ cdot \ vert y_i- \ hat y_i \ vert} {\ sum_ {y_i \ ge \ bar y} \ tau \ cdot \ vert y_i- \ bar y \ vert + \ sum_ {y_i< \ bar y_i} (1- \ tau) \ cdot \ vert y_i- \ bar y \ vert}, $$

ahol $ \ hat y_i = \ alpha _ {\ tau} + \ beta_ A {\ tau} x $ a $ i tau megfigyelésére szolgáló $ \ tau $ th kvantilis, a $ \ bar y = \ beta _ {\ tau} $ pedig a csak elfogó modell illesztett értéke.

A $ R_1 (\ tau) $ -nak $ [0,1] $ -ban kell lennie, ahol az 1 tökéletes illeszkedésnek felel meg, mivel a számláló, amely az eltérések súlyozott összegéből áll, nulla lenne. A QRM-hez való illeszkedés helyi mértéke, mivel az $ \ tau $ -tól függ, ellentétben az OLS globális $ R ^ 2 $ -jával. Vitathatatlanul ez jelenti a használatával kapcsolatos figyelmeztetéseket: ha a modell beleillik a farokba, akkor nem garantálható, hogy bárhol máshol jól illeszkedjen. Ezt a megközelítést a beágyazott modellek összehasonlítására is lehetne használni.

Íme egy példa az R-ben:

  könyvtár (quantreg) adatok (engel) fit0 <- rq (foodexp ~ 1, tau = 0.9, data = engel) fit1 <- rq (foodexp ~ jövedelem, tau = 0,9, adatok = engel) rho <- függvény (u, tau =, 5) u * (tau - (u < 0)) R1 <- 1 - fit1 $ rho / fit0 $ rho  

Ezt valószínűleg elegánsabban meg lehet valósítani.

A képlete nem jól jelenik meg.A mínusz bejelentkezés után: `R_1 (\ tau) = 1 -` az utolsó karakter valamiféle rendetlenség.Meg tudná ellenőrizni?Lehet, hogy a Tex használata helyett valami nem szabványos karaktert ragasztott be.
-1
A linuxon és a Windows-on is így néz ki: http://snag.gy/ZAp5T.jpg
@Tim Ez a mező nem felel meg semminek, ezért figyelmen kívül hagyható.Megpróbálom később szerkeszteni egy másik gépről.


Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...