Kérdés:
Modellezhető-e egy trendstacionárius sorozat az ARIMA-val?
B_Miner
2014-07-11 06:27:18 UTC
view on stackexchange narkive permalink

Kérdésem / zavarom van az ARIMA (X) modellezéshez szükséges helyhez kötött sorokkal kapcsolatban. Erre inkább a következtetés (a beavatkozás hatása) vonatkozásában gondolok, de szeretném tudni, hogy az előrejelzés és a következtetés különbségeket okoz-e a válaszban.

Kérdés:

Az összes általam olvasott bevezető forrás azt állítja, hogy a sorozatnak helyhez kötöttnek kell lennie, ami számomra értelmes, és itt jön be az "én" in arima (differenciálva).

Ami engem megzavar, az a trendek és sodródások használata az ARIMA-ban (X), valamint az implikációk (ha vannak ilyenek) a helyhez kötött követelményekre.

A konstans / sodródó kifejezés és / vagy trendváltozó exogén változóként történő használata (azaz a „t” hozzáadása regresszorként) semlegesíti-e a sorozat álló helyzetének követelményét? A válasz attól függ, hogy a sorozatnak van-e egységgyökere (pl. Adf teszt), vagy van-e determinisztikus irányzata, de nincs egységgyökere?

OR

Az ARIMA (X) használata előtt mindig egy sorozatnak állandónak kell lennie, differenciálással és / vagy csökkentéssel kell elkészíteni?

Négy válaszokat:
javlacalle
2014-07-12 14:13:06 UTC
view on stackexchange narkive permalink

A megjegyzéseket nézve úgy tűnik, hogy nem foglalkoztunk azzal a kérdéssel, hogy miként válasszunk egy determinisztikus vagy sztochasztikus trend között. Vagyis a gyakorlatban való továbblépés, nem pedig az egyes esetek következményei vagy tulajdonságai.

A folytatás egyik módja a következő: Kezdje az ADF teszt alkalmazásával.

  • Ha az egységgyök nullát elutasítjuk, akkor készen vagyunk. A trend (ha van ilyen) determinisztikus lineáris trenddel reprezentálható.
  • Ha az ADF teszt nulláját nem utasítjuk el, akkor a KPSS tesztet alkalmazzuk (ahol a null hipotézis ellentétes, stacionárius vagy egy lineáris trend körüli stacionárius).

    o Ha a KPSS teszt nullát elutasítjuk, akkor arra a következtetésre jutunk, hogy van egységgyökér, és az adatok első különbségeivel dolgozunk. A sorozat első különbségei után tesztelhetjük más regresszorok jelentőségét, vagy választhatunk ARMA modellt.

    o Ha a KPSS teszt nulláját nem utasítjuk el, akkor azt kell mondanunk, hogy az adatok nem nagyon informatív, mert nem tudtuk elutasítani a nullhipotézisek egyikét sem. Ebben az esetben biztonságosabb lehet a sorozat első különbségeivel dolgozni.

Amint azt egy korábbi válasz említette, ne feledje, hogy ezeket a teszteket befolyásolhatja a kiugró értékek (pl. kiugró értékek egyetlen időpontban, az adatok rögzítésénél fellépő hiba vagy egy szinteltolás miatt, például a sorozatot egy adott időpontban érintő irányelvváltozás miatt). Ezért tanácsos ezeket a kérdéseket is ellenőrizni, és megismételni az előző elemzést, miután regresszorokat is beiktattunk néhány potenciális kiugró helyzetbe.

Fantasztikus! Helyes volt a fenti megjegyzésemre vonatkozó kérdés, hogy ha trendnek látszunk, akkor az ADF tesztet használjuk, amely tartalmaz egy trendet (# 3 opció az általam közzétett linkben)?
Utolsó kérdés - mit gondol arról a helyzetről, amikor egy ARIMA-t illeszt, mondjuk az ARIMA-t (0,1,1) egy sorba, és a különbség átlaga nem nulla? Ez azt jelenti, hogy úgy gondolom, hogy hozzáad egy állandót a modellhez - ami az eredeti sorozat lineáris trendjét is képviseli. Mit jelent ez az eset? Az eredeti sorozat trendje determinisztikus, mert a sorozat differenciálása nem távolította el a trendet?
@B_Miner Első megjegyzésével kapcsolatban azzal kezdeném, hogy csak egy lehallgatást adok hozzá. Ha a trend kissé exponenciálisnak tűnik, akkor hozzáadhatja a lineáris trend meredekségének paraméterét is, és megnézheti, hogy ez jelentős-e. Általában jobb, ha kevés paraméterrel rendelkező modellel kezdünk, és ha a maradványok diagnosztikája nem kielégítő, akkor fontold meg más elemek hozzáadását.
@B_Miner Az első különbségek figyelembe vétele mind a determinisztikus, mind a sztochasztikus trendet eltávolítja. Ha trendet lát a differenciált sorozatban az elfogással rendelkező modellben, akkor fontolja meg a különbségek újbóli felvételét (azaz tesztelje a második egységgyökeret).
Mi van, ha az ADF és a PP elutasítja az egységgyökér $ H_0 $ értékét, de a KPSS (szint és trend) elutasítja a $ H_0 $ stacionaritást?Idősorom: https://pastebin.com/raw/VF7XzxVP
@pidosaurus az egyetértés hiánya az ADF és a KPSS tesztek között a kis minta nagyságának, a kiugró értékek jelenlétének, a nemlineáris trendnek, ... ha további ellenőrzés után még mindig nem világos, melyik a megfelelőbb, biztonságosabb lehet figyelembe venni az egységgyök jelenlétét.Az adatok gyors áttekintése egy nemlineáris trend jelenlétét javasolta nekem, megfelelő lehet a $ a_1 t + a_2 t ^ 2 $ alakú kvadratikus trend.
forecaster
2014-07-11 08:57:51 UTC
view on stackexchange narkive permalink

Nagyon érdekes kérdés, azt is szeretném tudni, hogy mások mit mondanak. Képzettséggel mérnök vagyok, és nem statisztikus, így valaki ellenőrizheti a logikámat. Mérnökként szeretnénk szimulálni és kísérletezni, ezért motivált voltam a kérdésed szimulálására és tesztelésére.

Amint azt az empirikusan bemutattuk, az ARIMAX-ban egy trendváltozó használata nem tette szükségessé a differenciálást, és a sorozat trendjét stacionáriussá tette . Itt van az a logika, amelyet az ellenőrzéshez használtam.

  1. AR folyamat szimulálása
  2. Meghatározó trend hozzáadása
  3. A trenddel modellezett ARIMAX használata exogén változóként a a fenti sorozatok megkülönböztetés nélkül.
  4. Ellenőrizte a maradványokat a fehér zaj tekintetében, és ez teljesen véletlenszerű.

Az alábbiakban az R kód és a diagramok találhatók:

  set.seed (3215) ## AR folyamat szimulálása <- arima.sim (n = 63, lista (ar = c (0,7))); plot (x) ## Determinisztikus trend hozzáadása az ARt <-seq ( 1, 63) béta <- 0.8t_beta <- ts (t * béta, gyakoriság = 1) ar_det <- x + t_betaplot (ar_det) ## Ellenőrizze az arimaar_model <- arima (ar_det, sorrend = c (1,0,0) ), xreg = t, include.mean = FALSE) ## Ellenőrizze, hogy az illesztett modell maradványai randompacf-e (ar_model $ maradványok)  

AR (1) Szimulált ábra enter image description here

AR (1) determinisztikus trenddel enter image description here

ARIMAX maradék PACF, mint trend exogén. A maradékok véletlenszerűek, mintázat nem maradt. enter image description here

Mint fent látható, a determinista trend mint egzogén változó modellezése az ARIMAX modellben nem teszi szükségessé a differenciálást. Atleast a determinisztikus esetben működött. Kíváncsi vagyok, hogyan viselkedne ez sztochasztikus trend esetén, amelyet nagyon nehéz megjósolni vagy modellezni.

A második kérdés megválaszolásához IGEN, az összes ARIMA-t, beleértve az ARIMAX-ot is, helyhez kell kötni. Legalábbis ezt mondják a tankönyvek.

Ezenkívül, ahogy megjegyeztük, olvassa el ezt a cikket. Nagyon világos magyarázat a determinisztikus trend és a sztochasztikus trend iránt, és hogyan lehet ezeket eltávolítani, hogy a trend stacioner legyen, és nagyon szép irodalmi felmérés is erről a témáról. Ideghálózati kontextusban használják, de általános idősoros problémák esetén hasznos. Végső ajánlásuk az, amikor egyértelműen determinisztikus trendként azonosítják, a do lineáris detrending, különben differenciálást alkalmaznak az idősor stacionáriussá tételéhez. A zsűri még mindig ott van, de az ebben a cikkben idézett kutatók többsége a differenciálást javasolja a lineáris hátrányos ellentétben.

Szerkesztés :

Az alábbiakban véletlenszerű séta sodródó sztochasztikus folyamattal, exogén változó és differencia arimát használva. Úgy tűnik, hogy mindkettő ugyanazt a választ adja, és lényegében ugyanazok.

  library (Hmisc) set.seed (3215) ## ADD Stochastic Trend az Arima szimulációjához, ez AR (1) egységgyökérrel nem nulla meany = rep (NA, 63) y [[1]] <- 2 for (i in 2:63) {y [i] <-3 + 1 * y [i-1] + rnorm (1, átlag = 0, sd = 1)} diagram (y, type = "l") y_ts <- ts (y, frequency = 1) ## Lag az Xregy_1 <- Lag (y, shift = 1) létrehozásához ## Kezdje 2-től Az NA elkerülése és az egyenlő hosszúság elérése az xregy < ablakkal (y_ts, start = 2, end = 63) xreg1 <- y_1 [-1] ## Ellenőrizze az értékeket az ARIMA és az xregg <- arima (y, order = c (0,0,0), xreg = xreg1) pacf (g $ maradványok) ## Ellenőrizze az értékeket az ARIMg1 <- arima (y, order = c (0,1,0)) pacf (g1 $ maradék) # értékkel # ARIMA (0,0,0) nem nulla átlag együtthatókkal: xreg1 metszete 3.1304 0.9976se 0,2664 0,0025  

Remélem, ez segít!

Mások nézetei is érdekelnek - nem vagyok biztos benne, hogy a maradék fehér zaj megfelel-e a sorozat álló helyzetének követelményének - vagyis ha fehér zajt ér el, akkor elégedett lehet-e? Vagy az exogén változó beillesztése valóban a "trendek" hatására hat, és ezt a sorozatot stacionáriussá teszi? Kíváncsi vagyok, hogy ellenőrizni akarjuk-e ezt a későbbi kérdést, ha ugyanazt a modellt kapja (ar1 együttható, stb.), Ha lineáris regresszióval távolítja el a trendet, majd illeszkedik az arimához (1,0,0) ... ezt és a eredmények közel vannak. Tehát talán az exogén változó hozzáadása megegyezik a levonással.
Igen, ugyanaz, néhány hónappal ezelőtt találkoztam ezzel egy neurális hálózat előrejelző cikkében. Adok referenciát, ha megtalálom.
Van valami ötlet arról az esetről, amikor van egységgyökér, vagy ha van állandó a modellben?
Frissítettem válaszomat azzal a cikkel, amelyre hivatkoztam.
Azt hiszem, lehet, hogy nem mentetted el.
@forecaster Ha helytelenül értettem a kódját, akkor egy autoregresszív modellt szimulál, amelynek együtthatója $ 0.86 $. Ez egy helyhez kötött folyamat, amely, amint kiderül, nem igényel különbséget. A sztochasztikus trend kifejezés olyan folyamatra utal, amely egységgyökeret tartalmaz; egy véletlenszerű séta, ahol a sokkok örök hatást fejtenek ki és hosszú távú trendet generálnak. Stacionárius folyamatban a sokkok hatása néhány megfigyelés után eltűnik, és nincs trendhatás vagy hosszú távú ciklus. Talán szeretne kipróbálni néhány kísérletet egy véletlenszerű sétával, amely "cumsum (rnorm (n = 100))" néven szimulálható.
@javlacalle, az eredeti kód-előrejelző helyesen közzétette az egyik kérdésemet: "Mi van, ha egy sorozatnak determinisztikus irányzata van, de nincs egységgyökere?" Helyes?
@B_Miner Módosítottam a kód második verzióját, hogy az egységgyöket állandóval tartalmazza.
Felhívjuk figyelmét, hogy a második példa egyenértékű az 1. rendű differenciálással
Plissken
2014-07-12 02:54:49 UTC
view on stackexchange narkive permalink

Ne felejtsük el, hogy a nem stacionáriusnak különböző fajtái vannak, és különböző módon lehet kezelni őket. Négy általános:

1) Determinisztikus trendek vagy trendállapotosság. Ha az Ön sorozata ilyen jellegű, akkor tendenciáját csökkenti, vagy időbeli tendenciát tartalmaz a regresszióban / modellben. Érdemes megnézni a Frisch – Waugh – Lovell tételt.

2) Szinteltolódások és szerkezeti törések. Ebben az esetben minden egyes töréshez be kell adni egy dummy változót, vagy ha a minta elég hosszú, akkor mindegyik kezelési módot külön-külön kell modelleznie.

3) Változó variancia. Vagy külön modellezze a mintákat, vagy az ARCH vagy a GARCH modellezési osztály segítségével modellezze a változó varianciát.

4) Ha a sorozatad egységgyökeret tartalmaz. Általában ellenőriznie kell a változók közötti kointegrációs kapcsolatokat, de mivel az egyváltozós előrejelzéssel foglalkozik, az integráció sorrendjétől függően egyszer vagy kétszer meg kell különböztetnie.

Az idősor modellezéséhez a Az ARIMA modellezési osztálynak a következő lépéseknek kell megfelelnie:

1) Nézze meg az ACF és a PACF adatait, valamint egy idősor diagramot, hogy megnézze, a sorozat áll-e vagy sem.

2) Ellenőrizze, hogy a sorozatban van-e egységgyökér. Ez tesztek széles skálájával végezhető el, amelyek közül a leggyakoribb az ADF teszt, a Phillips-Perron (PP) teszt, a KPSS teszt, amelynek nincs stataritása, vagy a DF-GLS teszt, amely a leghatékonyabb a fent említett tesztek közül. JEGYZET! Abban az esetben, ha a sorozatod tartalmaz strukturális törést, ezek a tesztek elfogultak abban, hogy ne utasítsák el az egységgyök nullát. Abban az esetben, ha tesztelni szeretné ezeknek a teszteknek a robusztusságát, és ha egy vagy több szerkezeti törésre gyanakszik, használjon endogén szerkezeti törésteszteket. Két általános a Zivot-Andrews teszt, amely lehetővé teszi egy endogén szerkezeti törést, és a Clemente-Montañés-Reyes, amely két szerkezeti törést tesz lehetővé. Ez utóbbi két különböző modellt tesz lehetővé. Egy additív outlier modell, amely a sorozat meredekségében bekövetkező hirtelen változásokat veszi figyelembe, és egy innovatív outlier modell, amely fokozatos változásokat vesz figyelembe, és lehetővé teszi a metszés és a lejtés megtörését. gyökér a sorozatban, akkor különbséget kell tennie a sorozatban. Utána meg kell futtatnia az ACF, a PACF és az idősor diagramját, és valószínűleg ellenőriznie kell, hogy a második egységgyökér biztonságos-e. Az ACF és a PACF segít eldönteni, hogy hány AR és MA kifejezést tartalmazzon.

4) Ha a sorozat nem tartalmaz egységgyökeret, de az idősor-diagram és az ACF azt mutatja, hogy a sorozatnak determinisztikus trendje van, akkor a modell illesztésekor hozzá kell adnia egy trendet. Vannak, akik azt állítják, hogy teljesen érvényes, ha csak a sorozatot különböztetjük meg, ha az egy determinisztikus trendet tartalmaz, bár az információ elveszhet a folyamat során. Ennek ellenére jó ötlet különbséget tenni annak érdekében, hogy sok AR és / vagy MA kifejezést tartalmazzon, amelyet be kell foglalnia. De az időbeli trend érvényes.

5) Illessze be a különböző modelleket, és hajtsa végre a szokásos diagnosztikai ellenőrzést, érdemes információs kritériumot vagy az MSE-t használni, hogy kiválassza a megfelelő modellt, amely megfelel az Ön számára megfelelő mintának rajta.

6) Tegye meg a legjobban illeszkedő modellek előrejelzését, és számítsa ki a veszteségfüggvényeket, például az MSE, MAPE, MAD, hogy megtudja, melyikük teljesít a legjobban az előrejelzés során, mert ezt szeretnénk megtenni!

7) Végezze el a mintadarabot előrejelzésként, mint egy főnök, és elégedett legyen eredményeivel!

És hogy gyorsan válaszoljak a kérdésedre. Igen, tud.
Nem volt szabad kommentálnom a fentieket, mivel nincs elég hírnevem, de szeretném felhívni a figyelmet arra, hogy a fehér zaj folyamata stacionárius. Átlagossága és szórása az idő múlásával nem változik, így helyhez kötött!
Dan, remek válasz! A legutóbbi itteni megjegyzésével kapcsolatban azt akarja mondani, hogy ha a végén marad a fehér zaj maradványa, amely helyhez kötött .... akkor azt mondja, hogy megfelelően modellezte a sorozatot (vagyis megfelelően / megfelelően foglalkozott az állékonyság kérdésével)?
Igen, pontosan. Gyakran a Ljung-Box Q tesztet használják a maradványok tesztelésére, hogy lássák, véletlenszerűek-e vagy sem. Abban az esetben, ha azok, akkor a modell az adatok megfelelő ábrázolása. Valami, amit elfelejtettem megemlíteni a fenti válaszban, az is, hogy a modell felszerelése után megnézheti az illesztett sorozat maradványainak ACF és idősor diagramját. Ez jól jelzi, hogy maradványai fehér zaj-e vagy sem (az ACF-nek nem lehetnek jelentős lemaradásai). Egyébként a legtöbb statisztikai csomag rendelkezik egy paranccsal a Ljung-Box Q teszthez.
Itt található a Ljung-Box Q teszt wiki linkje: http://en.wikipedia.org/wiki/Ljung%E2%80%93Box_test
javlacalle
2014-07-12 03:14:28 UTC
view on stackexchange narkive permalink

Annak meghatározása, hogy a trend (vagy más összetevő, például a szezonalitás) determinisztikus vagy sztochasztikus-e, része az idősor-elemzés feladványának. Pár pontot fűzök az elmondottakhoz.

1) A determinisztikus és a sztochasztikus trendek megkülönböztetése azért fontos, mert ha az egységben egy gyökér van jelen (pl. Véletlenszerű séta), akkor tesztstatisztikát kell használni mert a következtetés nem követi a hagyományos eloszlást. Lásd ezt a bejegyzést néhány részletért és hivatkozásért.

Szimulálhatunk egy véletlenszerű sétát (sztochasztikus trend, ahol az első különbségeket kell megtenni), tesztelhetjük a determinisztikus trend jelentőségét, és megnézhetjük azon esetek százaléka, amelyekben a determinisztikus trend nullát elutasítják. Az R-ben megtehetjük:

  megköveteli (lmtest) iter <- 10000cval <- 0.05n <- 120rejection <- 0set.seed (123) for (i in seq.int (iter) ) {x <- cumsum (rnorm (n)) # random walk fit <- lm (x ~ seq (n)) if (coeftest (fit) [2, "Pr (> | t |)"]] < cval) elutasítások <- elutasítások + 1} 100 * elutasítás / iter # [1] 88.67  

5% -os szignifikancia szinten az esetek 95% -ában a null elutasítását várnánk, ebben a kísérletben a 10 000 szimulált véletlenszerű séta közül csak az esetek ~ 89% -ában utasították el.

unit root teszteket alkalmazhatunk annak tesztelésére, hogy van-e unit root. De tisztában kell lennünk azzal, hogy a lineáris trend viszont oda vezethet, hogy elutasítja az egységgyök nullát. Ennek megoldása érdekében a KPSS teszt a stacionaritás nullát veszi figyelembe egy lineáris trend körül.

2) Egy másik kérdés a folyamat determinisztikus komponenseinek értelmezése szinteken vagy az első különbségek. Az elfogás hatása nem azonos egy lineáris trendű modellben, mint egy véletlenszerű séta során. Illusztrációként lásd: ezt a bejegyzést.

Analitikai szempontból tegyünk egy véletlenszerű sétát sodródással: $$ y_t = \ mu + y_ {t-1} + \ epsilon_t \ ,, \ quad \ epsilon_t \ sim NID (0, \ sigma ^ 2) \,. $$

Ha ismételten kicseréljük a $ y_ {ti} $ a $ y_t $ lemaradt verzióival:

\ begin {eqnarray *} y_t & = & \ mu + \ underace [y_ {t-1}} _ {\ mu + y_ t -2} + \ epsilon_ {t-1}} + \ epsilon_t \\ & = & 2 \ mu + \ alátét {y_ {t-2}} _ {\ mu + y_ {t-3} + \ epsilon_ {t -2}} + \ epsilon_ {t-1} + \ epsilon_t \\ & = & 3 \ mu + y_ {t-3} + \ epsilon_ {t-2} + \ epsilon_ {t-1} + \ epsilon_t \ \ & ... & \ end {eqnarray *}

Megérkezünk:

$$ y_t = y_0 + \ mu t + \ sum_ {i = 1} ^ t \ epsilon_i $$

ahol a $ y_0 $ valamilyen tetszőleges kezdőérték. Így azt látjuk, hogy a sokkok felhalmozódása és a véletlenszerű séta hosszú memóriája miatt a $ \ mu $ metszéspontja lineáris trendet eredményez a $ \ mu $ meredekséggel (ebben az esetben a $ \ mu $ állandó kifejezés driftnek nevezzük).

Ha egy sorozat grafikus ábrázolása viszonylag egyértelmű lineáris trendet mutat, akkor nem lehetünk biztosak abban, hogy ez egy determinisztikus lineáris trend jelenlétének vagy véletlenszerű séta során bekövetkezett sodródásnak köszönhető-e. folyamat. Kiegészítő grafikákat és tesztstatisztikákat kell alkalmazni.

Néhány figyelmeztetést figyelembe kell venni, mivel az egységgyökéren és más tesztstatisztikákon alapuló elemzés nem bolondbiztos. Ezen tesztek némelyikét befolyásolhatja a távoli megfigyelések vagy a szinteltolódások jelenléte, és szükség lehet egy késleltetési sorrend kiválasztására, amely nem mindig egyszerű.

Ennek a rejtvénynek a kerülő megoldásaként úgy gondolom, hogy a bevett gyakorlat az, hogy az adatok különbségeit addig vesszük, amíg a sorozat állónak látszik (például megnézzük az autokorrelációs függvényt, amelynek gyorsan nullára kell mennünk), majd kiválasztunk egy ARMA modellt.

Greta posta - Ön egyértelműen nagy előnye ennek a webhelynek! Kíváncsi voltam, hogy itt és a többi hozzászólásodban néztem - lehetséges-e ADF vagy KPSS teszt segítségével meghatározni, hogy a sorozat szintjeinek trenddinamikusnak tűnő-e determinisztikus vagy sztochasztikus? Megtaláltam ezt: http://faculty.smu.edu/tfomby/eco6375/BJ%20Notes/ADF%20Notes.pdf, aminek hatására úgy néz ki, hogy ha a sorozatban vizuálisan trendet lát, használja a teszt 3. opcióját, és ha nem utasítja el a nullát, akkor bizonyítéka van egy determinisztikus trendre.
Dan kommentje alapján azt hiszem, ha fehér maradványokat kapsz, akkor ez nem számít :)


Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...