Mikor (és miért) kell venni egy eloszlás (számok) naplóját?

PhD

2011-11-24 02:41:03 UTC

view on stackexchange narkive permalink

Tegyük fel, hogy van néhány történelmi adatom, például korábbi tőzsdei árak, repülőjegy-áringadozások, a társaság korábbi pénzügyi adatai ...

Most jön valaki (vagy valamilyen képlet), és azt mondja: "vegyük / use the log of the distribution "és itt tartok WHY?

Kérdések:

MIÉRT kell venni az elosztás naplóját Először is?
MIT „ad / leegyszerűsít” az eloszlás naplója, hogy az eredeti terjesztés nem tudott / nem?
A log transzformáció „veszteségmentes” ? Vagyis, ha log-térré transzformáljuk és az adatokat elemezzük, ugyanazok a következtetések érvényesek-e az eredeti eloszlás tekintetében is? Hogy lehet?
És végül MIKOR kell venni a disztribúció naplóját? Milyen feltételek mellett dönt valaki erről?

Nagyon szerettem volna megérteni a naplóalapú eloszlásokat (például lognormális), de soha nem értettem a mikor / miért szempontokat - azaz a Az eloszlás logiája normális eloszlás, akkor mi van? Mit is mond ez nekem és miért zavar? Innen a kérdés!

UPDATE : A @ whuber megjegyzésének megfelelően megnéztem a bejegyzéseket, és valamiért megértem a log transzformációk használatát és azok lineáris regresszióban való alkalmazását, mivel kapcsolatot hozhat létre a független változó és a függő változó logja között. Kérdésem azonban általános a magának az eloszlásnak az elemzése szempontjából - önmagában nincs olyan kapcsolat, amelyre következtetni tudnék, hogy megértsem a logok elemzésének okát az eloszlás elemzésére. Remélem, van értelme: - /

A regresszióanalízisben korlátai vannak az adatok típusának / illeszkedésének / eloszlásának, és átalakíthatja azokat, és meghatározhat egy kapcsolatot a független és (nem transzformált) függő változó között. De mikor / miért tenné ezt egy disztribúció esetén, ahol a típus / illeszkedés / eloszlás korlátai nem feltétlenül alkalmazhatók egy keretrendszerben (például regresszió). Remélem, hogy a pontosítás egyértelműbbé teszi a dolgokat, mint zavaros :)

Ez a kérdés egyértelmű választ érdemel a "MIÉRT és MIKOR" -ra

Mivel ez majdnem ugyanolyan területre terjed ki, mint az előző kérdések [itt] (http://stats.stackexchange.com/questions/298/in-linear-regression-when-is-it-appropriate-to-use-the-log- of-an-independent-va / 3530 # 3530) és [itt] (http://stats.stackexchange.com/questions/10975/transforming-proportion-data-when-arcsin-square-root-is-not-enough / 10979 # 10979), kérjük, olvassa el ezeket a szálakat, és frissítse kérdését, hogy a probléma olyan szempontjaira összpontosítson, amelyekkel még nem foglalkoztak. Ne feledje, hogy a # 4 (és a 3. része) elemi kérdések azokról a logaritmusokról, amelyek válaszai sok helyen megtalálhatók.

A pontosítás segít. Érdemes elgondolkodni azon a tényen, hogy a csak állandó kifejezéssel (és más független változóval nem rendelkező) való regresszió az adatok átlaguk körüli variációjának értékelését jelenti. Ezért, ha valóban megérti a függő változók naplóinak regresszióba vételének hatásait, akkor * már * megértette azt az (egyszerűbb) helyzetet, amelyről itt kérdez. Röviden, ha megválaszolják a regresszióra mind a négy kérdést, akkor nem kell ismét feltenniük a kérdést "az eloszlás elszigetelten".

@whuber: Úgy látom ... szóval megértem a naplók regresszióba vételének okait, de csak azért, mert nekem így tanítottak - megértem abból a szempontból, hogy ezt meg kell tenni, vagyis annak biztosítására, hogy az adatok illeszkedjenek a lineáris feltételezésekhez regresszió. Ez az egyetlen megértésem. Talán az hiányzik, hogy a naplók készítésének "valódi megértését" és így a zavartságot ... segítsen? ;)

Ah, de ennél sokkal többet tudsz, mert a naplók regresszióban történő felhasználása után tudod, hogy az eredményeket másképp értelmezik, és tudod, hogy ügyelj az illesztett értékek és a konfidencia intervallumok vissza-átalakítására. Azt javaslom, hogy * ne * keveredjen össze, és valószínűleg máris ismeri a válaszokat erre a négy kérdésre, annak ellenére, hogy kezdetben még nem volt tudatában :-).

@whuber: Ah, látom. Úgy tűnik, ideje némi önvizsgálatra :)

Az itt olvasható olvasók ezeket a szorosan kapcsolódó szálakat is megvizsgálhatják: [log-transzformált előrejelző értelmezése] (http://stats.stackexchange.com/questions/18480/), és [Hogyan értelmezzük a logaritmikusan átalakított együtthatókat a lineáris regresszió] (http://stats.stackexchange.com/questions/20397/how-to-interpret-logarithmically-transformed-coefficients-in-linear-regression).

tehát helyes-e azt mondani, hogy ha egy eloszlás nem lineáris, és a log-je lineáris .. akkor a log-ot használjuk, mivel könnyű lineáris eloszlást modellezni?

[Ez] (https://www.youtube.com/watch?v=FofnXXt6-rU) és [ez] (https://www.youtube.com/watch?v=1dUSNdZspQc&t=10s) jó magyarázatot ad.

Van néhány szilárd alaptanács, amikor nem használja a log-transzformációt, vagy mit vegyen figyelembe, ha elkészült?