Kérdés:
Helyénvaló az átlagot hisztogramon ábrázolni?
Guest
2013-03-20 02:23:50 UTC
view on stackexchange narkive permalink

Helyes hozzáadni egy függőleges vonalat a hisztogramhoz az átlagérték megjelenítéséhez?

Számomra rendben van, de ezt még soha nem láttam a tankönyvekben és hasonlókban, ezért kíváncsi vagyok, van-e valamilyen egyezmény, hogy ezt ne tegyék?

A grafikon egy szakdolgozatra vonatkozik, csak arra szeretnék ügyelni, hogy véletlenül ne sértsek meg néhány szuper fontos, kimondatlan statisztikát. :)

Miért ne. Csak megjegyzést fűzni. Az átlag a hisztogramnak megfelelő összegző érték. Változtathatja a rendelkezésre bocsátott információk mértékét, például a hisztogram vázlatméretét módosítva. Azonban általában a hisztogram több információt nyújt, mint az átlag. Az átlagértéket egy hisztogram alapján közelítheti meg. Azt hiszem, ezért nem szokták őket együtt biztosítani.
Az ember néha átfedő eloszlású hisztogramokat lát (pl. Tapasztalataim szerint a normál eloszlást a minta átlagának és szórásának felhasználásával ábrázolják.) Ami ugyanazt (és egy kicsit többet) csinálja, mint egy függőleges vonal rajzolása (jelezve, hogy a minta hol található) az átlag a görbe csúcsával van.)
Négy válaszokat:
Glen_b
2013-03-20 02:39:28 UTC
view on stackexchange narkive permalink

Természetesen, miért ne?

histogram with mean

Íme egy példa (egy tucat közül az egyiket találtam egy egyszerű Google kereséssel):

hist with mean and median

(A kép forrása a mérhető használhatósági blog, itt.)

Láttam már átlagértéket, plusz vagy mínusz szórást, különféle kvantilisokat (például medián, kvartilis, 10.) és 90. percentilisek). Mindegyik különféle módon jelenik meg.

Ahelyett, hogy egyeneset rajzolna a diagramra, az alján láthatja az információkat - például:

histogram with marginal boxplot

Van egy példa (az egyik a sok közül), ahol egy boxplot van fent, nem pedig alul, itt.

Az emberek néha megjelölnek az adatokban:

histogram rugplot with jitter
(Az adatok helyét kissé megrázkódtam, mert az értékeket egész számokra kerekítettük, és nem látta a relatív értéket. jól.)

Van ilyen példa, a Statában, ezen az oldalon (lásd a harmadik itt)

A hisztogramok jobbak egy kis extra információval - önmagukban is megtévesztőek lehetnek

Csak arra kell ügyelnie, hogy elmagyarázza, miből áll a cselekménye! (Jobb címet és x-tengelyes címkét szeretne, mint amit itt használtam, kezdőknek. Plusz magyarázat egy képaláírással, amely elmagyarázza, mit jelölt meg rajta.)

-

Egy utolsó cselekmény:

histogram with stripchart

-

A terveimet az R-ben generálják.

Szerkesztés:

Ahogy @gung sejtette, a abline (v = mean ... -ot használták az átlagvonal rajzolásához a grafikonon, a rug pedig a rajzoláshoz az adatértékek (bár valójában a rug (jitter (... -t használtam, mert az adatokat egész számokra kerekítettük) használtam.

Íme egy módszer arra, hogy a hisztogram és a a tengely:

  hist (Davis2 [, 2], n = 30) boxplot (Davis2 [, 2], add = IGAZ, vízszintes = IGAZ, = -0,75, szegély = "sötét ", boxwex = 1.5, outline = FALSE)  

Nem fogom felsorolni, hogy mire van szükség, de ellenőrizheti az argumentumokat a súgóban (? boxplot ), hogy megtudja, mire valók, és saját maga játszhat velük.

Ez azonban nem általános megoldás - nem garantálom, hogy mindig ugyanolyan jól fog működni, mint itt (megjegyzés: a at és a boxwex opciókat már megváltoztattam *). Ha nem intelligens függvényt írsz, hogy mindenről gondoskodhasson, akkor oda kell figyelni, hogy mi minden történik, hogy megbizonyosodjon arról, hogy azt csinálja, amit szeretnél.

Így hozhatod létre az általam használt adatokat (I megpróbálta bemutatni, hogy Theil regresszió valóban képes volt kezelni több befolyásos kiugrást). Csak olyan adatok voltak, amelyekkel játszottam, amikor először válaszoltam erre a kérdésre.

  library ("car") add <- data.frame (sex = c ("F", "F "), súly = c (150 130), magasság = c (NA, NA), repwt = c (55,50), repht = c (NA, NA)) Davis2 <- rbind (Davis, add)  

* - a at megfelelő értéke -0,5-szerese a boxwex értékének; ez jó alapértelmezés, ha egy függvényt írsz rá; A boxwex -ot úgy kell méretezni, hogy az összefüggjen a boxplot y-skálájával (magassága); Azt javaslom, hogy a felső y-határ 0,04–0,05-szöröse gyakran rendben lehet.

A marginális sávdiagram kódja:

  hist (Davis2 [, 2], n = 30) szalagtábla (jitter (Davis2 [, 2], mennyiség =, 5), módszer = "jitter", jitter =, 5, pch = 16, cex =, 05, add = IGAZ, = -. 75, col = 'lila3')  
+1, ezek szépek; érdekli a kód hozzáadása? `abline (v = mean (Davis2 [, 2]))` & `szőnyeg (Davis2 [, 2])` Azt hiszem, de hogyan ékelte be oda a boxplotot?
@gung Lásd a szerkesztést rövid részletekért, beleértve egy reprodukálható példát, amely hasonló a boxplot-hoz. Valójában nem csinál okosabb dolgot, mint a "boxplot" függvény több argumentumát használni. A `boxplot` és a` boxp` között meglehetősen ügyes dolgokat végezhet, kevés erőfeszítéssel.
Bölcsesség a korok számára: "Ha nem írsz intelligens funkciót, hogy mindenről gondoskodj, akkor figyelni kell arra, hogy mi mindent tesz, hogy megbizonyosodj arról, hogy azt csinál, amit szeretnél" ;-).
Igen. Még azt is fontolgattam, hogy írok valami okosat, hogy beállítsam az „at” és a „boxwex” stb. Beállításokat ... de legjobb esetben évente csak néhány ilyen cselekményt készítek, és minden alkalommal néhány másodpercbe telik a? Boxplot beírása és a megfelelő opciók. Arra gondoltam, hogy könnyebb csak arra figyelni, amit csinálok.
@gung szerkesztettem, hogy kódot adjak az általam használt Davis2 adatok létrehozásához. Remélem segít.
TLJ
2013-03-20 02:47:24 UTC
view on stackexchange narkive permalink

Természetesen lehet. Csak feltétlenül jelölje meg egyértelműen / jelezze, mit jelent a vonal, és kerülje a cselekmény túlságosan elfoglaltá tételét.

Semmi sem rosszabb, mint egy grafikon, amely túl sok információt közvetít ahhoz, hogy könnyen érthető legyen. A táblázat gyakran figyelmen kívül hagyja az összefoglaló statisztikák világos, tömör megjelenítését.

Nick Cox
2013-11-07 06:05:51 UTC
view on stackexchange narkive permalink

A korábbi válaszok kitűnő pontokat mutatnak, de itt meg kell adni az egyik alapvető elemet.

Az átlag az eloszlás súlypontja, tehát a hisztogram forgáspontja. Itt egyensúlyozna az eloszlás. Tehát van egy kölcsönös összefüggés: az átlag nemcsak a hisztogram gondolkodásában segíthet, hanem a hisztogram is az átlagban való gondolkodásban. Ez talán még hasznosabb, ha az eloszlás ferde, és az eloszlás átlaga nem feltétlenül a közepén van.

RS18
2013-03-20 02:35:47 UTC
view on stackexchange narkive permalink

Nem látok problémát vele, lásd például ezt, ezt és ezt.



Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...