Kérdés:
Számítsa ki a rendes változó átlagát
luciano
2013-08-16 13:49:58 UTC
view on stackexchange narkive permalink

Számos helyen olvastam, hogy a rendes változó átlagának kiszámítása nem megfelelő. Próbálok megérzést kapni arra, hogy miért nem megfelelő. Azt gondolom, hogy azért van, mert általában egy rendes változó nem normálisan oszlik el, ezért az átlag kiszámítása pontatlan ábrázolást eredményez. Tudna valaki részletesebben megindokolni, hogy miért lehet helytelen a rendes változó átlagának kiszámítása?

Az átlag kiszámításához először összegre van szükség. Ahhoz, hogy egy összeg értelmes legyen, szükséged van arra, hogy a 4 + 2 azonos legyen a 3 + 3-mal; ekvivalensen 4-3 = 3-2 = 2-1 kell. Rendes adatokkal - még akkor is, ha kategóriáit "1", "2", "3", "4" felirattal látják el, ez (egészen kifejezetten) nem feltétlenül így van.
És miért lenne a medián megfelelőbb, mint a számtani átlag?
Négy válaszokat:
Nick Cox
2013-08-16 14:26:06 UTC
view on stackexchange narkive permalink

Rövid válasz, hogy ez vitás. Az Ön által említett tanáccsal ellentétben az emberek sok területen alkalmazzák a sorszámot és gyakran boldogok, ami azt jelenti, hogy azt csinálnak, amit akarnak. Az egyik példa az oktatási rendszerek átlagai vagy ennek megfelelő értékek.

Azonban a rendes adatok nem szokásos elosztása nem megfelelő ok, mert az átlagot

  • széles körben használják nem normális eloszlások esetén

  • matematikailag jól meghatározható nagyon sok nem normális eloszlás esetén, kivéve néhány kóros esetet.

Lehet, hogy nem jó ötlet az átlagot a gyakorlatban használni, ha az adatokat biztosan nem szokásosan osztják el, de ez más.

Erősebb oka annak, hogy az átlagot ne használjuk a sorszámadatokkal, hogy értéke a kódolás konvencióitól függ. A numerikus kódokat, például az 1, 2, 3, 4 általában csak az egyszerűség vagy a kényelem kedvéért választják, de elvben ugyanúgy lehetnek 1, 23, 456, 7890, amennyiben az megfelel egy meghatározott sorrendnek. Az átlagérték mindkét esetben a szó szerinti értelmezést jelentené (nevezetesen mintha a számok nem önkényesek, hanem igazolhatóak lennének), és ennek nincs szigorú oka. Szüksége van egy intervallum skálára, amelyben az értékek közötti egyenlő különbségek szó szerint is felfoghatók az eszközök felvételének igazolására. Ezt tartom a legfőbb érvnek, de amint már jeleztem, az emberek gyakran figyelmen kívül hagyják és szándékosan, mert hasznosnak találják az eszközöket, bármit is mondanak a mérés elméletei.

Itt van egy további példa. Gyakran arra kérik az embereket, hogy válasszanak a "teljesen nem értek egyet" közül ... "teljesen egyetértek", és (részben attól függően, hogy mit akar a szoftver) a kutatók ezt kódolják: mint rendezett tényező (vagy bármilyen kifejezés, amelyet a szoftver használ). Itt a kódolás önkényes, és rejtve van azokra az emberekre, akik válaszolnak a kérdésre.

De gyakran megkérdezik (mondjuk) az embereket is 1-től 5-ig terjedő skálán, hogyan értékelsz valamit? Példák vannak bőven: weboldalak, sport, egyéb versenyek és valóban oktatás. Itt az embereknek egy skálát mutatnak, és felkérik őket, hogy használják. Széles körben ismert, hogy a nem egész számoknak van értelme, de Önnek csak megengedett, hogy egész számokat konvencióként használjon. Ez a rendes skála? Van, aki igent mond, van, aki nem. Másként fogalmazva, a probléma része az, hogy ami a rendes skála, az maga egy fuzzy vagy vitatott terület.

Vizsgálja meg ismét a tanulmányi osztályzatokat, mondjon E-t A-nak. Gyakran az ilyen érdemjegyeket numerikusan is kezeljük, mondjuk 1-től 5-ig, és az emberek rendszeresen kiszámítják a hallgatók, tanfolyamok, iskolák stb. az ilyen adatok elemzése. Bár igaz, hogy a numerikus pontszámokhoz való bármilyen hozzárendelés önkényes, de elfogadható mindaddig, amíg megőrzi a rendet, mindazonáltal a gyakorlatban az osztályzatot kijelölő és átvevő emberek tudják, hogy a pontszámoknak numerikus egyenértékük van, és tudják, hogy az osztályzatok átlagolásra kerülnek .

Az eszközök használatának egyik gyakorlati oka az, hogy a mediánok és a módok gyakran gyenge összefoglalók az adatokban. Tegyük fel, hogy van egy skálája, amely teljesen egyet nem ért, hogy teljesen egyetértjen, és az egyszerűség kedvéért kódolja az 1–5 pontokat. Most képzelje el, hogy az egyik minta 1, 1, 2, 2, 2 és egy másik 1, 2, 2, 4, 5 kódolású. a kezét, ha úgy gondolja, hogy a medián és a mód az egyetlen igazolható összefoglaló, mert ez egy sorskála. Most emelje fel a kezét, ha az átlagot is hasznosnak találja, függetlenül attól, hogy az összegek jól meghatározottak-e stb.

Természetesen az átlag túlérzékeny összefoglaló lenne, ha a kódok mondjuk 1-től 5-ig terjedő négyzetek vagy kockák lennének, és lehet, hogy nem ezt akarja. (Ha az a célja, hogy gyorsan azonosítsa a magas szórólapokat, lehet, hogy pontosan az, amire vágyik!) De pontosan ezért praktikus választás a hagyományos kódolás egymást követő egész kódokkal, mert a gyakorlatban gyakran elég jól működik. Ez nem olyan érv, amelynek bármilyen súlya van a méréselméleti szakembereknél, és ennek sem kellene, de az adatelemzőknek érdekelniük kell az információkban gazdag összefoglalók elkészítését.

Egyetértek bárkivel, aki azt mondja: használja a teljes osztályzat frekvenciák elosztását, de nem erről van szó.

Fontos a nagyszerű válasz és a pragmatizmus, de hozzátennék egy figyelmeztetést.Jó ok arra, hogy csak formálisan bevált módszereket alkalmazzunk, az az, hogy hozzáférhet a bizonyosság becsléséhez stb.Például, ha két GPA-nk van, mondjuk 4.53 és 4.34, akkor érdemes tudni, hogy az egyik "lényegesen" jobb-e, mint a másik.De az osztályzatok átlagolásának hiánya miatt az alaki követelmények miatt nem kapunk olyan dolgokat, mint a bizalmi intervallumok stb.
@StephenMcAteer Látom értelmét a tipikus bevezető szövegben vagy tanfolyamon tanított módszerek szempontjából.De ha ez lenne a vágy, a rendszerindítás már közel 40 éve biztosít olyan technológiát, amely lehetővé teszi a bizalmi intervallumokat.
SAAN
2013-08-16 13:59:06 UTC
view on stackexchange narkive permalink

Tegyük fel, hogy sorszámértékeket veszünk, pl. 1 az egyet nem értésért, 2 a nem értésért, 3 az egyetértésért és 4 az egyetértésért. Ha négy ember megadja az 1,2,3 és a 4 választ, akkor mi lenne az értelme? Ez (1 + 2 + 3 + 4) / 4=2,50.

Hogyan kell ezt értelmezni, ha a négy ember átlagos válasza "nem ért egyet vagy egyetért"? Ezért nem szabad a középsőt használni a sorszámadatokhoz.

Kicsit játszva az ördög szószólójával, ebben a példában a 2.5-öt úgy értelmezném, hogy félúton van 2, "nem értek egyet" és "3", "egyetértek" között. Ennek átlagonként van értelme, tekintve, hogy "határozottan nem értünk egyet" és "teljesen egyetértünk" és "nem értünk egyet" és "egyetértünk".
Ebben az összefüggésben a 2,5-es átlag elfogadása ebben az összefüggésben számomra még mindig van értelme - az egyet nem értés és az egyetértés félúton, vagyis másként: semleges.
Azt hiszem, Azeemnek erősebb példára van szüksége. Kifogásolhatja, hogy a családonként 1, 2, 3, 4 gyermek átlagaként ugyanezen okokból miért 2.5, hogyan kell ezt értelmezni, mivel ez nem tartozik a meghatározott értékek közé. Ez különböző kérdéseket vet fel.
@Azeem Tetszik az ön megközelítése, amely egyszerű ellenpéldát ad. Mit szólnál egy példához, ahol a kategóriáid számszerűsítenek valamit, pl. gyermekek súlya, márványok száma egy zacskóban, pl. valami kicsi = "0-1", közepes = "2-4", nagy = "5-10", xl = "> 10"?
@luciano Hogyan lehet értelme a 2.5-nek? Azt mondod, hogy félig nem értek egyet és egyetértek (a távolság 0,5), és ugyanezen félúton teljesen egyetértek és nem értek egyet (a távolság 1,5). Láttad már ezt? és hogyan lehetséges egy jelentés kétféle értelmezést ad. Valójában a 2.5 nem reprezentatív része az adatainak, az adatok egész számot az 1 és 4 közötti egész tartományra ugranak.
@TooTone Valójában a névleges és sorszámos besoroláson alapuló kvalitatív adatok és az Ön által megadott példa az intervallum vagy a Liket skálához tartozik, összekeveri önmagát a sorszám és a Liket skála adataiban.
Azeem: Nem értek egyet. Az @Tootone jó példával rendelkezik; példája és a tiéd is rendes. Hogy mi a Likert [NB] skála, az a legjobb, ha más kérdésként hagyjuk.
@NickCox "A gyermekek súlya" kvantitatív mérték, és az átlag ehhez megfelelő, "a golyók száma egy zacskóban" nem értem, hogy viszonyul a vitához, és feltételezik, hogy "valami kicsi =" 0-1 "..." végtelen értékek "0-1", "2-4" stb. között
A súlyról nem mondtam semmit. Kérem, nézze meg újra: példám a családonként élő gyermekek, akikre számít. A nézeteltérésed @TooTone,-vel van, aki tökéletesen megfogalmazza, hogy egy numerikus skálát rendezett (sorszámos) kategóriákra oszthat.
@NickCox A válaszod kedves Nem mondhatok semmit a válaszodról, igen, a nézeteltérésem a TooTone-nal áll, mert tudomásom szerint a lényeg (számszerű skála felosztása) a vegyes (sorszám és intervallum), nem pedig tiszta sorszámra vonatkozik.
Szerintem ez nem nehéz. Megkérhet valakit, hogy jelentse a családban élők korosztályát, években, 0–4, 5–9, stb. De amit a kutató lát és elemezni tud, ebben a példában csak sorszámkategóriák vannak. Ezt nevezi meg, mi van a kutatónak, nem az, ami lehet.
@NickCox Megbeszélhetjük a csevegőszobában?
Sajnálom, nem, én személy szerint nem használom a csevegőszobát. A legjobbnak tartom, hogy (a) a vita egy helyen elérhető legyen minden érdeklődő számára, hogy később könnyedén lássa; b) az emberek szerkesztik válaszaikat, hogy megfogalmazzák azokat a plusz pontokat, amelyeket szeretnének megfogalmazni, vagy világosabban elmagyarázzák nézeteiket.
@NickCox ok, Az utolsó példában az "emberek egy családban" jelentése teljes különbség, ez a jellemző az intervallumhoz tartozik, és lásd a kérdés Glen_b megjegyzését is.
Egyetértek; de az volt a véleményem, hogy az átlag nem lehetséges érték nem a legfontosabb kifogás, mivel ez könnyen lehetséges olyan változókkal, amelyeket nem rendesnek nevez. (Ezenkívül az átlag lehet egy lehetséges érték sorszámadatokkal, mint az 1,2,2,3 esetében.)
A kvalitatív adatokban (nominális és ordinális) azonban százalékokat vagy arányt, kvantitatív (intervallum és arány) átlagokat használunk. Az átlagot akkor határozzuk meg, ha az összeg osztható 4-gyel, valójában minden lehetséges kombinációban ritka, és nem tudjuk azt mondani, hogy ez az idő meghatározott, és ezúttal nem. (nem sértjük az alapszintet)
Úgy gondolom, hogy megerősítheti válaszát, és arra biztatom. "mert az átlag lehet meghatározhatatlan érték", itt sem logikai, sem pszichológiai szempontból nem erős érv, és nem arra a mélyebb kérdésre összpontosít, hogy az egyenlő különbségek valóban egyenlő különbségeket jelentenek-e.
Azt hiszem, más úton haladunk, @NickCox Magyarázatra van szükségem, miért hívod az intervallumokra osztott adatokat a valós vonalon sorszámadatnak?
Nem tudok sokat hozzáfűzni az @NickCox's kiállításhoz. Olyan példára próbáltam gondolni, ahol a kategóriák nyilvánvalóan torzak, ezért az egyenlő távolságra lévő kategóriák címkéinek átlagának megadása nem felel meg annak, amit a kategóriák jelölnek. "A numerikus skála felosztása", ahogy Nick mondta, egyértelmű módjának tűnt. De elő tudna állítani valami szubjektívebbet is. Például. állatok súlya: 1 = "mikroszkópos", 2 = "apró" stb.
@TooTone "1 =" mikroszkópos ", 2 =" apró "", mint az 1.5 értelmezése
Nem tudom, hogyan tudom egyértelműbbé tenni, de (pl.) A "0-4", "5-19", "20-114" sorrendben (sorrendben) szerepel, mivel ezeknek a méréseknek csak _egy_ természetes sorrendje van. (rövid a megfordítás). Ha más néven is akarod őket hívni, akkor ez rendben van tőlem.
Jens Kouros
2013-08-16 14:22:53 UTC
view on stackexchange narkive permalink

Teljesen egyetértek @Azeem-lel. De csak azért, hogy ezt a pontot hazavezessem, hadd fejtsem ki egy kicsit tovább.

Tegyük fel, hogy vannak sorszámadatai, mint például az @Azeem példában, ahol skálája 1 és 4 között mozog. És tegyük fel, hogy van pár ember értékel valamit (például Ice Cream) ezen a skálán. Képzelje el, hogy a következő eredményeket kapja:

  • A személy azt mondta, 4
  • B személy azt mondta, hogy 3
  • C személy azt mondta, hogy 1
  • D személy szerint 2

Ha szeretné értelmezni az eredményeket, akkor a következőképpen következtethet valamire:

  • A személynek jobban tetszett a fagylalt, mint B személy
  • D személynek jobban tetszett a fagylalt, mint a C személynek

Az értékelések közötti intervallumokról azonban semmit sem tud. Az 1 és 2 közötti különbség megegyezik a 3 és 4 közötti különbséggel? A 4-es besorolás valóban azt jelenti, hogy az illető négyszer jobban szereti a fagylaltot, mint az, aki 1-nek értékeli? És így tovább ... Amikor kiszámítja a számtani átlagot, úgy kezeli a számokat, mintha a különbségek közöttük egyenlőek lennének. De ez meglehetősen erős feltételezés sorszámadatokkal, és ezt meg kell indokolnia.

Szerkesztettem a fenti válaszra való hivatkozást. A válaszok megváltoztathatják a sorrendet, és valójában a fenti válasz ebben a pillanatban alább van, és ez változhat. Tehát keress a poszterekre, ne pedig a pozícióra.
ayaz
2016-01-01 13:28:15 UTC
view on stackexchange narkive permalink

Egyetértek azzal a véleménnyel, hogy a számtani átlag nem igazolható a sorszámadatokban. Az átlag kiszámítása helyett módot vagy mediánt használhatunk ilyen helyzetekben, amelyek értelmesebb értelmezést adhatnak eredményeinkről.

Ez nem foglalkozik azzal a kérdéssel, hogy ** miért nem megfelelő.


Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...