Mit jelent a "Minden modell téves, de néhány hasznos"

Peter Flom

2013-04-27 15:25:10 UTC

view on stackexchange narkive permalink

Úgy gondolom, hogy a jelentését akkor lehet a legjobban elemezni, ha két részből áll:

"Minden modell téves", vagyis minden modell téves, mert ez a valóság egyszerűsítése. Néhány modell, különösen a "kemény" tudományokban, csak egy kicsit téved. Nem vesznek figyelembe olyan dolgokat, mint a súrlódás vagy az apró testek gravitációs hatása. Más modellek sokat tévednek - nagyobb dolgokat nem vesznek figyelembe. A társadalomtudományokban sokat figyelmen kívül hagyunk.

"De néhány hasznos" - a valóság egyszerűsítése nagyon hasznos lehet. Segíthetnek elmagyarázni, megjósolni és megérteni az univerzumot és annak minden különféle elemét.

Ez nem csak a statisztikákban igaz! A térképek egyfajta modellek; tévednek. De a jó térképek nagyon hasznosak. Példák vannak más hasznos, de helytelen modellekre.

+1 Mert tetszik a térképek analógiája. Használni fogom a jövőben!

@Peter Flom Még nekem is tetszett a hasonlat

Sok modell a "kemény" tudományokban is meglehetősen messze van (tegnap vettem részt egy szemináriumon, ahol olyan méréseket végeztem, ahol a modell a hibasávon belül volt, de a hibasáv két nagyságrenddel volt).

+1. Azt gondolom, hogy a legfontosabb mondatod "minden modell téves, mert ez a valóság egyszerűsítése". Az emberek gyakran elfelejtik ezt - például a közgazdaságtan naiv kritikája során (vannak saját kritikáim, de kifinomultabbaknak kell lenniük, mint csupán az, hogy "a valóság összetettebb, mint a modelled"). Ha nem egyszerűsítettük, akkor Önnek van nyers valósága, amely túl bonyolult ahhoz, hogy megértsük. Tehát egyszerűsítenünk kell, hogy bármilyen betekintést nyerjünk.

Az 1: 1 méretarányú tökéletes térkép fantáziáját sok szerző, köztük Lewis Carroll, Jorge Luis Borges és Umberto Eco is felhasználta. Valójában nem lenne haszna, mert szükségszerűen csak bonyolult lenne, mint az általa feltérképezett terület, és nem lenne könnyebb megérteni (nem beszélve a kibontás és az olvasásra való kihelyezés kínosságáról).

Valóban. A Borges-történet adta az ötletet a hasonlathoz.

Talán azt is hozzáteheti, hogy egy modellnek * kicsit tévesnek kell lennie, mert különben nem általánosítana, és így máshol nem lenne alkalmazható. Van néhány válasz, amely ezt lejjebb mondja. De ma már túl sok a válasz az összes elolvasására.

A "Minden modell téves" mindig emlékeztet Magritte _La treason des images_ (más néven: "Ez nem egy cső").

usεr11852

2013-04-27 14:06:11 UTC

view on stackexchange narkive permalink

Ez azt jelenti, hogy hasznos betekintést nyújthatnak olyan modellekből, amelyek nem tökéletesen ábrázolják az általuk modellezett jelenségeket.

A statisztikai modell a matematikai fogalmakat használó rendszer leírása. Mint ilyen, sok esetben hozzáad egy bizonyos absztrakciós réteget a következtetési eljárás megkönnyítése érdekében (pl. Mérési hibák normalitása, összetett szimmetria a korrelációs struktúrákban stb.). szinte lehetetlen, hogy egyetlen modell tökéletesen leírjon egy valós világjelenséget, mivel önmagunknak szubjektív a világképe (érzékszervünk nem tökéletes); ennek ellenére sikeres statisztikai következtetések történnek, mivel világunk bizonyos fokú következetességgel rendelkezik, amelyet kihasználunk. Tehát a szinte mindig rossz modelljeink hasznosnak bizonyulnak .

(biztos vagyok benne, hogy hamarosan nagy merész választ kap, de igyekeztem tömör ezen!)

Mondhatjuk, hogy ezek a hasznos modellek hozzávetőleges megoldásokat nyújtanak?

@gpuguy: Biztosan tudsz. John Tukey-t idézve: "A megfelelő problémára adott megközelítő válasz sokkal többet ér, mint egy hozzávetőleges problémára adott pontos válasz." (Valójában azt mondom, hogy J.T. idézete elképesztően éleslátó.)

"Sokkal jobb egy hozzávetőleges válasz a helyes kérdésre, amely gyakran homályos, mint a helytelen kérdésre adott pontos válasz, amelyet mindig pontosítani lehet." John W. Tukey 1962 Az adatelemzés jövője. Annals of Mathematical Statistics 33: 1-67 (lásd 13–14. O.) Kétségtelen, hogy máskor is hasonlót mondott, de ez a szokásos forrás.

Az enyémet lemásoltam az eredeti kiadványból.

Dimitriy V. Masterov

2013-05-23 04:30:13 UTC

view on stackexchange narkive permalink

Thad Tarpey 2009-es JSA-beszélgetését találtam hasznos magyarázatként és kommentárként a Box passzushoz. Azt állítja, hogy ha a modelleket az igazság közelítésének tekintjük, ugyanolyan könnyen nevezhetnénk az összes modellt helyesnek.

Íme az absztrakt:

A statisztika hallgatóit gyakran bemutatják George Box híres idézetére: „minden modell téves, némelyik hasznos”. Ebben a beszélgetésben azt állítom, hogy ez az idézet, bár hasznos, helytelen. Más és pozitívabb perspektíva az a tudomásul vétel, hogy a modell egyszerűen eszköz arra, hogy kivonja az adatokból az érdekes információt. Az igazság végtelenül összetett, és a modell csupán közelítése az igazsághoz. Ha a közelítés gyenge vagy félrevezető, akkor a modell haszontalan. Ebben a beszélgetésben példákat adok olyan helyes modellekre, amelyek nem igaz modellek. Ábrázolom, hogyan vezethet a „helytelen” modell fogalma rossz következtetésekhez.

Tavrock

2017-03-13 18:56:25 UTC

view on stackexchange narkive permalink

Mivel senki sem adta hozzá, George Box az idézett fázist használta a könyv következő szakaszának bevezetésére. Úgy gondolom, hogy a lehető legjobban elmagyarázza, mire gondolt:

Most nagyon figyelemre méltó lenne, ha a való világban létező bármely rendszert pontosan bármilyen egyszerű modell képviselne. A ravaszul megválasztott parsimonious modellek azonban gyakran feltűnően hasznos közelítéseket nyújtanak. Például a $ PV = RT $ törvény $ P $ , volume $ V $ és" ideális "gáz hőmérséklete $ T $ állandó A $ R $ nem igazán igaz egyetlen valódi gázra sem, de gyakran hasznos közelítést nyújt, és szerkezete ráadásul informatív, mivel a gázmolekulák viselkedésének fizikai nézőpontjából ered.

Egy ilyen modellnél nem kell feltenni az "Igaz-e a modell?" kérdést. Ha az "igazság" a "teljes igazság", akkor a válasz "Nem". Az egyetlen érdekes kérdés: "Világító és hasznos-e a modell?".

Box, G. E. P. (1979), "Robusztusság a tudományos modellépítés stratégiájában", Launer, R. L .; Wilkinson, G. N., Robustness in Statistics , Academic Press, 201–236. P.

user12719

2013-05-19 07:57:07 UTC

view on stackexchange narkive permalink

Számomra a tényleges meglátás a következő szempontban rejlik:

A modellnek nem kell helyesnek lennie ahhoz, hogy hasznos legyen.

Sajnos a sok tudományról gyakran megfeledkeznek arról, hogy a modelleknek nem feltétlenül kell a valóság pontos ábrázolásának lenniük ahhoz, hogy új felfedezéseket és előrejelzéseket tegyenek lehetővé! a változók myriade-ja. Az igazi zseni feltalál egy egyszerű modellt, amely elvégzi a munkát.

David Burton

2013-05-23 04:20:02 UTC

view on stackexchange narkive permalink

A modell nem képes 100% -ig pontos előrejelzést nyújtani, ha véletlenszerűség van az eredmények között. Ha nem volt bizonytalanság, véletlenszerűség és hiba, akkor azt ténynek, és nem modellnek tekintenék. Az első nagyon fontos, mert a modelleket gyakran használják a nem bekövetkezett események elvárásainak modellezésére. Ez szinte garantálja, hogy van némi bizonytalanság a valós eseményekkel kapcsolatban.

Tökéletes információk birtokában elméletileg lehetséges lehet olyan modell létrehozása, amely tökéletes előrejelzést ad az ilyen pontosan ismert eseményekről. E valószínűtlen körülmények ellenére azonban egy ilyen modell annyira összetett lehet, hogy számításilag nem kivitelezhető, és csak egy adott pillanatban lehet pontos, mivel más tényezők megváltoztatják az értékek változását az események során.

Mivel a bizonytalanság és a véletlenszerűség jelen van a legtöbb valós adatban, a tökéletes modell megszerzésére irányuló erőfeszítések hiábavalóak. Ehelyett értékesebb egy elég pontos modell megszerzését vizsgálni, amely elég egyszerű ahhoz, hogy mind az adatok, mind a felhasználásukhoz szükséges számítás szempontjából használható legyen. Noha ezek a modellek köztudottan tökéletlenek, ezek közül a hibák közül néhány jól ismert, és figyelembe vehető a modellek alapján történő döntéshozatalban.

Az egyszerűbb modellek tökéletlenek lehetnek, de könnyebben megindokolhatók , összehasonlítani egymással, és könnyebben lehet vele dolgozni, mert valószínűleg kevésbé lesznek számításigényesek.

Tim

2015-12-10 14:12:46 UTC

view on stackexchange narkive permalink

Ha tehetem, csak egy további megjegyzés hasznos lehet. A prase általam előnyben részesített verziója

(...) minden modell közelítő. Lényegében minden modell téves, de némelyik hasznos (...)

a Box and Draper (2007) Válaszfelületek, keverékek és gerincelemzések ből származik. (414. o., Wiley). A kibővített idézetet megnézve egyértelműbb, hogy mit jelentett a Box - a statisztikai modellezés a valóság közelítéséről szól, és a közelítés soha nem pontos, tehát a leg legmegfelelőbb közelítés megtalálásáról szól. . Ami az Ön céljának megfelel, az egy szubjektív dolog, ezért nem a modellek egyike hasznos, hanem a modellezés céljától függően némelyikük

.

bright-star

2013-04-27 15:06:35 UTC

view on stackexchange narkive permalink

Lehet, hogy így gondolja. egy objektum maximális bonyolultsága (azaz entrópiája) engedelmeskedik a Bekenstein kötött valamilyen formájának:

$$ I \ le \ frac {2 \ pi RE} {\ hbar c \ ln 2} $$

ahol $ E $ a teljes nyugalmi energia, beleértve a tömeget, és $ R $ az objektumot körülvevő gömb sugara.

Ez nagy szám, a legtöbb esetben:

Az átlagos emberi agyhoz kötött Bekenstein 2,58991 USD · 10 ^ {42} $ bit lenne, és az információk felső határát jelentené szükséges az átlagos emberi agy tökéletes újrateremtéséhez a kvantumszintig. Ez azt jelenti, hogy az emberi agy (és az elme, ha a fizikalizmus igaz) különféle állapotainak ($ Ω = 2 ^ I $) száma legfeljebb 107,79640 $ 10 ^ {41} $.

Tehát a "legjobb térképet" akarja használni, azaz magát a területet, minden hullámegyenlettel minden sejt összes részecskéjére? Egyáltalán nem. Nem csak számítási katasztrófa lenne, hanem olyan dolgokat is modellezne, amelyeknek alapvetően semmi közük lehet ahhoz, ami érdekli. Ha csak annyit akar tenni, hogy mondjuk azonosítja, hogy ébren vagyok-e vagy sem, akkor nem kell tudnia, hogy a # 32458 elektron mit csinál a 2. neuron # 844030 riboszóma # 2305 molekula. Ha nem ezt modellezi, akkor a modellje valóban "téves", de ha azonosítani tudja, hogy ébren vagyok-e vagy sem, akkor a modellje mindenképpen hasznos.

Thomas Speidel

2013-05-22 01:33:13 UTC

view on stackexchange narkive permalink

Azt hiszem, Peter és a user11852 nagyszerű válaszokat adott. Azt is hozzátenném (tagadással), hogy ha egy modell nagyon jó lenne, akkor valószínűleg a felesleges felszerelés miatt haszontalan lenne (ezért nem általánosítható).

+1 a túlillesztés pontjához. Az olyan algoritmusok, mint a Naiv Bayes és a lineáris diszkrimináns elemzés, gyakran nagyon jól működnek, még akkor is, ha tudod, hogy az alapul szolgáló modell helytelen (pl. Spamszűrés), egyszerűen azért, mert kevesebb adatra van szükség a paraméterek becsléséhez.

H2SO4

2013-04-27 15:19:21 UTC

view on stackexchange narkive permalink

Saját értelmezésem a következő: Ha azt gondolnám, hogy egy matematikai modell pontosan leírja az összes tényezőt és kölcsönhatásukat, akkor az érdekes jelenséget túl egyszerű és arrogáns lenne. Azt sem tudjuk, hogy az általunk használt logika elegendő-e univerzumunk megértéséhez. Néhány matematikai modell azonban elég jó közelítést jelent (a tudományos módszer szempontjából), amely hasznos következtetések levonására az ilyen jelenségről.

Eric Feigelson

2013-05-25 23:24:13 UTC

view on stackexchange narkive permalink

Asztrosztatikusként (talán ritka fajta) sajnálatosnak tartom Box dictumjának hírnevét. A fizikai tudományokban gyakran nagy a konszenzusunk a megfigyelt jelenség hátterében álló folyamatok megértésében, és ezeket a folyamatokat gyakran kifejezhetik a gravitáció, a kvantummechanika, a termodinamika stb. Törvényeiből fakadó matematikai modellek. A statisztikai célok a becslés a legjobban illeszkedő modell paramétereinek fizikai tulajdonságai, valamint a modell kiválasztása és validálása. Drámai közelmúltbeli eset merült fel az Európai Űrügynökség Planck műholdja kozmikus mikrohullámú háttér-méréseinek 2013 márciusi kiadásának eredményeként, amely meggyőzően létrehoz egy egyszerű, 6 paraméteres „LambdaCDM” modellt az ősrobbanáshoz. . Kétlem, hogy Box diktuma bárhol alkalmazható lenne a fejlett statisztikai módszerek széles skálájában, amelyet ebben a 29 cikkben használnak

Srinath

2014-05-29 23:44:38 UTC

view on stackexchange narkive permalink

Most fogalmaztam át a fenti választ azzal, hogy a folyamatmodelleket fókuszpontnak tekintem. Az állítás a következőképpen értelmezhető:

"Minden modell téves", vagyis minden modell téves, mert ez a valóság egyszerűsítése. Néhány modell csak egy kicsit téved. Nem vesznek figyelembe néhány dolgot, például: -> a követelmények megváltoztatása, -> a projekt határidőn belüli befejezésének figyelmen kívül hagyása, -> nem veszik figyelembe az ügyfél kívánt minőségi szintjét, stb ... Más modellek nagyon rosszak - figyelmen kívül hagyják nagyobb dolgok. A klasszikus szoftveres folyamatmodellek sokat figyelmen kívül hagynak az agilis folyamatmodellekkel szemben, amelyek kevésbé vesznek figyelembe.

"De némelyik hasznos" - a valóság egyszerűsítése nagyon hasznos lehet. Segíthetnek elmagyarázni, megjósolni és megérteni a teljes projektet és annak minden összetevõjét. A modelleket azért használják, mert jellemzőik megfelelnek a legtöbb szoftverfejlesztő programnak.

ziggystar

2014-05-05 13:34:22 UTC

view on stackexchange narkive permalink

Szeretnék még egy értelmezést adni a "hasznos" kifejezésről. Valószínűleg nem arra gondolt, amire Box gondolt.

Amikor döntéseket kell hoznia, és erre végül felhasználják az összes információt, akkor valamilyen formában meg kell mérnie a sikerét. Ha bizonytalan információkkal rendelkező döntésekről beszélünk, ezt az intézkedést gyakran hasznosságnak hívják. hogy célkitűzéseinket hatékonyabban érjük el.

Ez egy újabb dimenzióval bővíti a szokásos kritériumokat, például egy modell képességét arra, hogy valamit helyesen előre jelezzen: Ez lehetővé teszi számunkra, hogy mérlegeljük a modell különböző aspektusait egyéb.

Jan

2016-11-15 20:40:40 UTC

view on stackexchange narkive permalink

"Minden modell hibás, de néhány hasznos".Talán ez azt jelenti: A lehető legjobban kellene tennünk a tudásunkkal + új tanulás után kutatnunk?

(-1) Tudna-e bármilyen utalást arra utalni, hogy a G.E.P.Box ezt jelentette?Amint a többi válaszból kiderül, valami egészen mást értett.

Az OP talán átveszi az idézetet, és új értelmezést ad neki.Egyetértek Timmel, hogy Box többé-kevésbé azt mondta, hogy ne vegye a modellt a valóság pontos értelmezésének, de elismerem, hogy néhány modell jól leírhatja az adatokat.