"Lényegében minden modell téves, de néhány hasznos."
--- Box, George E. P .; Norman R. Draper (1987). Empirikus modellépítő és válaszfelületek, p. 424, Wiley. ISBN 0471810339.
Pontosan mit jelent a fenti kifejezés?
"Lényegében minden modell téves, de néhány hasznos."
--- Box, George E. P .; Norman R. Draper (1987). Empirikus modellépítő és válaszfelületek, p. 424, Wiley. ISBN 0471810339.
Pontosan mit jelent a fenti kifejezés?
Úgy gondolom, hogy a jelentését akkor lehet a legjobban elemezni, ha két részből áll:
"Minden modell téves", vagyis minden modell téves, mert ez a valóság egyszerűsítése. Néhány modell, különösen a "kemény" tudományokban, csak egy kicsit téved. Nem vesznek figyelembe olyan dolgokat, mint a súrlódás vagy az apró testek gravitációs hatása. Más modellek sokat tévednek - nagyobb dolgokat nem vesznek figyelembe. A társadalomtudományokban sokat figyelmen kívül hagyunk.
"De néhány hasznos" - a valóság egyszerűsítése nagyon hasznos lehet. Segíthetnek elmagyarázni, megjósolni és megérteni az univerzumot és annak minden különféle elemét.
Ez nem csak a statisztikákban igaz! A térképek egyfajta modellek; tévednek. De a jó térképek nagyon hasznosak. Példák vannak más hasznos, de helytelen modellekre.
Ez azt jelenti, hogy hasznos betekintést nyújthatnak olyan modellekből, amelyek nem tökéletesen ábrázolják az általuk modellezett jelenségeket.
A statisztikai modell a matematikai fogalmakat használó rendszer leírása. Mint ilyen, sok esetben hozzáad egy bizonyos absztrakciós réteget a következtetési eljárás megkönnyítése érdekében (pl. Mérési hibák normalitása, összetett szimmetria a korrelációs struktúrákban stb.). szinte lehetetlen, hogy egyetlen modell tökéletesen leírjon egy valós világjelenséget, mivel önmagunknak szubjektív a világképe (érzékszervünk nem tökéletes); ennek ellenére sikeres statisztikai következtetések történnek, mivel világunk bizonyos fokú következetességgel rendelkezik, amelyet kihasználunk. Tehát a szinte mindig rossz modelljeink hasznosnak bizonyulnak .
(biztos vagyok benne, hogy hamarosan nagy merész választ kap, de igyekeztem tömör ezen!)
Thad Tarpey 2009-es JSA-beszélgetését találtam hasznos magyarázatként és kommentárként a Box passzushoz. Azt állítja, hogy ha a modelleket az igazság közelítésének tekintjük, ugyanolyan könnyen nevezhetnénk az összes modellt helyesnek.
Íme az absztrakt:
A statisztika hallgatóit gyakran bemutatják George Box híres idézetére: „minden modell téves, némelyik hasznos”. Ebben a beszélgetésben azt állítom, hogy ez az idézet, bár hasznos, helytelen. Más és pozitívabb perspektíva az a tudomásul vétel, hogy a modell egyszerűen eszköz arra, hogy kivonja az adatokból az érdekes információt. Az igazság végtelenül összetett, és a modell csupán közelítése az igazsághoz. Ha a közelítés gyenge vagy félrevezető, akkor a modell haszontalan. Ebben a beszélgetésben példákat adok olyan helyes modellekre, amelyek nem igaz modellek. Ábrázolom, hogyan vezethet a „helytelen” modell fogalma rossz következtetésekhez.
Mivel senki sem adta hozzá, George Box az idézett fázist használta a könyv következő szakaszának bevezetésére. Úgy gondolom, hogy a lehető legjobban elmagyarázza, mire gondolt:
Most nagyon figyelemre méltó lenne, ha a való világban létező bármely rendszert pontosan bármilyen egyszerű modell képviselne. A ravaszul megválasztott parsimonious modellek azonban gyakran feltűnően hasznos közelítéseket nyújtanak. Például a $ PV = RT $ törvény $ P $ , volume $ V $ és" ideális "gáz hőmérséklete $ T $ állandó A $ R $ nem igazán igaz egyetlen valódi gázra sem, de gyakran hasznos közelítést nyújt, és szerkezete ráadásul informatív, mivel a gázmolekulák viselkedésének fizikai nézőpontjából ered.
Egy ilyen modellnél nem kell feltenni az "Igaz-e a modell?" kérdést. Ha az "igazság" a "teljes igazság", akkor a válasz "Nem". Az egyetlen érdekes kérdés: "Világító és hasznos-e a modell?".
Box, G. E. P. (1979), "Robusztusság a tudományos modellépítés stratégiájában", Launer, R. L .; Wilkinson, G. N., Robustness in Statistics , Academic Press, 201–236. P.
Számomra a tényleges meglátás a következő szempontban rejlik:
A modellnek nem kell helyesnek lennie ahhoz, hogy hasznos legyen.
Sajnos a sok tudományról gyakran megfeledkeznek arról, hogy a modelleknek nem feltétlenül kell a valóság pontos ábrázolásának lenniük ahhoz, hogy új felfedezéseket és előrejelzéseket tegyenek lehetővé! a változók myriade-ja. Az igazi zseni feltalál egy egyszerű modellt, amely elvégzi a munkát.
A modell nem képes 100% -ig pontos előrejelzést nyújtani, ha véletlenszerűség van az eredmények között. Ha nem volt bizonytalanság, véletlenszerűség és hiba, akkor azt ténynek, és nem modellnek tekintenék. Az első nagyon fontos, mert a modelleket gyakran használják a nem bekövetkezett események elvárásainak modellezésére. Ez szinte garantálja, hogy van némi bizonytalanság a valós eseményekkel kapcsolatban.
Tökéletes információk birtokában elméletileg lehetséges lehet olyan modell létrehozása, amely tökéletes előrejelzést ad az ilyen pontosan ismert eseményekről. E valószínűtlen körülmények ellenére azonban egy ilyen modell annyira összetett lehet, hogy számításilag nem kivitelezhető, és csak egy adott pillanatban lehet pontos, mivel más tényezők megváltoztatják az értékek változását az események során.
Mivel a bizonytalanság és a véletlenszerűség jelen van a legtöbb valós adatban, a tökéletes modell megszerzésére irányuló erőfeszítések hiábavalóak. Ehelyett értékesebb egy elég pontos modell megszerzését vizsgálni, amely elég egyszerű ahhoz, hogy mind az adatok, mind a felhasználásukhoz szükséges számítás szempontjából használható legyen. Noha ezek a modellek köztudottan tökéletlenek, ezek közül a hibák közül néhány jól ismert, és figyelembe vehető a modellek alapján történő döntéshozatalban.
Az egyszerűbb modellek tökéletlenek lehetnek, de könnyebben megindokolhatók , összehasonlítani egymással, és könnyebben lehet vele dolgozni, mert valószínűleg kevésbé lesznek számításigényesek.
Ha tehetem, csak egy további megjegyzés hasznos lehet. A prase általam előnyben részesített verziója
(...) minden modell közelítő. Lényegében minden modell téves, de némelyik hasznos (...)
a Box and Draper (2007) Válaszfelületek, keverékek és gerincelemzések ből származik. (414. o., Wiley). A kibővített idézetet megnézve egyértelműbb, hogy mit jelentett a Box - a statisztikai modellezés a valóság közelítéséről szól, és a közelítés soha nem pontos, tehát a leg legmegfelelőbb közelítés megtalálásáról szól. . Ami az Ön céljának megfelel, az egy szubjektív dolog, ezért nem a modellek egyike hasznos, hanem a modellezés céljától függően némelyikük
.Lehet, hogy így gondolja. egy objektum maximális bonyolultsága (azaz entrópiája) engedelmeskedik a Bekenstein kötött valamilyen formájának:
$$ I \ le \ frac {2 \ pi RE} {\ hbar c \ ln 2} $$
ahol $ E $ a teljes nyugalmi energia, beleértve a tömeget, és $ R $ az objektumot körülvevő gömb sugara.
Ez nagy szám, a legtöbb esetben:
Az átlagos emberi agyhoz kötött Bekenstein 2,58991 USD · 10 ^ {42} $ bit lenne, és az információk felső határát jelentené szükséges az átlagos emberi agy tökéletes újrateremtéséhez a kvantumszintig. Ez azt jelenti, hogy az emberi agy (és az elme, ha a fizikalizmus igaz) különféle állapotainak ($ Ω = 2 ^ I $) száma legfeljebb 107,79640 $ 10 ^ {41} $.
Tehát a "legjobb térképet" akarja használni, azaz magát a területet, minden hullámegyenlettel minden sejt összes részecskéjére? Egyáltalán nem. Nem csak számítási katasztrófa lenne, hanem olyan dolgokat is modellezne, amelyeknek alapvetően semmi közük lehet ahhoz, ami érdekli. Ha csak annyit akar tenni, hogy mondjuk azonosítja, hogy ébren vagyok-e vagy sem, akkor nem kell tudnia, hogy a # 32458 elektron mit csinál a 2. neuron # 844030 riboszóma # 2305 molekula. Ha nem ezt modellezi, akkor a modellje valóban "téves", de ha azonosítani tudja, hogy ébren vagyok-e vagy sem, akkor a modellje mindenképpen hasznos.
Azt hiszem, Peter és a user11852 nagyszerű válaszokat adott. Azt is hozzátenném (tagadással), hogy ha egy modell nagyon jó lenne, akkor valószínűleg a felesleges felszerelés miatt haszontalan lenne (ezért nem általánosítható).
Saját értelmezésem a következő: Ha azt gondolnám, hogy egy matematikai modell pontosan leírja az összes tényezőt és kölcsönhatásukat, akkor az érdekes jelenséget túl egyszerű és arrogáns lenne. Azt sem tudjuk, hogy az általunk használt logika elegendő-e univerzumunk megértéséhez. Néhány matematikai modell azonban elég jó közelítést jelent (a tudományos módszer szempontjából), amely hasznos következtetések levonására az ilyen jelenségről.
Asztrosztatikusként (talán ritka fajta) sajnálatosnak tartom Box dictumjának hírnevét. A fizikai tudományokban gyakran nagy a konszenzusunk a megfigyelt jelenség hátterében álló folyamatok megértésében, és ezeket a folyamatokat gyakran kifejezhetik a gravitáció, a kvantummechanika, a termodinamika stb. Törvényeiből fakadó matematikai modellek. A statisztikai célok a becslés a legjobban illeszkedő modell paramétereinek fizikai tulajdonságai, valamint a modell kiválasztása és validálása. Drámai közelmúltbeli eset merült fel az Európai Űrügynökség Planck műholdja kozmikus mikrohullámú háttér-méréseinek 2013 márciusi kiadásának eredményeként, amely meggyőzően létrehoz egy egyszerű, 6 paraméteres „LambdaCDM” modellt az ősrobbanáshoz. . Kétlem, hogy Box diktuma bárhol alkalmazható lenne a fejlett statisztikai módszerek széles skálájában, amelyet ebben a 29 cikkben használnak
Most fogalmaztam át a fenti választ azzal, hogy a folyamatmodelleket fókuszpontnak tekintem. Az állítás a következőképpen értelmezhető:
"Minden modell téves", vagyis minden modell téves, mert ez a valóság egyszerűsítése. Néhány modell csak egy kicsit téved. Nem vesznek figyelembe néhány dolgot, például: -> a követelmények megváltoztatása, -> a projekt határidőn belüli befejezésének figyelmen kívül hagyása, -> nem veszik figyelembe az ügyfél kívánt minőségi szintjét, stb ... Más modellek nagyon rosszak - figyelmen kívül hagyják nagyobb dolgok. A klasszikus szoftveres folyamatmodellek sokat figyelmen kívül hagynak az agilis folyamatmodellekkel szemben, amelyek kevésbé vesznek figyelembe.
"De némelyik hasznos" - a valóság egyszerűsítése nagyon hasznos lehet. Segíthetnek elmagyarázni, megjósolni és megérteni a teljes projektet és annak minden összetevõjét. A modelleket azért használják, mert jellemzőik megfelelnek a legtöbb szoftverfejlesztő programnak.
Szeretnék még egy értelmezést adni a "hasznos" kifejezésről. Valószínűleg nem arra gondolt, amire Box gondolt.
Amikor döntéseket kell hoznia, és erre végül felhasználják az összes információt, akkor valamilyen formában meg kell mérnie a sikerét. Ha bizonytalan információkkal rendelkező döntésekről beszélünk, ezt az intézkedést gyakran hasznosságnak hívják. hogy célkitűzéseinket hatékonyabban érjük el.
Ez egy újabb dimenzióval bővíti a szokásos kritériumokat, például egy modell képességét arra, hogy valamit helyesen előre jelezzen: Ez lehetővé teszi számunkra, hogy mérlegeljük a modell különböző aspektusait egyéb.
"Minden modell hibás, de néhány hasznos".Talán ez azt jelenti: A lehető legjobban kellene tennünk a tudásunkkal + új tanulás után kutatnunk?