Mit jelentenek, ha "véletlen változót" mondanak?
Mit jelentenek, ha "véletlen változót" mondanak?
In thinking over a recent comment, I notice that all replies so far suffer from the use of undefined terms like "variable" and vague terms like "unknown," or appeal to technical mathematical concepts like "function" and "probability space." What should we say to the non-mathematical person who would like a plain, intuitive, yet accurate definition of "random variable"? After some preliminaries describing a simple model of random phenomena, I provide such a definition that is short enough to fit on one line. Because it might not fully satisfy the cognoscenti, an afterward explains how to extend this to the usual technical definition.
One way to approach the idea behind a random variable is to appeal to the tickets-in-a-box model of randomness. This model replaces an experiment or observation by a box full of tickets. On each ticket is written a possible outcome of the experiment. (An outcome can be as simple as "heads" or "tails" but in practice it is a more complex thing, such as a history of stock prices, a complete record of a long experiment, or the sequence of all words in a document.) All possible outcomes appear at least once among the tickets; some outcomes may appear on many tickets.
Instead of actually conducting the experiment, we imagine thoroughly--but blindly--mixing all the tickets and selecting just one. If we can show that the real experiment should behave as if it were conducted in this way, then we have reduced a potentially complicated (and expensive, and lengthy) real-world experiment to a simple, intuitive, thought experiment (or "statistical model"). The clarity and simplicity afforded by this model makes it possible to analyze the experiment.
Standard examples concern outcomes of tossing coins and dice and drawing playing cards. These are somewhat distracting for their triviality, so to illustrate, suppose we are concerned about the outcome of the US presidential election in 2016. As a (tiny) simplification, I will assume that one of the two major parties--Republican (R) or Democratic (D)--will win. Because (with the information presently available) the outcome is uncertain, we imagine putting tickets into a box: some with "R" written on them and others with "D". Our model of the outcome is to draw exactly one ticket from this box.
There is something missing: we haven't yet stipulated how many tickets there will be for each outcome. In fact, finding this out is the principal problem of statistics: based on observations (and theory), what can be said about the relative proportions of each outcome in the box?
(I hope it's clear that the proportions of each kind of ticket in the box determine its properties, rather than the actual numbers of each ticket. The proportions are defined--as usual--to be the count of each kind of ticket divided by the total number of tickets. For instance, a box with one "D" ticket and one "R" ticket behaves exactly like a box with a million "D" tickets and a million "R" tickets, because in either case each type is 50% of all the tickets and therefore each has a 50% chance of being drawn when the tickets are thoroughly mixed.)
But let's not pursue this question here, because we are near our goal of defining a random variable. The problem with the model so far is that it is not quantifiable, whereas we would like to be able to answer quantitative questions with it. And I don't mean trivial ones, either, but real, practical questions such as "if my company has a billion Euros invested in US offshore fossil fuel development, how much will the value of this investment change as a result of the 2016 election?" In this case the model is so simple that there's not much we can do to get a realistic answer to this question, but we could go so far as to consult our economic staff and ask for their opinions about the two possible outcomes:
If the Democrats win, how much will the investment change? (Suppose the answer is $d$ dollars.)
If the Republicans win, how much will it change? (Suppose the answer is $r$ dollars.)
The answers are numbers. To use them in the model, I will ask my staff to go through all the tickets in the box and on every "D" ticket to write "$d$ dollars" and on every "R" ticket to write "$r$ dollars." Now we can model the uncertainty in the investment clearly and quantitatively: its post-election change in value is the same as receiving the amount of money written on a single ticket drawn randomly from this box.
This model helps us answer additional questions about the investment. For instance, how uncertain should we be about the investment's value? Although there are (simple) mathematical formulas for this uncertainty, we could reproduce their answers reasonably accurately just by using our model repeatedly--maybe a thousand times over--to see what kinds of outcomes actually occur and measuring their spread. A tickets-in-a-box model gives us a way to reason quantitatively about uncertain outcomes.
To obtain quantitative answers about uncertain or variable phenomena, we can adopt a ticket-in-a-box model and write numbers on the tickets. This process of writing numbers has to follow only a single rule: it must be consistent. In the example, every Democratic ticket has to have "$d$ dollars" written on it--no exceptions--and every Republican ticket has to have "$r$ dollars" written on it.
A random variable is any consistent way to write numbers on tickets in a box.
(The mathematical notation for this is to give a name to the renumbering process, typically with a capital latin letter like $X$ or $Y$. The identifying information written on the tickets is often named with little letters, typically $\omega$ (lower case Greek "omega"). The value associated by means of the random variable $X$ to the ticket $\omega$ is denoted $X(\omega)$. In the example, then, we might say somethign like "$X$ is a random variable representing the change in the investment's value." It would be fully specified by stating $X(\text{D})=d$ and $X(\text{R}) = r$. In more complicated cases, the values of $X$ are given by more complicated descriptions and, often, by formulas. For instance, the tickets might represent a year's worth of closing prices of a stock and the random variable $X$ might be the value at a particular time of some derivative on that stock, such as a put option. The option contract describes how $X$ is computed. Options traders use exactly this kind of model to price their products.)
Did you notice that such an $X$ is neither random nor a variable? Neither is it "uncertain" or "unknown." It is a definite assignment (of numbers to outcomes), something we can write down with full knowledge and complete certainty. What is random is the process of drawing a ticket from the box; what is variable is the value on the ticket that might be drawn.
Notice, too, the clean separation of two different issues involved in evaluating the investment: I asked my economists to determine $X$ for me, but not to opine about the election outcome. I will use other information (perhaps by calling in political consultants, astrologers, using a Ouija board, or whatever) to estimate the proportions of each of the "D" and "R" tickets to put in the box.
When the definition of random variable is accompanied with the caveat "measurable," what the definer has in mind is a generalization of the tickets-in-a-box model to situations with infinitely many possible outcomes. (Technically, it is needed only with uncountably infinite outcomes or where irrational probabilities are involved, and even in the latter case can be avoided.) With infinitely many outcomes it is difficult to say what the proportion of the total would be. If there are infinitely many "D" tickets and infinitely many "R" tickets, what are their relative proportions? We can't find out with a mere division of one infinity by another!
In these cases, we need a different way to specify the proportions. A "measurable" set of tickets is any collection of tickets in the box for which their proportion can be defined. When this is done, the number we have been thinking of as a "proportion" is called the "probability." (Not every collection of tickets need have a probability associated with it.)
In addition to satisfying the consistency requirement, a random variable $X$ has to allow us to compute probabilities that are associated with natural questions about the outcomes. Specifically, we want assurance that questions of the form "what is the chance that the value $X(\omega)$ will lie between such-and-such ($a$) and such-and-such ($b$)?" will actually have mathematically well-defined answers, no matter what two values we give for the limits $a$ and $b$. Such rewriting procedures are said to be "measurable." All random variables must be measurable, by definition.
A véletlenszerű változó olyan változó, amelynek értéke ismeretlen eseményektől függ. Összefoglalhatjuk az ismeretlen eseményeket "állapot" -ként, majd a véletlen változó az állapot függvénye.
Példa:
Tegyük fel, hogy három dobókockánk van ($ D_ {1 } $, $ D_ {2} $, $ D_ {3} $). Ezután a $ S = (D_ {1}, D_ {2}, D_ {3}) $ állapotot.
$$ X = (D_ {1} = 5?) + (D_ {2} = 5?) + (D_ {3} = 5?) $$
$$ Y = D_ {1} + D_ {2} + D_ {3} $$
Informálisan a véletlen változó segítségével minden lehetséges eredményhez numerikus kódot rendelhetünk. *
Megfordítok egy érmét. A lehetséges eredmények halmaza (más néven "mintaterület") $ \ {H, T \} $ néven írható.
A véletlenszerű $ X $ változóra példa lehet $ X (H) = 1 $ és $ X (T) = 0 $. Vagyis a fejek $ 1 $, a farok pedig $ 0 $ kódolásúak.
Kártyát szokásos 52 kártyás pakliból húzok. A lehetséges eredmények halmaza: $$ \ {A ♠, K ♠, \ dots, 2 ♠, A ♡, K ♡, \ dots, 2 ♡, A ♢, K ♢, \ dots, 2 ♢, A ♣, K ♣, \ pontok, 2 ♣ \}. $$
A hídban egy ász 4 magas kártyapontot ér, egy king 3, egy queen 2 és egy jack 1 értéket. Bármely más kártya 0 pont.
Tehát hagyhatjuk, hogy $ Y $ legyen a megfelelő véletlen változó, ahol például $ Y \ left (A ♡ \ right) = 4 $, $ Y \ left (J ♣ \ right) = 1 $, és $ Y \ bal (7 ♠ \ jobb) = 0 $.
Mi a véletlenszerű változók értelme? Az egyik egyszerű válasz az, hogy az olyan elvont szimbólumokat, mint a "$ H $", a "$ T $" vagy a "$ A ♠ $", időnként nehéz és problémás kezelni. Tehát ehelyett számokká fordítjuk őket, amelyeket könnyebb kezelni.
$$$$
* Formálisan egy véletlen változó egy olyan függvény, amely minden eredményt feltérképez (a mintaterületen). valós számra.
A szokásos változóval ellentétben a véletlenszerű változó nem helyettesíthető egyetlen, változatlan értékkel. Inkább meg lehet adni a statisztikai tulajdonságokat , például a véletlen változó eloszlását . Az eloszlás egy olyan függvény, amely megadja annak valószínűségét, hogy a változó eléri az adott értéket, vagy egy bizonyos paraméterek, például az átlag vagy a szórás tartományába esik.
A véletlenszerű változókat diszkrét ha az eloszlás egy megszámlálható halmaz értékeit írja le, például az egész számokat. A véletlen változó másik osztályozása folyamatos , és akkor használatos, ha az eloszlás egy megszámlálhatatlan halmaz értékeit fedi le, például a valós számokat.
Nekem ezt a történetet mondták el:
Egy véletlen változó összehasonlítható a szent római birodalommal: Az A Szent Római Birodalom nem volt szent, nem római és nem is volt birodalom.
Ugyanígy a Véletlen Változó sem véletlen, sem változó.Ez csak egy függvény.(a történetet itt mesélték el: forrás).
Ez legalább furcsa mód a magyarázatra, ami segíthet az embereknek emlékezni!
A véletlen változó, amelyet általában X-nek jelölnek, olyan változó, ahol az eredmény bizonytalan. E változó egy adott eredményének megfigyelését realizációnak nevezzük. Konkrétabban: ez egy olyan funkció, amely egy valószínűségi teret térképez fel egy mérhető térbe, amelyet általában állapottérnek neveznek. A véletlenszerű változók diszkrétek (számos különálló értéket vehetnek fel) vagy folytonosak (végtelen sok értéket vehetnek fel).
Tekintsük az X véletlen változót, amely a két kocka dobásakor kapott teljes összeg. Bármelyik értéke 2-12 lehet (azonos valószínűséggel adva a tisztességes kockát), és az eredmény bizonytalan, amíg a kockát nem dobják.
A Wikipédiából:
A matematikában (különösen a valószínűségelméletben és a statisztikában) egy véletlen változó (vagy sztochasztikus változó) (általában) egy mérhető függvény, amely egy valószínűségi teret térképez fel egy mérhető térbe. Az esemény összes lehetséges kimenetelét a valós számokba feltérképező véletlenszerű változókat gyakran elemzik az elemi statisztikákban, és a tudományokban arra használják, hogy tudományos kísérletekből származó adatok alapján jósolják meg. A tudományos alkalmazások mellett véletlenszerű változókat fejlesztettek ki a szerencsejátékok és a sztochasztikus események elemzésére. A véletlenszerű változók hasznossága abból adódik, hogy csak a valószínűségi kérdések megválaszolásához szükséges matematikai tulajdonságokat képesek megragadni.
A véletlen változó olyan függvény, amely egyedi feltételekkel egyedi numerikus értékeket rendel a véletlenszerű kísérlet összes lehetséges eredményéhez. A véletlenszerű változó nem változó, sokkal inkább egy olyan függvény, amely az eseményeket számokhoz rendeli.
A nem matematikai egyetemi tanulmányaim során azt mondták nekünk, hogy a véletlen változó egy olyan térkép, amely az értékekből a valószínűségekig terjed. Ez lehetővé tette a valószínűségeloszlások megrajzolását
Nemrégiben rájöttem, mennyiben különbözik attól, amit a matematikusok gondolnak. Kiderült, hogy a véletlen változó alatt egy egyszerű X: Ω → R függvényt értenek, amely a mintaterület Ω elemét veszi ( más néven eredmény, jegy vagy egyén, ahogy fentebb kifejtettük), és lefordítja valós R szám a tartományban (-∞, ∞). Vagyis fent találóan megjegyezték, hogy nem véletlenszerű és egyáltalán nem változó. A véletlenszerűség általában a P valószínűségmérővel jár, a mérőtér részeként (Ω, P). P a véletlen változóhoz hasonlóan hozzárendeli a mintákat R-hez, de ez az időtartomány [0,1] -re korlátozódik, és azt mondhatjuk, hogy a véletlen változó (Ω, P) -et (R, P) alakít át, így egy véletlen változó valószínűséggel van felszerelve mérték P: R -> [0,1], hogy minden R-ben szereplő x-re megmondhasd annak valószínűségét.
Nem tudom, miért van szükséged ilyen típusú véletlen változókra és miért nem lehet először mintázni az R elemeit, de úgy tűnik, hogy a minták számértékekre való átszámítása lehetővé teszi számunkra a minták rendezését, az eloszlás megrajzolását és az elvárás kiszámítását. Ezt az ötletet kaptam: A méréselmélet bemutatója (mérési elmélet a bábuknak). Lehetséges, hogy a matematikusok jobban szem előtt tartják a véletlenszerű változó alkalmazását, de nem találom őket felesleges tanulmányomban. Ugyanez a szöveg azt sugallja, hogy nem kell mindig a mintákat számokká konvertálni, különösen a $ \ Omega $ ábécé entrópiájának kiszámításához
$$ H (\ Omega) = \ sum {P (\ Omega_i) ln (\ Omega_i)} $$
integrálnak nincs szüksége valós értékekre a véletlen változóból.