Meg kell határoznom a KL-divergenciát két Gauss között. Összehasonlítom az eredményeket ezekkel, de nem tudom reprodukálni az eredményeiket. Az eredményem nyilvánvalóan téves, mert a KL nem 0 a KL-re (p, p).
Kíváncsi vagyok, hol követek el hibát, és megkérdezem, észreveszi-e valaki.
Legyen $ p (x) = N (\ mu_1, \ sigma_1) $ és $ q (x) = N (\ mu_2, \ sigma_2) $ . A Bishop's PRML-ből tudom, hogy
$$ KL (p, q) = - \ int p (x) \ log q (x) dx + \ int p (x) \ log p (x) dx $$
ahol az integráció minden valós vonalon megtörténik, és ez
$$ \ int p (x) \ log p (x) dx = - \ frac {1} {2} (1 + \ log 2 \ pi \ sigma_1 ^ 2), $$
ezért csak $ \ int p (x) \ log q (x) dx $ -ra korlátozom magam, amit kiírhatok
$$ - \ int p (x) \ log \ frac {1} {(2 \ pi \ sigma_2 ^ 2) ^ {(1/2)}} e ^ { - \ frac {(x- \ mu_2) ^ 2} {2 \ sigma_2 ^ 2}} dx, $$
amelyek szétválaszthatók
$$ \ frac {1} {2} \ log (2 \ pi \ sigma_2 ^ 2) - \ int p (x) \ log e ^ {- \ frac {(x- \ mu_2 ) ^ 2} {2 \ sigma_2 ^ 2}} dx. $$
A naplót kapom
$ $ \ frac {1} {2} \ log (2 \ pi \ sigma_2 ^ 2) - \ int p (x) \ bigg (- \ frac {(x- \ mu_2) ^ 2} {2 \ sigma_2 ^ 2} \ bigg) dx, $$
ahol elválasztom az összegeket, és kapok $ \ sigma_2 ^ 2 $ s pan> ki az integrálból.
$$ \ frac {1} {2} \ log (2 \ pi \ sigma ^ 2_2) + \ frac {\ int p (x) x ^ 2 dx - \ int p (x) 2x \ mu_2 dx + \ int p (x) \ mu_2 ^ 2 dx} {2 \ sigma_2 ^ 2} $$
Ha a $ \ langle \ rangle $ jelöli a várakozás operátort a $ p $ alatt, át tudom írni ez
$$ \ frac {1} {2} \ log (2 \ pi \ sigma_2 ^ 2) + \ frac {\ langle x ^ 2 \ rangle - 2 \ langle x \ rangle \ mu_2 + \ mu_2 ^ 2} {2 \ sigma_2 ^ 2}. $$
Tudjuk, hogy a $ var (x) = \ langle x ^ 2 \ rangle - \ langle x \ rangle ^ 2 $ . Így
$$ \ langle x ^ 2 \ rangle = \ sigma_1 ^ 2 + \ mu_1 ^ 2 $$
és ezért
$$ \ frac {1} {2} \ log (2 \ pi \ sigma ^ 2) + \ frac {\ sigma_1 ^ 2 + \ mu_1 ^ 2 - 2 \ mu_1 \ mu_2 + \ mu_2 ^ 2} {2 \ sigma_2 ^ 2}, $$
amit feltehetek
$$ \ frac {1} {2} \ log (2 \ pi \ sigma_2 ^ 2) + \ frac {\ sigma_1 ^ 2 + (\ mu_1 - \ mu_2) ^ 2} {2 \ sigma_2 ^ 2}. $$
Ha mindent összerakok, eljutok a
\ begin {align *} KL oldalra (p, q) & = - \ int p (x) \ log q (x) dx + \ int p (x) \ log p (x) dx \\\\ & = \ frac {1} {2} \ log (2 \ pi \ sigma_2 ^ 2) + \ frac {\ sigma_1 ^ 2 + (\ mu_1 - \ mu_2) ^ 2} {2 \ sigma_2 ^ 2} - \ frac {1} {2} (1 + \ log 2 \ pi \ sigma_1 ^ 2) \\\\ & = \ log \ frac {\ sigma_2} {\ sigma_1} + \ frac {\ sigma_1 ^ 2 + (\ mu_1 - \ mu_2) ^ 2} {2 \ sigma_2 ^ 2}. \ End {align *} Ami hibás, mivel két azonos Gaussian esetében $ 1 $ értékkel rendelkezik. az én hibám?
Frissítés
Köszönet az mpiktasnak, hogy tisztázta a dolgokat. A helyes válasz:
$ KL (p, q) = \ log \ frac {\ sigma_2} {\ sigma_1} + \ frac {\ sigma_1 ^ 2 + (\ mu_1 - \ mu_2) ^ 2} {2 \ sigma_2 ^ 2} - \ frac {1} {2} $