KL divergencia két egyváltozós Gauss között

bayerj

2011-02-21 16:30:19 UTC

view on stackexchange narkive permalink

Meg kell határoznom a KL-divergenciát két Gauss között. Összehasonlítom az eredményeket ezekkel, de nem tudom reprodukálni az eredményeiket. Az eredményem nyilvánvalóan téves, mert a KL nem 0 a KL-re (p, p).

Kíváncsi vagyok, hol követek el hibát, és megkérdezem, észreveszi-e valaki.

Legyen $ p (x) = N (\ mu_1, \ sigma_1) $ és $ q (x) = N (\ mu_2, \ sigma_2) $ . A Bishop's PRML-ből tudom, hogy

$$ KL (p, q) = - \ int p (x) \ log q (x) dx + \ int p (x) \ log p (x) dx $$

ahol az integráció minden valós vonalon megtörténik, és ez

$$ \ int p (x) \ log p (x) dx = - \ frac {1} {2} (1 + \ log 2 \ pi \ sigma_1 ^ 2), $$

ezért csak $ \ int p (x) \ log q (x) dx $ -ra korlátozom magam, amit kiírhatok

$$ - \ int p (x) \ log \ frac {1} {(2 \ pi \ sigma_2 ^ 2) ^ {(1/2)}} e ^ { - \ frac {(x- \ mu_2) ^ 2} {2 \ sigma_2 ^ 2}} dx, $$

amelyek szétválaszthatók

$$ \ frac {1} {2} \ log (2 \ pi \ sigma_2 ^ 2) - \ int p (x) \ log e ^ {- \ frac {(x- \ mu_2 ) ^ 2} {2 \ sigma_2 ^ 2}} dx. $$

A naplót kapom

$ $ \ frac {1} {2} \ log (2 \ pi \ sigma_2 ^ 2) - \ int p (x) \ bigg (- \ frac {(x- \ mu_2) ^ 2} {2 \ sigma_2 ^ 2} \ bigg) dx, $$

ahol elválasztom az összegeket, és kapok $ \ sigma_2 ^ 2 $ s pan> ki az integrálból.

$$ \ frac {1} {2} \ log (2 \ pi \ sigma ^ 2_2) + \ frac {\ int p (x) x ^ 2 dx - \ int p (x) 2x \ mu_2 dx + \ int p (x) \ mu_2 ^ 2 dx} {2 \ sigma_2 ^ 2} $$

Ha a $ \ langle \ rangle $ jelöli a várakozás operátort a $ p $ alatt, át tudom írni ez

$$ \ frac {1} {2} \ log (2 \ pi \ sigma_2 ^ 2) + \ frac {\ langle x ^ 2 \ rangle - 2 \ langle x \ rangle \ mu_2 + \ mu_2 ^ 2} {2 \ sigma_2 ^ 2}. $$

Tudjuk, hogy a $ var (x) = \ langle x ^ 2 \ rangle - \ langle x \ rangle ^ 2 $ . Így

$$ \ langle x ^ 2 \ rangle = \ sigma_1 ^ 2 + \ mu_1 ^ 2 $$

és ezért

$$ \ frac {1} {2} \ log (2 \ pi \ sigma ^ 2) + \ frac {\ sigma_1 ^ 2 + \ mu_1 ^ 2 - 2 \ mu_1 \ mu_2 + \ mu_2 ^ 2} {2 \ sigma_2 ^ 2}, $$

amit feltehetek

$$ \ frac {1} {2} \ log (2 \ pi \ sigma_2 ^ 2) + \ frac {\ sigma_1 ^ 2 + (\ mu_1 - \ mu_2) ^ 2} {2 \ sigma_2 ^ 2}. $$

Ha mindent összerakok, eljutok a

\ begin {align *} KL oldalra (p, q) & = - \ int p (x) \ log q (x) dx + \ int p (x) \ log p (x) dx \\\\ & = \ frac {1} {2} \ log (2 \ pi \ sigma_2 ^ 2) + \ frac {\ sigma_1 ^ 2 + (\ mu_1 - \ mu_2) ^ 2} {2 \ sigma_2 ^ 2} - \ frac {1} {2} (1 + \ log 2 \ pi \ sigma_1 ^ 2) \\\\ & = \ log \ frac {\ sigma_2} {\ sigma_1} + \ frac {\ sigma_1 ^ 2 + (\ mu_1 - \ mu_2) ^ 2} {2 \ sigma_2 ^ 2}. \ End {align *} Ami hibás, mivel két azonos Gaussian esetében $ 1 $ értékkel rendelkezik. az én hibám?

Frissítés

Köszönet az mpiktasnak, hogy tisztázta a dolgokat. A helyes válasz:

$ KL (p, q) = \ log \ frac {\ sigma_2} {\ sigma_1} + \ frac {\ sigma_1 ^ 2 + (\ mu_1 - \ mu_2) ^ 2} {2 \ sigma_2 ^ 2} - \ frac {1} {2} $

bocs, hogy eleve a helytelen választ tettem közzé. Most néztem a $ x- \ mu_1 $ -ra, és azonnal arra gondoltam, hogy az integrál nulla. Az a pont, hogy négyzet lett, teljesen elmulasztotta az eszemet :)

mi a helyzet a többféle változatban?

Éppen egy kutatási cikkben láttam, hogy a kld értéke $ KL (p, q) = ½ * ((μ₁-μ₂) ² + σ₁² + σ₂²) * ((1 / σ₁²) + (1 / σ₂²)) - 2

Gondolom, hogy a kérdésedben elírás van, mivel nem tudom érvényesíteni, és az is látszik, hogy később a kérdésedben a helyes verziót használtad: $$ \ int p (x) \ log p (x) dx = \ frac {1} {2} (1 + \ log 2 \ pi \ sigma_1 ^ 2) $$ szerintem ennek kell lennie (vegye figyelembe a mínuszt): $$ \ int p (x) \ log p (x) dx = - \ frac {1} {2} (1 + \ log 2 \ pi \ sigma_1 ^ 2) $$ Megpróbáltam szerkeszteni a kérdését, és kitiltottak érte, ezért talán csináld magad.

A válasz megtalálható a belső veszteségekről szóló 1996-os cikkemben is (https://link.springer.com/article/10.1007/BF00133173).

Csak hivatkozásképpen: ez a https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence#Multivariate_normal_distributions speciális esete

@Xi'an - Köszönjük, hogy referenciát adott.Gyors pontosító kérdés: Meg tudná magyarázni, hogy az egyenlete miért adja meg az itt a képlet által adott válasz kétszeresét?Mi a különbség az értelmezésben?$$ \ frac {(\ mu_1- \ mu_2) ^ 2} {\ sigma_2 ^ 2} + \ frac {\ sigma_1 ^ 2} {\ sigma_2 ^ 2} - \ log \ biggl (\ frac {\ sigma_1 ^ 2}{\ sigma_2 ^ 2} \ biggl) -1 $$