Mengapa kepadatan posterior sebanding dengan fungsi kemungkinan kali kepadatan sebelumnya?

11

Menurut teorema Bayes, . Tetapi menurut teks ekonometrik saya, dikatakan bahwa . Kenapa seperti ini? Saya tidak mengerti mengapa diabaikan. $P(y|\theta)P(\theta) = P(\theta|y)P(y)$ $P(\theta|y) \propto P(y|\theta)P(\theta)$ $P(y)$

bayesian conditional-probability likelihood

— bayes-problem
sumber

1

Perhatikan bahwa itu tidak mengatakan bahwa keduanya sama, tetapi proporsional (hingga faktor, yaitu, )

1 / P (y)

$1/P(y)$

— jpmuc

4

P (y)

$P(y)$ tidak diabaikan tetapi diperlakukan sebagai konstanta karena merupakan fungsi dari data yang diperbaiki untuk masalah yang dihadapi. Jika di mana adalah konstanta (artinya tidak tergantung pada ), maka kita dapat menulis yang hanya berarti bahwa adalah konstanta (tidak ditentukan). Perhatikan bahwa ekstrema dan terjadi di lokasi yang sama sehingga hal-hal seperti perkiraan probabilitas a posteriori maksimum (MAP atau MAPP) dapat ditemukan dari tanpa perlu tahu (atau menghitung) .

y

$y$

A (x) = c B (x)

$A(x) = cB(x)$

c

$c$

x

$x$

A (x) \propto B (x)

$A(x) \propto B(x)$

\frac{A (x)}{B (x)}

$\frac{A(x)}{B(x)}$

A (x)

$A(x)$

B (x)

$B(x)$

P (y ∣ θ) P (θ)

$P(y\mid\theta)P(\theta)$

P (y)

$P(y)$

— Dilip Sarwate

14

$Pr(y)$ , probabilitas marginal dari , tidak "diabaikan". Itu hanya konstan. Membagi dengan memiliki efek "rescaling" perhitungan akan diukur sebagai probabilitas yang tepat, yaitu pada interval . Tanpa penskalaan ini, mereka masih merupakan ukuran relatif yang sah , tetapi tidak terbatas pada interval . $y$ $Pr(y)$ $Pr(y|\theta)P(\theta)$ $[0,1]$ $[0,1]$

$Pr(y)$ sering "ditinggalkan" karena seringkali sulit untuk dievaluasi, dan biasanya cukup nyaman untuk secara tidak langsung melakukan integrasi melalui simulasi. $Pr(y)=\int Pr(y|\theta)Pr(\theta)d\theta$

— Sycorax berkata Reinstate Monica
sumber

11

Perhatikan itu

P (θ | y) = \frac{P (θ, y)}{P (y)} = \frac{P (y | θ) P (θ)}{P (y)} .

$P(\theta | y) = \frac{P(\theta, y)}{P(y)} = \frac{P(y | \theta) P(\theta)}{P(y)}.$

Karena Anda tertarik untuk menghitung kepadatan , fungsi apa pun yang tidak bergantung pada parameter ini - seperti - dapat dibuang. Ini memberimu $\theta$ $P(y)$

P (θ | y) \propto P (y | θ) P (θ) .

$P(\theta | y) \propto P(y | \theta) P(\theta).$

Konsekuensi dari membuang adalah bahwa sekarang kepadatan telah kehilangan beberapa properti seperti integrasi ke 1 di atas domain . Ini bukan masalah besar karena orang biasanya tidak tertarik dalam mengintegrasikan fungsi kemungkinan, tetapi dalam memaksimalkannya. Dan ketika Anda memaksimalkan suatu fungsi, mengalikan fungsi ini dengan beberapa konstanta (ingat bahwa, dalam pendekatan Bayesian, data diperbaiki), tidak mengubah yang sesuai dengan titik maksimum. Memang mengubah nilai kemungkinan maksimum, tetapi sekali lagi, orang biasanya tertarik pada posisi relatif masing-masing . $P(y)$ $P(\theta | y)$ $\theta$ $y$ $\theta$ $\theta$

— Waldir Leoncio
sumber