Apa alasan di balik keluarga distribusi eksponensial?

10

Dari kursus probabilitas dasar, distribusi probabilitas seperti Gaussian, Poisson atau eksponensial semua memiliki motivasi yang baik. Setelah menatap formula distribusi keluarga eksponensial untuk waktu yang lama, saya masih tidak mendapatkan intuisi.

f_{X} (x ∣ θ) = h (x) \exp (η (θ) \cdot T (x) - A (θ))

$f_{X}(x\mid {\boldsymbol {\theta }})=h(x)\exp {\Big (}{\boldsymbol {\eta }}({\boldsymbol {\theta }})\cdot \mathbf {T} (x)-A({\boldsymbol {\theta }}){\Big )}$

Adakah yang bisa membantu saya memahami Mengapa kita membutuhkannya? Apa keuntungan memodelkan variabel respons menjadi keluarga eksponensial vs normal?

EDIT: Oleh keluarga eksponensial, yang saya maksud adalah kelas distribusi umum yang dijelaskan di sini .

exponential-family

— penghuni utara
sumber

1

TL; DR? Sebagian alasannya adalah kenyamanan matematis; banyak masalah dapat diselesaikan secara analitis jika Anda menganggap pdf berasal dari keluarga ini.

— Vladislavs Dovgalecs

10

Apa keuntungan memodelkan variabel respons menjadi keluarga eksponensial vs normal?

Keluarga eksponensial jauh lebih luas daripada keluarga normal. Misalnya, apa keuntungan menggunakan Poisson atau binomial daripada normal? Normal tidak banyak digunakan jika Anda menghitung dengan mean rendah. Bagaimana jika data Anda kontinu tetapi condong sangat benar - mungkin waktu atau jumlah uang? Keluarga eksponensial termasuk normal, binomial, Poisson dan Gamma sebagai kasus khusus (di antara banyak lainnya)
Ini menggabungkan berbagai variasi hubungan mean-varian .
Ini berasal dari mencoba menjawab pertanyaan di sepanjang baris "apa distribusi adalah fungsi dari statistik yang cukup ", dan model memiliki dapat diperkirakan melalui ML menggunakan statistik yang cukup sederhana; ini termasuk model biasa yang tersedia dalam program yang sesuai dengan model linier umum. Memang statistik yang cukup ( ) eksplisit dalam fungsi kerapatan eksponensial-keluarga. $T(x)$
Itu membuatnya mudah untuk memisahkan hubungan antara respons dan prediktor dari distribusi kondisional dari respons (melalui fungsi tautan). Misalnya Anda dapat mencocokkan hubungan garis lurus ke model yang menentukan respons bersyarat memiliki distribusi gamma , atau hubungan eksponensial dengan respons Gaussian bersyarat dalam kerangka kerja GLM.

Bagi orang Bayes, keluarga eksponensial cukup menarik karena semua anggota keluarga eksponensial memiliki prior konjugasi.

— Glen_b -Reinstate Monica
sumber

1

Saya agak bingung dengan poin ke-3 Anda. Sepanjang yang saya ingat, semua distribusi probabilitas dari kelas probabilitas sarjana saya adalah fungsi dari statistik mereka yang memadai. Ini mungkin bukan kasus untuk distribusi aneh seperti cauchy (yang statistiknya cukup saya tidak yakin) atau distribusi kuasa hukum lainnya. Tapi mengapa ini masalah besar?

— Penduduk utara

1

Mungkin saja saya tidak mengekspresikan diri saya dengan jelas. Lihat Koopman, BO, (1936), "Tentang Distribusi yang Mengakui Statistik yang Cukup" , Transaksi Masyarakat Matematika Amerika, 39: 3, 399-409. Di sinilah konsep keluarga eksponensial muncul; pengertian khusus di mana keluarga eksponensial khusus dalam kaitannya dengan kecukupan dijelaskan di halaman pertama dan beberapa baris pertama dari halaman kedua.

— Glen_b -Reinstate Monica

5

Bagi saya, motivasi utama di balik distribusi keluarga eksponensial adalah bahwa mereka adalah keluarga distribusi entropi maksimum yang diberikan serangkaian statistik dan dukungan yang memadai. Dengan kata lain, mereka adalah distribusi asumsi minimum.

Misalnya, jika Anda hanya mengukur rata-rata dan varians dari kuantitas yang dinilai nyata, pilihan pemodelan yang paling tidak berasumsi adalah distribusi normal.

Dari sudut pandang komputasi, ada keuntungan lain:

Mereka ditutup di bawah "kombinasi bukti". Yaitu, kombinasi dari dua kemungkinan independen dari keluarga eksponensial yang sama selalu dalam keluarga eksponensial yang sama dan parameter alaminya hanyalah jumlah dari parameter alami komponennya. Ini nyaman untuk statistik Bayesian.
Gradien dari entropi silang antara dua distribusi keluarga eksponensial adalah perbedaan parameter ekspektasinya. Ini berarti bahwa fungsi kehilangan yang merupakan cross entropy adalah fungsi kerugian yang cocok , yang sesuai untuk optimasi.

— Neil G
sumber

2

Daftar Glen baik. Saya akan menambahkan 1 aplikasi lagi untuk melengkapi jawabannya: menurunkan prior konjugasi untuk inferensi Bayesian.

Bagian inti dari inferensi Bayesian adalah menurunkan distribusi posterior . Memiliki sebelumnya yang konjugat dengan kemungkinan berarti bahwa posterior dan sebelumnya akan termasuk dalam kelas distribusi probabilitas yang sama. $p(\theta|y) \propto p(y|\theta) p(\theta)$ $p(\theta)$ $p(y|\theta)$ $p(y|\theta)$ $p(\theta)$

Properti berguna yang saya maksudkan adalah bahwa, untuk kemungkinan pengamatan diambil dari satu keluarga parameter eksponensial dari formulir $n$

$p(y_1,\ldots,y_n|\theta) = \prod p(y_i|\theta) \propto g(\theta)^n \exp \big[ h(\theta) \sum t(y_i) \big]$ ,

kita bisa menuliskan konjugasi sebelumnya sebagai

$p(\theta) \propto g(\theta)^\nu \big[ h(\theta) \delta \big]$

dan kemudian posterior berfungsi sebagai

$p(\theta|y_1,\ldots,y_n) \propto g(\theta)^{n+\nu} \exp \big[ h(\theta) \big( \sum t(y_i) + \delta \big) \big]$

Mengapa konjugasi ini bermanfaat? Karena itu menyederhanakan interpretasi dan perhitungan kami saat melakukan inferensi Bayesian. Ini juga berarti kita dapat dengan mudah menghasilkan ekspresi analitik untuk posterior tanpa harus melakukan terlalu banyak aljabar.

— AG
sumber

0

Anda ingin model data mencerminkan proses pembuatannya. 'Proses' menghasilkan variabel Gaussian memiliki karakteristik yang sangat berbeda dari yang mengatur eksponensial, dan itu tidak selalu intuitif mengapa. Terkadang Anda perlu menghargai karakteristik distribusi lainnya. Sebagai salah satu contoh, pertimbangkan bahwa fungsi bahaya untuk Gaussian meningkat sementara eksponensial datar. Sebagai contoh praktis basi, anggaplah saya akan menyodok Anda pada interval, dan 'interval poke antar' akan dipilih oleh Gaussian atau fungsi pembangkit eksponensial. Di bawah Gaussian, Anda akan menemukan bahwa colekan dapat diprediksi, dan terasa sangat mungkin setelah interval yang lama. Di bawah eksponensial, mereka akan merasa sangat tidak terduga. Alasan untuk ini adalah karena fungsi pembangkit, yang tergantung pada fenomena yang mendasarinya.

— HEITZ
sumber

6

Pertanyaannya ambigu mengenai apakah OP bertanya tentang distribusi eksponensial atau keluarga eksponensial. Di sini, Anda menafsirkan Q sebagai yang pertama, sedangkan @Glen_b menafsirkannya sebagai yang terakhir. OP sekarang telah mengklarifikasi Q mereka tentang keluarga eksponensial. Mengingat hal itu, apakah Anda menganggap mengedit ini tentang hal itu, atau mungkin menghapusnya?

— gung - Reinstate Monica