Bisakah saya menggunakan momen distribusi untuk mencicipi distribusi?

Saya perhatikan dalam metode pembelajaran statistik / mesin, distribusi sering kali diperkirakan oleh seorang Gaussian, dan kemudian bahwa Gaussian digunakan untuk pengambilan sampel. Mereka mulai dengan menghitung dua momen pertama dari distribusi, dan menggunakannya untuk memperkirakan $\mu$ dan $\sigma^2$ . Kemudian mereka dapat mencicipi dari Gaussian itu.

Bagi saya, semakin banyak momen yang saya hitung, semakin baik saya dapat memperkirakan distribusi yang ingin saya sampel.

Bagaimana jika saya menghitung 3 momen ... bagaimana saya bisa menggunakannya untuk sampel dari distribusi? Dan dapatkah ini diperpanjang hingga N saat?

probability sampling moments

— curious_dan
sumber

Tiga momen tidak menentukan bentuk distribusi *; jika Anda memilih keluarga distribusi dengan tiga parameter yang berhubungan dengan tiga momen populasi pertama, Anda dapat melakukan pencocokan momen ("metode momen") untuk memperkirakan tiga parameter dan kemudian menghasilkan nilai dari distribusi tersebut. Ada banyak distribusi seperti itu.

$\quad$ [* Memang, kadang-kadang bahkan memiliki semua momen tidak cukup untuk menentukan distribusi.]

— Glen_b -Reinstate Monica

Terima kasih, @Glen_b! Saya akan membaca tentang "metode momen" untuk memahami kapan itu mungkin. Bisakah Anda mengarahkan saya ke teori yang menjelaskan kapan momen tidak cukup untuk menentukan distribusi?

— curious_dan

"Metode momen" hanya memberi tahu Anda cara memperkirakan parameter dari momen. Sisa komentar Anda adalah pertanyaan baru (saya pikir sudah dijawab di situs); secara singkat - jika fungsi pembangkit momen ada (dalam lingkungan 0) maka secara unik mengidentifikasi distribusi (secara teknis, pada prinsipnya Anda dapat melakukan transformasi Laplace terbalik). Tentu saja jika beberapa saat tidak terbatas ini berarti mgf tidak ada, tetapi ada juga kasus di mana semua momen terbatas tetapi mgf masih tidak ada di lingkungan 0 ..

— Glen_b -Reinstate Monica

Saya menulis jawaban berdasarkan komentar saya.

— Glen_b -Reinstate Monica

Jawaban:

Tiga momen tidak menentukan bentuk distribusi; jika Anda memilih keluarga distribusi dengan tiga parameter yang berhubungan dengan tiga momen populasi pertama, Anda dapat melakukan pencocokan momen ("metode momen") untuk memperkirakan tiga parameter dan kemudian menghasilkan nilai dari distribusi tersebut. Ada banyak distribusi seperti itu.

Kadang-kadang bahkan memiliki semua momen tidak cukup untuk menentukan distribusi. Jika fungsi pembangkit momen ada (dalam lingkungan 0) maka secara unik mengidentifikasi distribusi (Anda pada prinsipnya dapat melakukan transformasi Laplace terbalik untuk mendapatkannya).

[Jika beberapa momen tidak terbatas ini berarti mgf tidak ada, tetapi ada juga kasus di mana semua momen terbatas tetapi mgf masih tidak ada di lingkungan 0.]

Mengingat ada pilihan distribusi, orang mungkin tergoda untuk mempertimbangkan solusi entropi maksimum dengan kendala pada tiga momen pertama, tetapi tidak ada distribusi pada garis nyata yang mencapainya (karena kubik yang dihasilkan dalam eksponen akan tidak terikat).

Bagaimana proses akan bekerja untuk pilihan distribusi tertentu

Kita dapat menyederhanakan proses mendapatkan pencocokan distribusi tiga momen dengan mengabaikan varians mean dan dan bekerja dengan momen ketiga skala - saat-skewness yang ( $\gamma_1=\mu_3/\mu_2^{3/2}$ ).

Kita dapat melakukan ini karena setelah memilih distribusi dengan kemiringan yang relevan, kita kemudian dapat mundur mean dan varians yang diinginkan dengan penskalaan dan pergeseran.

Mari kita pertimbangkan sebuah contoh. Kemarin saya membuat set data besar (yang masih terjadi di sesi R saya) yang distribusinya saya belum mencoba untuk menghitung bentuk fungsional (itu adalah set besar nilai-nilai log dari varian sampel Cauchy di n = 10). Kami memiliki tiga momen mentah pertama masing-masing 1,519, 3,597 dan 11,499, atau sesuai dengan rata-rata 1,518, standar deviasi * 1,136 dan kemiringan 1,429 (jadi ini adalah nilai sampel dari sampel besar).

Secara formal, metode momen akan berusaha untuk mencocokkan momen mentah, tetapi perhitungan lebih sederhana jika kita mulai dengan kemiringan (mengubah penyelesaian tiga persamaan dalam tiga yang tidak diketahui menjadi penyelesaian untuk satu parameter pada suatu waktu, tugas yang jauh lebih sederhana).

* Saya akan menghapus perbedaan antara menggunakan n-penyebut pada varians - seperti yang sesuai dengan metode formal momen - dan penyebut n-1 dan hanya menggunakan perhitungan sampel.

$\sigma$ $\mu$ $\gamma$

$\gamma_1=(e^{\sigma ^{2}}\!\!+2){\sqrt {e^{\sigma ^{2}}\!\!-1}}$

$\sigma^2$ $\tilde{\sigma}^2$

$\gamma_1^2$ $(\tau+2)^2(\tau-1)$ $\tau=e^{\sigma^2}$ $\tau^3+3\tau^2-4=\gamma_1^2$ $\tilde{\tau}\approx 1.1995$ $\tilde{\sigma}^2\approx 0.1819$ $\gamma_1$

$\mu$

Tetapi kita dapat dengan mudah memilih gamma bergeser atau distribusi Weibull bergeser (atau F bergeser atau sejumlah pilihan lain) dan menjalankan proses yang pada dasarnya sama. Masing-masing akan berbeda.

[Untuk sampel yang saya hadapi, gamma bergeser mungkin akan menjadi pilihan yang jauh lebih baik daripada lognormal bergeser, karena distribusi log dari nilai-nilai dibiarkan miring dan distribusi akar pangkatnya sangat dekat dengan simetris; ini konsisten dengan apa yang akan Anda lihat dengan kepadatan gamma (tidak tergeser), tetapi kepadatan miring log tidak dapat dicapai dengan lognormal bergeser.]

Seseorang bahkan dapat mengambil diagram skewness-kurtosis dalam plot Pearson dan menggambar garis pada skewness yang diinginkan dan dengan demikian memperoleh distribusi dua titik, urutan distribusi beta, distribusi gamma, urutan distribusi beta-prima, inversi distribusi gamma dan rangkaian distribusi Pearson tipe IV semuanya dengan kemiringan yang sama.

$\beta_1=\gamma_1^2$ $\beta_2$

$\gamma_1^2 = 2.042$ $\sigma$

Lebih banyak momen

Momen tidak menyematkan distribusi dengan sangat baik, jadi bahkan jika Anda menentukan banyak momen, masih akan ada banyak distribusi yang berbeda (terutama dalam kaitannya dengan perilaku ekstrim-ekornya) yang akan cocok dengan mereka.

Anda tentu saja dapat memilih beberapa keluarga distribusi dengan setidaknya empat parameter dan berusaha untuk mencocokkan lebih dari tiga momen; misalnya distribusi Pearson di atas memungkinkan kami untuk mencocokkan empat momen pertama, dan ada pilihan distribusi lain yang memungkinkan tingkat fleksibilitas yang serupa.

Satu dapat mengadopsi strategi lain untuk memilih distribusi yang dapat mencocokkan fitur distribusi - distribusi campuran, pemodelan kepadatan log menggunakan splines, dan sebagainya.

Namun, sering kali, jika seseorang kembali ke tujuan awal di mana ia berusaha menemukan distribusi, sering kali ternyata ada sesuatu yang lebih baik yang dapat dilakukan daripada jenis strategi yang diuraikan di sini.

— Glen_b -Reinstate Monica
sumber

Jadi, jawabannya umumnya TIDAK, Anda tidak bisa melakukan ini, tetapi kadang-kadang Anda bisa.

Ketika kamu tidak bisa

Alasan Anda tidak bisa melakukan ini biasanya adalah dua lipatan.

Pertama, jika Anda memiliki pengamatan N, maka paling banyak Anda dapat menghitung momen N. Bagaimana dengan momen-momen lainnya? Anda tidak bisa begitu saja mengaturnya ke nol.

γ_{100} = \sum_{saya} \frac{x_{saya}^{100}}{n}

$\gamma_{100}=\sum_i\frac{x_i^{100}} n$

Ketika Anda bisa

Sekarang, terkadang Anda bisa mendapatkan distribusinya dari momen. Itu ketika Anda membuat asumsi tentang distribusi semacam itu. Misalnya, Anda menyatakan bahwa itu normal. Dalam hal ini yang Anda butuhkan hanya dua momen, yang dapat dihitung dengan presisi yang layak, biasanya. Perhatikan, distribusi normal memiliki momen yang lebih tinggi, misalnya, kurtosis, tetapi kita tidak membutuhkannya. Jika Anda menghitung semua momen dari distribusi normal (tanpa menganggap itu normal), maka mencoba memulihkan fungsi karakteristik untuk sampel dari distribusi, itu tidak akan berfungsi. Namun, ketika Anda lupa tentang momen yang lebih tinggi dan tetap berpegang pada yang pertama, itu akan berhasil.

— Aksakal
sumber