Distribusi sampel dari koefisien regresi


11

Saya sebelumnya belajar tentang distribusi sampling yang memberikan hasil bagi estimator, dalam hal parameter yang tidak diketahui. Misalnya, untuk distribusi sampel dan dalam model regresi linier Y_i = \ beta_o + \ beta_1 X_i + \ varepsilon_iβ^0β^1Yi=βo+β1Xi+εi

β^0N(β0, σ2(1n+x¯2Sxx))
dan
β^1N(β1, σ2Sxx)

di mana Sxx=i=1n(xi2)nx¯2

Tetapi sekarang saya telah melihat yang berikut dalam sebuah buku :

Misalkan kita cocok dengan model dengan kuadrat terkecil dengan cara biasa. Pertimbangkan distribusi posterior Bayesian, dan pilih prior sehingga ini setara dengan distribusi sampling frequentist biasa, yaitu ......

(β0β1)N2[(β^1β^2), σ^2(ni=1nxii=1nxii=1nxi2)1]

Ini membingungkan saya karena:

  1. Mengapa perkiraan muncul di sisi kiri (lhs) dari 2 ekspresi pertama, dan sisi kanan (rhs) dari ekspresi terakhir?
  2. Mengapa topi beta dalam ekspresi terakhir memiliki subskripsi 1 dan 2 bukannya 0 dan 1?
  3. Apakah ini hanya representasi berbeda dari hal yang sama? Jika ya, bisakah seseorang menunjukkan kepada saya bagaimana mereka setara? Jika tidak, bisakah seseorang menjelaskan perbedaannya?
  4. Apakah ini kasus bahwa ungkapan terakhir adalah "inversi" dari dua yang pertama? Apakah itu sebabnya matriks 2x2 dalam ekspresi terakhir dibalik dan estimasi / parameter dialihkan dari rhs lhs? Jika demikian, bisakah seseorang menunjukkan kepada saya bagaimana cara berpindah dari satu ke yang lain?

Jawaban:


7

Bagian ini terutama berkaitan dengan pertanyaan pertama, ketiga dan keempat Anda:

Ada perbedaan mendasar antara statistik Bayesian dan statistik frequentist.

Statistik Frequentist membuat kesimpulan tentang nilai parameter tetap mana yang konsisten dengan data yang dilihat secara acak, biasanya melalui kemungkinan. Anda mengambil (beberapa parameter atau parameter) sebagai tetap tetapi tidak diketahui, dan melihat mana yang membuat data lebih mungkin; itu terlihat pada sifat-sifat pengambilan sampel dari beberapa model yang diberikan parameter untuk membuat kesimpulan tentang di mana parameter mungkin. (Seorang Bayesian mungkin mengatakan pendekatan frequentist didasarkan pada 'frekuensi hal-hal yang tidak terjadi')θ

Statistik Bayesian melihat informasi pada parameter dalam hal distribusi probabilitas pada mereka, yang diperbarui oleh data, melalui kemungkinan. Parameter memiliki distribusi, jadi Anda melihat .P(θ|x_)

Ini menghasilkan hal-hal yang sering terlihat serupa tetapi di mana variabel-variabel dalam satu tampilan "jalan yang salah" dilihat melalui lensa dari cara berpikir yang lain tentang hal itu.

Jadi, pada dasarnya mereka adalah hal-hal yang agak berbeda , dan fakta bahwa hal-hal yang ada di LHS satu berada di RHS yang lain bukanlah kecelakaan.

Jika Anda melakukan beberapa pekerjaan dengan keduanya, segera menjadi cukup jelas.

Pertanyaan kedua menurut saya hanya berhubungan dengan kesalahan ketik.

---

pernyataan "setara dengan distribusi sampling frequentist biasa, yaitu": Saya mengambil ini berarti bahwa penulis menyatakan distribusi sampling frequentist. Apakah saya salah membaca ini?

Ada dua hal yang terjadi di sana - mereka telah mengutarakan sesuatu dengan sedikit longgar (orang-orang melakukan jenis ekspresi yang terlalu longgar setiap saat), dan saya pikir Anda juga menafsirkannya secara berbeda dari maksud.

Apa sebenarnya arti ungkapan yang mereka berikan?

Semoga diskusi di bawah ini akan membantu memperjelas arti yang dimaksud.

Jika Anda dapat memberikan referensi (lebih disukai online karena saya tidak memiliki akses perpustakaan yang baik) di mana ungkapan ini diturunkan saya akan berterima kasih.

Ini mengikuti langsung dari sini:

http://en.wikipedia.org/wiki/Bayesian_linear_regress

dengan mengambil prior flat pada dan saya pikir flat sebelumnya untuk juga.βσ2

Alasannya adalah karena posterior proporsional dengan kemungkinan dan interval yang dihasilkan dari posterior pada parameter cocok dengan interval kepercayaan sering untuk parameter.

Anda mungkin menemukan beberapa halaman pertama di sini bermanfaat juga.


Terima kasih, ini sangat membantu. Saya sudah melakukan sedikit statistik Bayesian. Saya masih agak bingung, karena pernyataan "setara dengan distribusi sampling frequentist biasa, yaitu" : Saya mengambil ini berarti bahwa penulis menyatakan distribusi sampling frequentist. Apakah saya salah membaca ini? Apa sebenarnya arti ungkapan yang mereka berikan? Jika Anda dapat memberikan referensi (lebih disukai secara online karena saya tidak memiliki akses perpustakaan yang baik) di mana ungkapan ini diturunkan, saya akan berterima kasih.
Joe King

Joe - lihat hasil edit saya di atas
Glen_b -Reinstate Monica
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.