Saya belajar sendiri beberapa statistik untuk bersenang-senang dan saya memiliki kebingungan mengenai statistik yang cukup . Saya akan menuliskan kebingungan saya dalam format daftar:
Jika distribusi memiliki parameter maka akan ia memiliki statistik yang cukup?
Apakah ada korespondensi langsung antara statistik yang cukup dan parameter? Atau apakah statistik yang cukup hanya berfungsi sebagai kumpulan "informasi" sehingga kami dapat membuat ulang pengaturan sehingga kami dapat menghitung perkiraan yang sama untuk parameter distribusi yang mendasarinya.
Apakah semua distribusi memiliki statistik yang cukup? yaitu. dapatkah teorema faktorisasi gagal?
Dengan menggunakan sampel data kami, kami mengasumsikan distribusi yang kemungkinan besar berasal dari data dan kemudian dapat menghitung taksiran (misalnya MLE) untuk parameter untuk distribusi. Statistik yang memadai adalah cara untuk dapat menghitung estimasi yang sama untuk parameter tanpa harus bergantung pada data itu sendiri, bukan?
Apakah semua set statistik yang memadai memiliki statistik yang cukup memadai?
Ini adalah bahan yang saya gunakan untuk mencoba memahami materi topik: https://onlinecourses.science.psu.edu/stat414/node/283
Dari apa yang saya pahami kami memiliki teorema faktorisasi yang memisahkan distribusi bersama menjadi dua fungsi, tetapi saya tidak mengerti bagaimana kami dapat mengekstrak statistik yang cukup setelah memfaktorkan distribusi ke dalam fungsi kami.
Pertanyaan Poisson yang diberikan dalam contoh ini memiliki faktorisasi yang jelas, tetapi kemudian dinyatakan bahwa statistik yang cukup adalah mean sampel dan jumlah sampel. Bagaimana kita tahu bahwa itu adalah statistik yang cukup hanya dengan melihat bentuk persamaan pertama?
Bagaimana mungkin untuk melakukan estimasi MLE yang sama menggunakan statistik yang cukup jika persamaan kedua dari hasil faktorisasi kadang-kadang akan tergantung pada nilai data sendiri? Misalnya dalam kasus Poisson fungsi kedua bergantung pada kebalikan dari produk faktorial data, dan kami tidak lagi memiliki data!
Mengapa ukuran sampel statistik tidak mencukupi, dalam kaitannya dengan contoh Poisson di halaman web ? Kita akan memerlukan n untuk merekonstruksi bagian-bagian tertentu dari fungsi pertama jadi mengapa itu bukan statistik yang cukup juga?