Meningkatkan penduga minimum


9

Misalkan saya memiliki parameter positif untuk mengestimasi dan estimasi yang sesuai yang dihasilkan oleh estimator , yaitu , dan seterusnya.nμ1,μ2,...,μnnμ1^,μ2^,...,μn^E[μ1^]=μ1E[μ2^]=μ2

Saya ingin memperkirakan menggunakan perkiraan yang ada. Jelas penaksir naif bias lebih rendah sebagai min(μ1,μ2,...,μn)min(μ1^,μ2^,...,μn^)

E[min(μ1^,μ2^,...,μn^)]min(μ1,μ2,...,μn)

Misalkan saya juga memiliki matriks kovarians dari penaksir yang sesuai . Apakah mungkin untuk mendapatkan estimasi minimum yang tidak bias (atau kurang bias) menggunakan estimasi yang diberikan dan matriks kovarians?Cov(μ1^,μ2^,...,μn^)=Σ


Apakah Anda bersedia menggunakan pendekatan Bayesian MCMC atau Anda memerlukan formula form tertutup?
Martin Modrák

Tetapi pendekatan pengambilan sampel yang sederhana tidak masalah? (juga, Anda tidak benar-benar membutuhkan prior untuk analisis Bayesian, tapi itu cerita lain)
Martin Modrák

@ MartinModrák Saya tidak berpengalaman dengan pendekatan pengambilan sampel. Jika saya melakukan bayesian saya biasanya melakukan hal konjugasi sederhana. Tetapi jika Anda berpikir ini adalah cara untuk pergi, saya akan terus maju dan belajar.
Cagdas Ozgenc

Apa lagi yang Anda ketahui tentang perkiraan ini? Apakah Anda tahu ungkapannya? Apakah Anda tahu distribusi data yang digunakan untuk memperkirakan parameter ini?
wij

@ Wij Saya dapat mencoba memperkirakan beberapa momen lain dari penaksir jika diperlukan. Saya tidak memiliki ekspresi analitik untuk distribusi estimator. Solusi tidak boleh (sebagai persyaratan tambang) bergantung pada distribusi data itu sendiri.
Cagdas Ozgenc

Jawaban:


4

Saya tidak memiliki jawaban yang jelas tentang keberadaan estimator yang tidak bias. Namun, dalam hal kesalahan estimasi, memperkirakan adalah masalah yang secara intrinsik sulit secara umum.min(μ1,,μn)

Misalnya, izinkan , dan . Biarkan menjadi kuantitas target dan adalah perkiraan . Jika kita menggunakan estimator "naif" mana , kemudian, kesalahan estimasi dibatasi oleh hingga konstan. (Perhatikan bahwa kesalahan estimasi untuk setiap adalah ). Tentu saja, jikaμ = ( μ 1 , ... , μ n ) θ = min i μ i θ θ θ = min i ( ˉ Y i ) ¯ Y i = 1Y1,,YNN(μ,σ2I)μ=(μ1,,μn)θ=miniμiθ^θθ^=mini(Y¯i)L2E[ θ -θ]2σ2lognYi¯=1Nj=1NYi,jL2 μiσ2

E[θ^θ]2σ2lognN
μi μiσσ2σ2NμiJauh dari satu sama lain dan sangat kecil, kesalahan estimasi harus dikurangi menjadi . Namun, dalam kasus terburuk, tidak ada perkiraan bekerja lebih baik daripada estimator naif. Anda dapat menunjukkan dengan tepat bahwa mana infimum mengambil alih semua kemungkinan yang mungkin dari berdasarkan sampel dan supremum mengambil alih semua konfigurasi yang mungkin dari .σ θinf θ sup μ 1 ,..., μ n E[ θ -θ]2σ2lognσ2Nθ θY1,,YNμi
infθ^supμ1,,μnE[θ^θ]2σ2lognN
θY1,,YNμi

Oleh karena itu estimator naif adalah minimax optimal hingga konstan, dan tidak ada estimasi yang lebih baik dari dalam hal ini.θ


Informasi tambahan yang diberikan sama sekali tidak membantu? Statistik tambahan apa yang bisa membantu?
Cagdas Ozgenc

Maaf karena membuat titik yang membingungkan. Saya tidak bermaksud bahwa informasi tambahan (kovarians) tidak membantu. Saya hanya ingin menunjukkan perkiraan minimum beberapa populasi berarti sulit di alam. Informasi kovarian seharusnya membantu. Sebagai contoh, dalam kasus Normal, jika kita memiliki korelasi sempurna untuk semua pasangan yang memungkinkan, itu berarti pengamatan acak berasal dari rerata berbeda + istilah kebisingan umum. Dalam hal ini, penaksir naif (minimum rata-rata sampel) tidak bias.
JaeHyeok Shin

3

EDIT: Berikut ini menjawab pertanyaan yang berbeda dari apa yang diminta - itu dibingkai seolah-olah dianggap acak, tetapi tidak berfungsi ketika dianggap tetap, yang mungkin apa OP ada dalam pikiran. Jika diperbaiki, saya tidak memiliki jawaban yang lebih baik daripadaμ μ min ( μ 1 , . . . , μ n )μμμmin(μ^1,...,μ^n)


Jika kami hanya mempertimbangkan taksiran untuk mean dan kovarian, kami dapat memperlakukan sebagai sampel tunggal dari distribusi normal multivarian. Cara sederhana untuk mendapatkan estimasi minimum adalah dengan mengambil sejumlah besar sampel dari , menghitung minimum setiap sampel dan kemudian mengambil rata-rata dari minimum tersebut.M V N ( μ , Σ )(μ1,...,μn)MVN(μ^,Σ)

Prosedur di atas dan batasannya dapat dipahami dalam istilah Bayesian - mengambil notasi dari Wikipedia di MVN , jika adalah kovarians yang diketahui dari estimator dan kami memiliki satu pengamatan, distribusi posterior bersama adalah mana dan muncul dari tempat sebelumnya, sebelum mengamati data yang kita ambil sebelumnya ). Karena Anda mungkin tidak mau menempatkan prior pada , kita dapat mengambil batas sebagai , menghasilkan flat sebelumnya dan posterior menjadiμ ~ M V N ( μ + m λ 0ΣμMVN(μ^+mλ01+m,1n+mΣ)λ0mμMVN(λ0,m1Σμm0μMVN(μ^,Σ). Namun, mengingat flat sebelumnya kita secara implisit membuat asumsi bahwa elemen berbeda (jika semua bilangan real sama-sama mungkin, mendapatkan nilai yang sama sangat tidak mungkin).μ

Sebuah cepat simulasi menunjukkan bahwa estimasi dengan prosedur ini sedikit perkiraan yang terlalu tinggi ketika unsur-unsur dari berbeda banyak dan meremehkan ketika unsur-unsur yang serupa. Seseorang dapat berargumen bahwa tanpa pengetahuan sebelumnya ini adalah perilaku yang benar. Jika Anda bersedia menyatakan setidaknya beberapa informasi sebelumnya (mis. ), hasilnya bisa menjadi sedikit lebih baik untuk kasus penggunaan Anda.min(μ)μmin(μ)m=0.1

Jika Anda bersedia untuk mengambil lebih banyak struktur, Anda mungkin dapat memilih distribusi yang lebih baik daripada multivariete normal. Juga mungkin masuk akal untuk menggunakan Stan atau sampler MCMC lainnya agar sesuai dengan estimasi . Ini akan memberi Anda satu set sampel yang mencerminkan ketidakpastian dalam estimator itu sendiri, termasuk struktur kovariansnya (mungkin lebih kaya daripada yang dapat disediakan MVN). Sekali lagi Anda dapat menghitung minimum untuk setiap sampel untuk mendapatkan distribusi posterior lebih dari minimum, dan mengambil rata-rata distribusi ini jika Anda memerlukan estimasi titik.μ(μ1,...,μn)


Perhatikan bahwa saya tidak mencoba memperkirakan minimum variabel acak N. Saya mencoba memperkirakan minimum parameter N. Tampaknya saran Anda adalah perkiraan untuk sedangkan saya memerlukan perkiraan untukE[min(μ1^,μ2^,...,μn^)]min(μ1,μ2,...,μn)
Cagdas Ozgenc

Saya mencoba mengedit jawaban untuk menjelaskan alasannya, semoga bisa membantu.
Martin Modrák

Jadi, apakah metode pengambilan sampel ini menghasilkan hasil yang lebih baik dibandingkan dengan sederhana , yang juga berfungsi dengan baik ketika jauh terpisah dan meremehkan saat mereka dekat. Agar bermanfaat, itu harus bekerja ketika mereka dekat. min(μ1^,μ2^,...,μn^)μi
Cagdas Ozgenc

Perhatikan juga bahwa semua adalah angka positif, jadi Anda tidak benar-benar membutuhkan bagian negatif dari garis nyata. μi
Cagdas Ozgenc

1
Anda benar bahwa saya mengabaikan tanda-tanda dan saya tidak melihat cara sederhana untuk mengakomodasi mereka. Estimator yang saya usulkan juga berkinerja lebih baik ketika dianggap acak, tetapi lebih buruk daripada untuk fix . Saya tidak berpikir saya bisa menyelamatkan ini dan saya tidak yakin apa jalan terbaik ke depan - saya cenderung mencoba untuk menghapus jawabannya karena tidak benar-benar menjawab pertanyaan, tetapi (saya harap) jawabannya juga mengandung beberapa ide yang mungkin bermanfaat bagi seseorang. m i n ( μ ) μμmin(μ^)μ
Martin Modrák
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.