Apa hubungan antara estimator dan estimasi?
Apa hubungan antara estimator dan estimasi?
Jawaban:
EL Lehmann, dalam Theory of Point Estimation klasiknya , menjawab pertanyaan ini di halaman 1-2.
Pengamatan sekarang dipostulatkan sebagai nilai yang diambil oleh variabel acak yang diasumsikan mengikuti distribusi probabilitas bersama, , milik beberapa kelas yang dikenal ...
... sekarang mari kita berspesialisasi pada estimasi titik ... misalkan adalah fungsi bernilai riil yang didefinisikan [pada kelas distribusi yang ditentukan] dan bahwa kami ingin mengetahui nilai [pada apa pun distribusi aktual dalam efek, ]. Sayangnya, , dan karenanya , tidak diketahui. Namun, data dapat digunakan untuk mendapatkan estimasi , nilai yang diharapkan satu akan mendekati .g θ θ g ( θ ) g ( θ ) g ( θ )
Dengan kata lain: estimator adalah prosedur matematika pasti yang menghasilkan angka ( estimasi ) untuk setiap set data yang mungkin dihasilkan oleh masalah tertentu. Angka itu dimaksudkan untuk mewakili beberapa properti numerik tertentu ( ) dari proses pembuatan data; kita mungkin menyebutnya "taksiran dan."
Estimator itu sendiri bukan variabel acak: itu hanya fungsi matematika. Namun, estimasi yang dihasilkannya didasarkan pada data yang dimodelkan sebagai variabel acak. Ini membuat estimasi (dianggap tergantung pada data) menjadi variabel acak dan perkiraan tertentu untuk sekumpulan data tertentu menjadi realisasi dari variabel acak tersebut.
Dalam satu formulasi kuadrat terkecil biasa (konvensional), data terdiri dari pasangan berurutan . The telah ditentukan oleh eksperimen (mereka dapat menjadi jumlah dari obat yang diberikan, misalnya). Setiap (tanggapan terhadap obat, misalnya) diasumsikan berasal dari distribusi probabilitas yang Normal tetapi dengan mean yang tidak diketahui dan varian umum . Selain itu, diasumsikan bahwa cara terkait dengan melalui rumus . Tiga parameter ini - , , danx i y i μ i σ 2 x i μ i = β 0 + β 1 x i σ β 0 β 1 y i x i ( σ , β 0 , β 1 ) β 0 β 1 cos ( σ + β 2 0 - β 1 ) x--menentukan distribusi yang mendasari untuk nilai . Karenanya setiap properti dari distribusi itu dapat dianggap sebagai fungsi dari . Contoh dari properti tersebut adalah intersep , slope , nilai , atau bahkan nilai rata-rata pada nilai , yang (menurut formulasi ini) ) harus .
Dalam konteks OLS ini, non-contoh estimator akan menjadi prosedur untuk menebak pada nilai jika ditetapkan sama dengan 2. Ini bukan estimator karena nilai ini adalah acak (dengan cara yang benar-benar terpisah dari keacakan data): ini bukan properti (numerik pasti) dari distribusi, meskipun itu terkait dengan distribusi itu. (Seperti yang kita hanya melihat, meskipun, harapan dari untuk , sama dengan , dapat diperkirakan.)x y y x = 2 β 0 + 2 β 1
Dalam formulasi Lehmann, hampir semua formula dapat menjadi penaksir dari hampir semua properti. Tidak ada hubungan matematis yang melekat antara estimator dan estimand. Namun, kami dapat menilai - di muka - peluang bahwa penaksir akan cukup dekat dengan jumlah yang dimaksudkan untuk memperkirakan. Cara untuk melakukan ini, dan bagaimana cara mengeksploitasinya, adalah subjek dari teori estimasi.
Singkatnya: estimator adalah fungsi dan estimasi adalah nilai yang merangkum sampel yang diamati.
Sebuah estimator adalah fungsi yang memetakan sampel acak estimasi parameter:
Catatan bahwa estimator darinvariabel acakX1,X2,. . . ,Xnadalah variabel acak Θ . Sebagai contoh, sebuah estimator adalah mean sampel: ¯ X =1
Sebagai contoh, perkiraan sampel yang diamatix1,x2,. . . ,Xnadalah sampel berarti: μ = ¯ x =1
Mungkin bermanfaat untuk menggambarkan jawaban whuber dalam konteks model regresi linier. Katakanlah Anda memiliki beberapa data bivariat dan Anda menggunakan Kuadrat Terkecil Biasa untuk menghasilkan model berikut:
Y = 6X + 1
Pada titik ini, Anda dapat mengambil nilai X apa pun, memasukkannya ke dalam model dan memprediksi hasilnya, Y. Dalam hal ini, Anda mungkin menganggap komponen individual dari bentuk umum model ( mX + B ) sebagai penduga . Data sampel (yang Anda duga dicolokkan ke model generik untuk menghitung nilai spesifik untuk m dan B di atas) memberikan dasar di mana Anda dapat membuat estimasi untuk m dan B masing-masing.
Konsisten dengan poin @ whuber di utas kami di bawah ini, nilai Y apa pun yang dihasilkan oleh set estimator tertentu, dalam konteks regresi linier, dianggap sebagai nilai yang diprediksi.
(diedit - beberapa kali - untuk mencerminkan komentar di bawah)
Misalkan Anda menerima beberapa data, dan Anda memiliki beberapa variabel yang diamati yang disebut theta. Sekarang data Anda dapat dari distribusi data, untuk distribusi ini, ada nilai yang sesuai dari theta yang Anda simpulkan yang merupakan variabel acak. Anda dapat menggunakan MAP atau berarti untuk menghitung estimasi variabel acak ini setiap kali distribusi data Anda berubah. Jadi variabel acak theta dikenal sebagai taksiran , nilai tunggal dari variabel yang tidak teramati untuk jenis data tertentu.
Sedangkan estimator adalah data Anda, yang juga merupakan variabel acak. Untuk berbagai jenis distribusi Anda memiliki berbagai jenis data dan dengan demikian Anda memiliki perkiraan yang berbeda dan dengan demikian variabel acak yang sesuai ini disebut penduga .