"Prediksi" dan "estimasi" memang kadang-kadang digunakan secara bergantian dalam penulisan non-teknis dan mereka tampaknya berfungsi sama, tetapi ada perbedaan yang tajam di antara mereka dalam model standar masalah statistik. Sebuah estimator Data penggunaan menebak parameter sementara prediksi menggunakan data untuk menebak beberapa nilai acak yang bukan bagian dari dataset. Bagi mereka yang tidak terbiasa dengan apa arti "parameter" dan "nilai acak" dalam statistik, berikut ini memberikan penjelasan rinci.
Dalam model standar ini, data diasumsikan merupakan observasi (mungkin multivariat) dari variabel acak yang distribusinya hanya diketahui terletak di dalam set distribusi tertentu yang mungkin, "keadaan alamiah". Sebuah estimator adalah prosedur matematika yang ditunjuk untuk setiap nilai yang mungkin dari beberapa properti dari keadaan alam , seperti mean . Jadi perkiraan adalah dugaan tentang keadaan alam yang sebenarnya. Kita dapat mengetahui seberapa baik perkiraan dengan membandingkan dengan . XxX x t ( x ) θ μ ( θ ) t ( x ) μ ( θ )txt ( x )θμ(θ)t(x)μ(θ)
Sebuah prediksi menyangkut pengamatan independen lain variabel acak yang distribusinya terkait dengan keadaan sebenarnya dari alam. Prediksi adalah perkiraan tentang nilai acak lainnya. Kita dapat mengetahui seberapa baik prediksi tertentu hanya dengan membandingkan dengan nilai direalisasikan oleh . Kami berharap bahwa rata - rata perjanjian akan baik (dalam arti rata-rata atas semua kemungkinan hasil dan secara bersamaan atas semua nilai yang mungkin dari ).Z p ( x ) Z x Zp(x)Zp(x)Zx Z
Kuadrat terkecil biasa memberikan contoh standar. Data terdiri dari pasangan mengaitkan nilai dari variabel dependen ke nilai dari variabel independen. Keadaan alam ditentukan oleh tiga parameter , , dan : ia mengatakan bahwa setiap seperti gambar independen dari distribusi normal dengan mean dan standar deviasi . , , dan adalah parameter (angka) yang diyakini telah diperbaiki dan tidak berubah. Minat berfokus paday i x i α β σ y i α + β x i σ α β σ α β ( α , β ) α α β β α β(xi,yi)yixiαβσyiα+βxiσαβσα (intersep) dan (lereng). Perkiraan OLS, ditulis , baik dalam arti bahwa cenderung dekat dengan dan cenderung dekat dengan , tidak peduli apa nilai-nilai yang benar (tapi tidak diketahui) dari dan mungkin .β(α^,β^)α^αβ^βαβ
Prediksi OLS terdiri dari mengamati nilai baru dari variabel dependen yang terkait dengan beberapa nilai dari variabel independen. mungkin atau mungkin tidak termasuk di antara dalam dataset; itu tidak penting. Satu prediksi yang baik secara intuitif adalah bahwa nilai baru ini kemungkinan dekat dengan . Prediksi yang lebih baik mengatakan seberapa dekat nilai baru itu (mereka disebut interval prediksi ). Mereka menjelaskan fakta bahwa dan tidak pasti (karena mereka bergantung secara matematis pada nilai acakx x x i α + β x α β ( y i ) σ Y ( x ) σ α + β xZ=Y(x)xxxiα^+β^xα^β^(yi) ), bahwa tidak diketahui secara pasti (dan karena itu harus diperkirakan), serta asumsi bahwa memiliki distribusi normal dengan standar deviasi dan rata-rata ( perhatikan tidak adanya topi!).σY(x)σα+βx
Perhatikan khususnya bahwa prediksi ini memiliki dua sumber ketidakpastian yang berbeda: ketidakpastian dalam data mengarah ke ketidakpastian dalam perkiraan kemiringan, intersep, dan standar deviasi residual ( ); selain itu, ada ketidakpastian berapa nilai akan terjadi. Ketidakpastian tambahan ini - karena adalah acak - menjadi ciri prediksi. Prediksi mungkin terlihat seperti taksiran (setelah semua, taksiran :-) dan bahkan mungkin memiliki rumus matematika yang sama ( terkadang bisa sama dengan(xi,yi)σY(x)Y(x)α^+β^x α+βxp(x)t(x)), tetapi akan datang dengan jumlah ketidakpastian yang lebih besar dari perkiraan.
Di sini, kemudian, dalam contoh OLS, kita melihat perbedaannya dengan jelas: perkiraan menebak parameter (yang ditetapkan tetapi angka tidak diketahui), sedangkan prediksi menebak nilai kuantitas acak. Sumber kebingungan potensial adalah bahwa prediksi biasanya dibangun berdasarkan estimasi parameter dan bahkan mungkin memiliki rumus yang sama dengan estimator.
Dalam praktiknya, Anda dapat membedakan penaksir dari penaksir dengan dua cara:
tujuan : estimator berusaha mengetahui properti dari keadaan alami yang sebenarnya, sedangkan prediksi berusaha menebak hasil dari variabel acak; dan
ketidakpastian : seorang prediktor biasanya memiliki ketidakpastian yang lebih besar daripada penduga yang terkait, karena ketidakpastian tambahan dalam hasil variabel acak. Oleh karena itu prediktor yang terdokumentasi dengan baik dan dideskripsikan biasanya datang dengan pita ketidakpastian - interval prediksi - yang lebih luas dari pita ketidakpastian estimator, yang dikenal sebagai interval kepercayaan. Ciri khas interval prediksi adalah mereka dapat (secara hipotetis) menyusut ketika set data tumbuh, tetapi mereka tidak akan menyusut menjadi nol lebar - ketidakpastian dalam hasil acak "tidak dapat direduksi" - sedangkan lebar interval kepercayaan akan cenderung menyusut ke nol, sesuai dengan intuisi kami bahwa ketepatan estimasi dapat menjadi baik secara sewenang-wenang dengan jumlah data yang memadai.
Dalam menerapkan ini untuk menilai kerugian investasi potensial, pertama mempertimbangkan tujuan: apakah Anda ingin tahu berapa banyak Anda mungkin benar-benar kehilangan atas ini investasi (atau ini keranjang tertentu investasi) selama periode tertentu, atau Anda benar-benar hanya menebak apa kerugian yang diperkirakan (lebih dari investasi besar di dunia, mungkin)? Yang pertama adalah prediksi, yang terakhir perkiraan. Kemudian pertimbangkan ketidakpastian. Bagaimana jawaban Anda berubah jika Anda memiliki sumber daya yang hampir tak terbatas untuk mengumpulkan data dan melakukan analisis? Jika itu akan menjadi sangat tepat, Anda mungkin memperkirakan pengembalian yang diharapkan dari investasi, sedangkan jika Anda tetap sangat tidak yakin tentang jawabannya, Anda membuat prediksi.
Jadi, jika Anda masih tidak yakin dengan hewan mana yang Anda hadapi, tanyakan pada estimator / prediktor Anda ini: seberapa salah kemungkinannya dan mengapa? Melalui kedua kriteria (1) dan (2) Anda akan tahu apa yang Anda miliki.