Tampak bagi saya seolah-olah Anda sedang mempertimbangkan sebuah dunia yang sering dikunjungi orang Bayesian. Itu tidak banyak bernuansa. Seperti jika Anda harus menjadi yang satu atau yang lain, atau seolah-olah metode yang diterapkan ditentukan oleh beberapa kepercayaan pribadi (daripada kenyamanan dan masalah spesifik dan informasi yang ada). Saya percaya bahwa ini adalah kesalahpahaman berdasarkan tren saat ini dalam menyebut diri sering atau Bayesian, dan juga banyak bahasa statistik mungkin membingungkan. Cobalah untuk meminta sekelompok ahli statistik menjelaskan nilai-p atau interval kepercayaan.
Beberapa karya klasik dapat membantu Anda memahami kesimpulan yang sering terjadi. Karya-karya klasik berisi prinsip-prinsip dasar, dekat dengan panasnya diskusi di antara para pendukung, dan memberikan latar belakang motivasi (praktis) dan relevansi pada waktu itu.
juga, karya-karya klasik ini pada metode frequentist, ditulis pada masa ketika kebanyakan orang bekerja dengan prinsip-prinsip Bayesian dan perhitungan matematis probabilitas (perhatikan bahwa statistik tidak selalu seolah-olah Anda sedang mengerjakan soal matematika tipikal dengan probabilitas, probabilitas mungkin sangat tidak jelas).
Probabilitas frekuensi bukan probabilitas terbalik
'Probabilitas terbalik' Fisher 1930
Anda membuat gagasan kemungkinan sebagai ekspresi Bayesian dengan flat sebelumnya
Namun,
sementara matematika bertepatan (ketika ditafsirkan secara salah, karena Anda mungkin mendapatkan P (x | a) = P (a | x), hingga konstan, tetapi mereka bukan istilah yang sama) konstruksi dan makna berbeda.
Kemungkinan tidak dimaksudkan untuk menjadi 'probabilitas Bayesian berdasarkan datar, atau seragam, priors'. Kemungkinan bahkan bukan probabilitas dan tidak mengikuti aturan distribusi probabilitas (misalnya Anda tidak dapat menjumlahkan kemungkinan untuk peristiwa yang berbeda, dan integral tidak sama dengan satu), itu hanya ketika Anda mengalikannya dengan flat sebelumnya, bahwa itu menjadi probabilitas, tetapi kemudian maknanya telah berubah juga.
Beberapa kutipan menarik dari 'probabilitas terbalik' 1930 Fisher.
Metode Bayesian dan sering adalah alat yang berbeda :
... ada dua ukuran berbeda dari kepercayaan rasional yang sesuai untuk kasus yang berbeda. Mengetahui populasi kita dapat mengekspresikan pengetahuan kita yang tidak lengkap tentang, atau harapan, sampel dalam hal probabilitas; mengetahui sampel kita dapat mengekspresikan pengetahuan kita yang tidak lengkap dari populasi dalam hal kemungkinan. Kita dapat menyatakan kemungkinan relatif bahwa korelasi yang tidak diketahui adalah + 0,6, tetapi bukan probabilitas bahwa itu terletak pada kisaran 0,595-0,605.
Perhatikan bahwa ada adalah pernyataan probabilitas tertentu, yang metode frequentist menyediakan.
Dengan membuat tabel nilai yang sesuai, kita dapat mengetahui segera setelah T dihitung berapa nilai fidusia 5 persen, nilai , dan bahwa nilai sebenarnya dari akan kurang dari nilai ini hanya dalam 5 persen, uji coba. Ini kemudian adalah pernyataan probabilitas pasti tentang parameter tidak diketahui , yang benar terlepas dari asumsi apa pun mengenai distribusi a priori-nya .θθθ
- metode frequentist membuat pernyataan tentang probabilitas bahwa percobaan (dengan interval acak) akan memiliki nilai sebenarnya dari parameter (mungkin acak) di dalam interval yang diberikan oleh statistik.
- Ini tidak menjadi bingung dengan probabilitas bahwa percobaan tertentu (dengan interval tetap) akan memiliki nilai sebenarnya dari parameter (tetap) di dalam interval yang diberikan oleh statistik.
Lihat juga 'Tentang "Kemungkinan Kesalahan" dari Koefisien Korelasi yang Disimpulkan dari Sampel Kecil.' Fisher 1921 di mana Fisher menunjukkan perbedaan metodenya tidak menjadi probabilitas terbalik Bayesian.
Dalam makalah sebelumnya ditemukan, dengan menerapkan metode yang dikembangkan sebelumnya, bahwa nilai << kemungkinan >> dari korelasi populasi, secara numerik, sedikit lebih kecil daripada sampel. Kesimpulan ini dikritik secara merugikan di Biometrica , tampaknya pada asumsi yang salah bahwa saya telah menyimpulkannya dari teorema Bayes . Akan diperlihatkan dalam makalah ini bahwa ketika kurva sampling diberikan kira-kira normal, koreksi yang saya usulkan sama dengan jarak antara nilai populasi dan titik tengah dari kurva pengambilan sampel dan karenanya tidak lebih dari koreksi dari suatu Bias konstan diperkenalkan oleh metode perhitungan. Tidak ada asumsi mengenai probabilitas apriori yang terlibat.
dan
... dua konsep yang sangat berbeda telah dikacaukan dengan nama << probabilitas >> ...
itu adalah probabilitas dan kemungkinan. Lihat juga catatan di akhir artikel Fishers dari tahun 1921 di mana ia berbicara lebih banyak tentang kebingungan.
Perhatikan lagi bahwa kemungkinan adalah fungsi dari serangkaian parameter, tetapi bukan fungsi kepadatan probabilitas dari set parameter tersebut.
Probabilitas digunakan untuk sesuatu yang dapat Anda amati. Misalnya probabilitas bahwa dadu menggulung enam. Kemungkinan digunakan untuk sesuatu yang tidak dapat Anda amati, misalnya hipotesis bahwa dadu menggulung enam 1/6 dari waktu.
juga, Anda mungkin menyukai karya Fisher di mana ia jauh lebih ringan dalam pendapatnya tentang teorema Bayes (masih menggambarkan perbedaan). 'Pada dasar matematika dari statistik teoritis' Fisher 1922 (terutama bagian 6 'solusi formal masalah estimasi')
Lebih
Jika Anda dapat memahami dan menghargai komentar-komentar dari Fisher tentang perbedaan antara probabilitas terbalik dan prinsip kemungkinan Anda mungkin ingin membaca lebih lanjut tentang perbedaan-perbedaan dalam metode frequentist.
'Garis Besar Teori Estimasi Statistik Berdasarkan Teori Klasik Probabilitas' Neyman 1937
Yang merupakan karya 50 halaman dan sulit untuk diringkas. Tapi itu berkaitan dengan pertanyaan Anda tentang ketidak bias bias , menjelaskan metode kuadrat terkecil (dan perbedaan dengan metode kemungkinan maksimum), dan secara khusus memberikan perlakuan interval kepercayaan (interval frequentist sudah tidak sama, unik, apalagi yang sama seperti interval Bayesian untuk prior flat).
Mengenai uji-F tidak jelas, apa atas nama Laplace yang Anda anggap salah. Jika Anda menyukai penggunaan awal, Anda dapat melihat di 'Studi dalam variasi tanaman. II Tanggapan manurial dari varietas kentang berbeda 1923 Fisher dan Mackenzie
Makalah ini memiliki ekspresi anova dalam model linier yang dikenali yang membagi jumlah kuadrat menjadi antara dan di dalam kelompok.
(dalam pengujian artikel 1923 tes terdiri dari perbandingan perbedaan antara log penyimpangan standar sampel dengan kesalahan standar yang dihitung untuk perbedaan ini yang ditentukan oleh jumlah derajat kebebasan . Karya selanjutnya membuat ekspresi yang lebih canggih ini mengarah ke distribusi-F, sehingga dapat meredakan ide yang mungkin dimiliki seseorang tentangnya. Tetapi pada dasarnya, tanpa juggling teknis karena distribusi yang lebih tepat untuk angka kecil, asalnya mirip dengan z-test).12d1+12d2