Seperti @amoeba perhatikan, kami memiliki definisi probabilitas dan statistik frequentist yang sering . Semua sumber yang telah saya lihat sampai sekarang mengatakan bahwa inferensi frequentist didasarkan pada definisi probabilitas frequentist, yaitu memahaminya sebagai batas dalam proporsi yang diberikan jumlah acak tak terbatas (seperti yang telah diperhatikan oleh @fcop dan @Aksakal mengutip Kolmogorov)
P(A)=limn→∞nAn
Jadi pada dasarnya, ada anggapan beberapa populasi yang dapat kita sampel berulang kali. Gagasan yang sama digunakan dalam inferensi frequentist. Saya membaca beberapa makalah klasik, misalnya oleh Jerzy Neyman , untuk melacak fondasi teoritis dari statistik frequentist. Pada 1937 Neyman menulis
( besarbesaran ) Ahli statistik berkaitan dengan populasi, , yang karena alasan tertentu atau lainnya tidak dapat dipelajari secara mendalam. Hanya mungkin untuk mengambil sampel dari populasi ini yang dapat dipelajari secara rinci dan digunakan untuk membentuk pendapat tentang nilai-nilai konstanta tertentu yang menggambarkan sifat-sifat populasi . Sebagai contoh, mungkin diinginkan untuk menghitung kira-kira rata-rata karakter tertentu yang dimiliki oleh individu yang membentuk populasi
, dll.
( Ibπ π ππππ
) Atau, ahli statistik mungkin khawatir dengan eksperimen tertentu yang, jika diulangi dalam kondisi yang tampaknya identik, menghasilkan hasil yang bervariasi. Eksperimen semacam itu disebut eksperimen acak [...]
Dalam kedua kasus yang dijelaskan, masalah yang dihadapi ahli statistik adalah masalah estimasi. Masalah ini terdiri dalam menentukan operasi aritmatika apa yang harus dilakukan pada data pengamatan untuk mendapatkan hasil, yang disebut perkiraan, yang mungkin tidak berbeda jauh dari nilai sebenarnya dari karakter numerik, baik dari populasi
, seperti dalam ( besarbesaran ), atau dari eksperimen acak, seperti pada ( ib ). [...]
Dalam ( besarbesaranπ
) kita berbicara tentang seorang ahli statistik yang mengambil sampel dari populasi yang diteliti.
Dalam makalah lain (Neyman, 1977), ia memperhatikan bahwa bukti yang diberikan dalam data perlu diverifikasi dengan mengamati sifat berulang dari fenomena yang diteliti:
Biasanya, 'verifikasi', atau 'validasi' model yang ditebak terdiri dalam menyimpulkan beberapa konsekuensi yang sering terjadi dalam situasi yang sebelumnya tidak dipelajari secara empiris, dan kemudian dalam melakukan eksperimen yang tepat untuk melihat apakah hasilnya konsisten dengan prediksi. Secara umum, upaya verifikasi yang pertama adalah negatif: frekuensi yang diamati dari berbagai hasil percobaan tidak sesuai dengan model. Namun, pada beberapa kesempatan yang beruntung ada kesepakatan yang masuk akal dan orang merasakan kepuasan karena telah 'memahami' fenomena tersebut, setidaknya dalam beberapa cara umum. Kemudian, selalu, temuan empiris baru muncul, menunjukkan ketidakmampuan model asli dan menuntut pengabaian atau modifikasi. Dan ini adalah sejarah sains!
dan dalam makalah lain Neyman dan Pearson (1933) menulis tentang sampel acak yang diambil dari populasi tetap
Dalam praktik statistik umum, ketika fakta-fakta yang diamati digambarkan sebagai "sampel", dan hipotesis berkaitan dengan "populasi", yang sampelnya diambil, karakter sampelnya, atau seperti yang akan kita sebut sebagai kriteria, yang telah digunakan untuk menguji hipotesis, tampaknya sering diperbaiki oleh intuisi bahagia.
Statistik frekuensi dalam konteks ini memformalkan alasan ilmiah di mana bukti dikumpulkan, kemudian sampel baru diambil untuk memverifikasi temuan awal dan saat kami mengumpulkan lebih banyak bukti, pengetahuan kami semakin mengkristal. Sekali lagi, seperti yang dijelaskan oleh Neyman (1977), proses tersebut mengambil langkah-langkah berikut
( i ) Pembentukan empiris frekuensi relatif jangka panjang yang tampaknya stabil (atau 'frekuensi') dari peristiwa-peristiwa yang dinilai menarik, karena berkembang di alam.
( ii ) Menebak dan kemudian memverifikasi 'mekanisme kebetulan', operasi berulang yang menghasilkan frekuensi yang diamati. Ini adalah masalah 'teori probabilitas frequentist'. Kadang-kadang, langkah ini diberi label 'model building'. Secara alami, mekanisme peluang yang diduga adalah hipotesis.
( iii ) Menggunakan mekanisme peluang hipotetis dari fenomena yang diteliti untuk menyimpulkan aturan menyesuaikan tindakan kita (atau 'keputusan') dengan pengamatan sehingga memastikan 'ukuran' tertinggi 'sukses'. [... dari 'aturan penyesuaian tindakan kita' adalah masalah matematika, khususnya statistik matematika.
Frequentists merencanakan penelitian mereka dengan mengingat sifat acak data dan gagasan penarikan berulang dari populasi tetap, mereka merancang metode mereka berdasarkan itu, dan menggunakannya untuk memverifikasi hasil mereka (Neyman dan Pearson, 1933),
Tanpa berharap untuk mengetahui apakah setiap hipotesis yang terpisah itu benar atau salah, kita dapat mencari aturan untuk mengatur perilaku kita mengenai hal itu, dengan mengikuti mana kita memastikan bahwa, dalam jangka panjang pengalaman, kita tidak akan terlalu sering salah.
Ini terhubung dengan prinsip pengambilan sampel berulang (Cox dan Hinkley, 1974):
(ii) Prinsip pengambilan sampel berulang yang kuat
Menurut prinsip pengambilan sampel berulang yang kuat, prosedur statistik harus dinilai berdasarkan perilaku mereka dalam pengulangan hipotetis di bawah kondisi yang sama. Ini memiliki dua sisi. Ukuran ketidakpastian harus ditafsirkan sebagai frekuensi hipotetis dalam pengulangan jangka panjang; kriteria optimalitas harus dirumuskan dalam hal perilaku sensitif dalam pengulangan hipotetis.
Argumen untuk ini adalah bahwa ia memastikan makna fisik untuk jumlah yang kami hitung dan memastikan hubungan yang erat antara analisis yang kami buat dan model yang mendasarinya yang dianggap mewakili keadaan "sebenarnya".
(iii) Prinsip pengambilan sampel berulang yang
lemah Versi lemah dari prinsip pengambilan sampel yang berulang mensyaratkan bahwa kita tidak boleh mengikuti prosedur yang untuk beberapa nilai parameter yang mungkin akan memberikan, dalam pengulangan hipotetis, kesimpulan yang menyesatkan sebagian besar waktu.
Sebagai kontras, ketika menggunakan kemungkinan maksimum kami prihatin dengan sampel yang kami miliki , dan dalam kasus Bayesian kami membuat kesimpulan berdasarkan sampel dan prior kami dan ketika data baru muncul kami dapat melakukan pembaruan Bayesian. Dalam kedua kasus, gagasan pengambilan sampel berulang tidak penting. Frequentists hanya mengandalkan data yang mereka miliki (seperti yang diperhatikan oleh @WBT ), tetapi perlu diingat bahwa itu adalah sesuatu yang acak dan harus dianggap sebagai bagian dari proses pengambilan sampel berulang dari populasi (ingat, misalnya, bagaimana kepercayaan diri interval didefinisikan).
Dalam kasus yang sering terjadi, gagasan pengambilan sampel berulang memungkinkan kita untuk mengukur ketidakpastian (dalam statistik) dan memungkinkan kita untuk menginterpretasikan peristiwa kehidupan nyata dalam hal probabilitas .
Sebagai catatan tambahan, perhatikan bahwa baik Neyman (Lehmann, 1988), maupun Pearson (Mayo, 1992) tidak sesering yang kita bayangkan. Sebagai contoh, Neyman (1977) mengusulkan menggunakan Empiris Bayesian dan Maksimum Kemungkinan untuk estimasi titik. Di sisi lain (Mayo, 1992),
dalam tanggapan Pearson (1955) terhadap Fisher (dan di tempat lain dalam karyanya) adalah bahwa untuk konteks ilmiah Pearson menolak kedua alasan probabilitas kesalahan jangka panjang yang rendah [...]
Jadi sepertinya bahwa sulit untuk menemukan murni frequentist bahkan di antara bapak-bapak pendiri.
Neyman, J, dan Pearson, ES (1933). Tentang Masalah Tes Hipotesis Statistik yang Paling Efisien. Transaksi filosofis dari Royal Society A: Matematika, Ilmu Fisika dan Teknik. 231 (694–706): 289–337.
Neyman, J. (1937). Garis Besar Teori Estimasi Statistik Berdasarkan Teori Klasik Probabilitas. Phil Trans. R. Soc. Lond. A. 236: 333–380.
Neyman, J. (1977). Probabilitas frekuensi dan statistik frequentist. Synthese, 36 (1), 97-131.
Mayo, DG (1992). Apakah Pearson menolak filosofi statistik Neyman-Pearson? Synthese, 90 (2), 233-262.
Cox, DR dan Hinkley, DV (1974). Statistik Teoritis. Chapman dan Hall.
Lehmann, E. (1988). Jerzy Neyman, 1894 - 1981. Laporan Teknis No. 155. Departemen Statistik, Universitas Califomia.