Karena seseorang dapat menghitung interval kepercayaan untuk nilai-p dan karena kebalikan dari estimasi interval adalah estimasi titik: Apakah nilai-p merupakan estimasi titik?
Karena seseorang dapat menghitung interval kepercayaan untuk nilai-p dan karena kebalikan dari estimasi interval adalah estimasi titik: Apakah nilai-p merupakan estimasi titik?
Jawaban:
Estimasi titik dan interval kepercayaan untuk parameter yang menggambarkan distribusi, misalnya mean atau standar deviasi.
Tetapi tidak seperti statistik sampel lain seperti mean sampel dan standar deviasi sampel, nilai-p bukan penaksir yang berguna untuk parameter distribusi yang menarik. Lihatlah jawabannya oleh @whuber untuk detail teknis.
Nilai p untuk statistik uji memberikan probabilitas untuk mengamati penyimpangan dari nilai yang diharapkan dari uji-statistik setidaknya sebesar yang diamati dalam sampel, dihitung dengan asumsi bahwa hipotesis nol adalah benar. Jika Anda memiliki seluruh distribusi itu konsisten dengan hipotesis nol, atau tidak. Ini dapat dijelaskan dengan oleh variabel indikator (sekali lagi, lihat jawabannya oleh @whuber).
Tetapi nilai-p tidak dapat digunakan sebagai penaksir yang berguna dari variabel indikator karena tidak konsisten karena nilai-p tidak konvergen ketika ukuran sampel meningkat jika hipotesis nol benar. Ini adalah cara alternatif yang cukup rumit untuk menyatakan bahwa tes statistik dapat menolak atau gagal untuk menolak nol, tetapi tidak pernah mengkonfirmasi.
Ya, bisa jadi (dan telah) berpendapat bahwa nilai-p adalah estimasi titik.
Untuk mengidentifikasi properti apa pun dari suatu distribusi yang mungkin diperkirakan oleh nilai-p, kita harus menganggapnya tidak berpihak asimtotik. Tetapi, asimptotik, nilai p rata-rata untuk hipotesis nol adalah (idealnya; untuk beberapa tes mungkin beberapa angka bukan nol lainnya) dan untuk hipotesis lainnya adalah . Dengan demikian, nilai-p dapat dianggap sebagai penduga dari setengah fungsi indikator untuk hipotesis nol.0
Memang perlu kreativitas untuk melihat nilai-p dengan cara ini. Kita bisa melakukan sedikit lebih baik dengan melihat estimator yang dipermasalahkan sebagai keputusan yang kita buat dengan menggunakan nilai-p: apakah distribusi yang mendasari anggota dari hipotesis nol atau hipotesis alternatif? Mari kita sebut ini set mungkin keputusan . Jack Kiefer menulis
Kami menduga bahwa ada percobaan yang hasilnya dapat diamati oleh ahli statistik. Hasil ini dijelaskan oleh variabel acak atau vektor acak .... Hukum probabilitas tidak diketahui oleh ahli statistik, tetapi diketahui bahwa fungsi distribusi dari adalah anggota kelas fungsi distribusi yang ditentukan . ...X F X Ω
Masalah statistik dikatakan sebagai masalah estimasi titik jika adalah kumpulan nilai yang mungkin dari beberapa properti nyata atau bernilai vektor dari yang bergantung pada dengan cara yang cukup lancar.F F
Dalam hal ini, karena adalah diskrit, "cukup halus" bukanlah batasan sama sekali. Terminologi Kiefer mencerminkan hal ini dengan merujuk pada prosedur statistik dengan ruang keputusan yang terpisah sebagai "tes" dan bukan "penduga titik."
Meskipun menarik untuk mengeksplorasi batasan (dan batasan) dari definisi tersebut, seperti yang diminta oleh pertanyaan ini untuk kita lakukan, mungkin kita tidak boleh bersikeras terlalu kuat bahwa nilai-p adalah penduga titik, karena perbedaan antara penduga dan pengujian ini sama-sama berguna dan konvensional.
Dalam komentar untuk pertanyaan ini, Christian Robert membawa perhatian pada makalah 1992 di mana ia dan rekan penulis mengambil sudut pandang yang tepat ini dan menganalisis penerimaan nilai p sebagai penaksir fungsi indikator . Lihat tautan dalam referensi di bawah ini. Makalah dimulai,
Pendekatan untuk pengujian hipotesis biasanya memperlakukan masalah pengujian sebagai salah satu pengambilan keputusan dan bukan estimasi. Lebih tepatnya, tes hipotesis formal akan menghasilkan kesimpulan apakah hipotesis itu benar, dan tidak memberikan ukuran bukti untuk dikaitkan dengan kesimpulan itu. Dalam tulisan ini kami menganggap pengujian hipotesis sebagai masalah estimasi dalam kerangka kerja decision-theoretic ....
[Penekanan ditambahkan.]
Jiunn Tzon Hwang, George Casella, Christian Robert, Martin T. Wells, dan Roger H. Farrell, Estimasi Akurasi dalam Pengujian . Ann. Statist. Volume 20, Nomor 1 (1992), 490-509. Akses terbuka .
Jack Carl Kiefer, Pengantar Inferensi Statistik . Springer-Verlag, 1987.
-values tidak digunakan untuk mengestimasi parameter bunga, tetapi untuk pengujian hipotesis. Misalnya, Anda mungkin tertarik untuk memperkirakan populasi berdasarkan sampel yang Anda miliki, atau Anda mungkin tertarik pada estimasi intervalnya, tetapi dalam skenario pengujian hipotesis Anda lebih suka membandingkan mean sampel dengan mean populasi untuk melihat apakah mereka berbeda. Bahkan dalam skenario pengujian hipotesis Anda tidak tertarik pada nilai-nilai khusus mereka, melainkan jika mereka berada di bawah ambang batas (misalnya ). Dengan μ ¯ x μ p < 0,05 p p-nilai Anda tidak terlalu tertarik pada nilai poin mereka, tetapi Anda ingin tahu apakah data Anda memberikan cukup bukti terhadap hipotesis nol. Dalam skenario pengujian hipotesis, Anda tidak akan membandingkan nilai- berbeda satu sama lain, melainkan menggunakan masing-masing untuk membuat keputusan terpisah tentang hipotesis Anda. Anda tidak benar-benar ingin tahu apa-apa tentang hipotesis lambung, sejauh yang Anda tahu apakah Anda dapat menolaknya atau tidak. Ini membuat nilai-nilai mereka tidak dapat dipisahkan dari konteks keputusan dan karena itu mereka berbeda dari estimasi titik, karena dengan estimasi titik kami tertarik pada nilai-nilai mereka sendiri.