Seberapa signifikan suatu nilai dibandingkan dengan daftar nilai? Dalam kebanyakan kasus pengujian statistik melibatkan membandingkan set sampel dengan populasi. Dalam kasus saya, sampel dibuat dengan satu nilai dan kami membandingkannya dengan populasi.
Saya seorang dilettante dalam pengujian hipotesis statistik dihadapkan dengan mungkin masalah paling mendasar. Bukan hanya satu tes tetapi ratusan dari mereka. Saya memiliki ruang parameter, dan harus melakukan uji signifikansi untuk setiap titik. Nilai dan daftar latar belakang (populasi) dihasilkan untuk setiap kombinasi parameter. Kemudian saya memesan ini dengan nilai-p dan menemukan kombinasi parameter yang menarik. Faktanya, penemuan kombinasi parameter di mana p-val ini tinggi (tidak signifikan) juga penting.
Jadi mari kita ambil satu tes tunggal: Saya memiliki nilai yang dihitung dihasilkan dari set yang dipilih dan latar belakang nilai yang dihitung dengan memilih set pelatihan acak. Nilai yang dihitung adalah 0,35 dan set latar belakang (mungkin?) Biasanya didistribusikan dengan rata-rata 0,25 dan std yang sangat sempit (e-7). Saya sebenarnya tidak memiliki pengetahuan tentang distribusi, karena sampel dihitung dari sesuatu yang lain, mereka bukan sampel angka acak dari beberapa distribusi, jadi latar belakang adalah kata yang tepat untuk itu.
Hipotesis nol adalah bahwa "rata-rata tes sampel sama dengan nilai saya yang dihitung, sebesar 0,35". Kapan saya harus menganggap ini sebagai tes-Z atau uji-T? Saya ingin nilainya secara signifikan lebih tinggi dari rata-rata populasi, oleh karena itu ini adalah tes satu-ekor.
Saya agak bingung tentang apa yang harus dipertimbangkan sebagai sampel: Saya memiliki sampel satu (pengamatan) dan daftar latar belakang sebagai populasi ATAU sampel saya adalah daftar latar belakang dan saya membandingkannya dengan keseluruhan (tidak dicampuri) populasi yang menurut hipotesis nol harus memiliki rata-rata yang sama. Setelah ini diputuskan, tes saya menuju ke arah yang berbeda.
Jika ini adalah uji-T, bagaimana cara menghitung nilai p-nya? Saya ingin menghitung sendiri daripada menggunakan fungsi R / Python / Excel (saya sudah tahu bagaimana melakukannya) karena itu saya harus membuat formula yang benar terlebih dahulu.
Untuk mulai dengan, saya menduga T-test agak terlalu umum, karena dalam kasus saya T-test akan dikaitkan dengan ukuran sampel dan akan memiliki bentuk: mana dan s adalah , sampel std versus populasi std. Jadi saya punya dua kasus: ukuran sampel saya adalah ukuran populasi, yang saya "tebak" berarti saya berurusan dengan uji-Z, atau statistik populasi (n dan std) tidak diketahui tetapi distribusinya dapat dalam beberapa cara diperkirakan dan saya benar-benar berurusan dengan uji-T. Bagaimanapun, pertanyaan saya berikut ini adalah:Z = ˉ X
- Bagaimana cara menghitung nilai p? (Yaitu tidak menggunakan fungsi R / Python / Excel atau pencarian tabel p-value tetapi sebenarnya menghitungnya berdasarkan rumus, karena saya ingin tahu apa yang saya lakukan)
- Bagaimana cara saya menentukan ambang batas signifikansi berdasarkan ukuran sampel saya? (formula akan menyenangkan)