Sebagai contoh, statistik uji yang dihitung untuk uji ANOVA dibandingkan dengan distribusi-F, sedangkan sarana perbandingan uji-t membandingkan statistik uji dengan distribusi-t.
Sebagai contoh, statistik uji yang dihitung untuk uji ANOVA dibandingkan dengan distribusi-F, sedangkan sarana perbandingan uji-t membandingkan statistik uji dengan distribusi-t.
Jawaban:
Jawaban lengkap untuk pertanyaan Anda akan menjadi kursus statistik matematika-teori semester penuh (yang akan menjadi ide yang baik untuk Anda ambil jika Anda benar-benar tertarik).
Tetapi serangkaian jawaban pendek dan parsial adalah:
Secara umum kita mulai dengan distribusi normal, telah ditemukan sebagai perkiraan yang masuk akal untuk banyak situasi dunia nyata dan teorema Central Limit (dan lainnya) memberi tahu kita bahwa itu adalah perkiraan yang lebih baik ketika melihat cara sampel acak sederhana ( ukuran sampel yang lebih besar mengarah pada perkiraan yang lebih baik oleh normal). Jadi normal sering merupakan distribusi default untuk dipertimbangkan jika tidak ada alasan untuk percaya bahwa itu tidak akan menjadi perkiraan yang masuk akal. Meskipun dengan komputer modern sekarang lebih mudah untuk menggunakan alat non-parametrik atau lainnya dan kita tidak perlu terlalu bergantung pada normal (tetapi sejarah / inersia / dll. Membuat kita menggunakan metode berbasis normal).
Jika Anda kuadratkan variabel yang berasal dari distribusi normal standar maka itu mengikuti distribusi Chi-squared. Jika Anda menambahkan variabel bersama-sama dari Chi-kuadrat Anda mendapatkan Chi-kuadrat (derajat kebebasan berubah), sehingga itu berarti bahwa varians (diskalakan) mengikuti Chi-kuadrat.
Ini juga bekerja bahwa fungsi rasio kemungkinan mengikuti distribusi Chi-kuadrat asimptotik jika nol benar dan asumsi lain berlaku.
Normal standar dibagi dengan akar kuadrat dari chi-kuadrat (dan beberapa parameter penskalaan) mengikuti distribusi-t, sehingga t-statistik umum (di bawah hipotesis nol) mengikuti t.
Rasio 2 kuadrat-KU (dibagi oleh derajat kebebasan dan pertimbangan lainnya) mengikuti distribusi-F. Uji anova F didasarkan pada rasio 2 perkiraan varians yang sama (di bawah nol) dan karena varians mengikuti Chi-kuadrat, rasio mengikuti F (di bawah nol dan asumsi memegang).
Orang pintar membuat aturan ini sehingga kita semua bisa menerapkannya. Kursus matematika / stat penuh akan memberikan lebih banyak sejarah dan derivasi (dan mungkin lebih banyak alternatif), ini hanya dimaksudkan sebagai tinjauan singkat dari tes dan distribusi yang lebih umum.
Cara berbeda untuk menjawab pertanyaan Anda adalah pemikiran berurutan berikut yang ingin saya ilustrasikan dengan contoh sederhana:
1) Apa hipotesis nol yang terkait dengan pertanyaan yang menarik? Misalnya di AS, pendapatan rata-rata adalah $ 6000 per bulan.
2) Bagaimana kita bisa mengukur penyimpangan dari hipotesis nol berdasarkan data yang tersedia? Percobaan pertama:Pendapatan rata-rata. Semakin jauh dari 6000, semakin tidak masuk akal hipotesis nol dan semakin kita harus menolaknya.
3) Temukan distribusi jika hipotesis nol itu benar. "Distribusi nol" ini adalah dasar untuk keputusan pengujian. Dalam contoh kita, jika sampel besar, Teorema Batas Pusat memberi tahu kita hal itu kira-kira terdistribusi normal dengan rata-rata 6000 dan standar deviasi dimana adalah standar deviasi sebenarnya dari pendapatan di AS. Kita tahu dan dapat diperkirakan dengan standar deviasi sampel .
Pada prinsipnya, kita sekarang dapat bersandar dan menggunakan hasil ini untuk menemukan keputusan tes. Namun, karena kami ahli statistik sangat baik, kami biasanya mencoba memodifikasi statistik uji untuk menjaga distribusi nol bebas dari sebanyak mungkin informasi yang bergantung pada data. Dalam contoh sederhana kita, kita bisa menggunakan
Hanya ada tiga distribusi berdasarkan kenyataan. (1) Binomial (2) Multinomial (3) aproksator Abraham De Moivre terhadap binomial. Distribusi lainnya adalah ekspresi 'turunan' dengan rentang dinamis yang sangat terbatas dan sangat sedikit kontak dengan kenyataan. Contoh. Seorang ahli statistik akan memberi tahu Anda data Anda sesuai dengan Distribusi Poisson. Dia benar-benar akan percaya distribusi Poisson memiliki semacam realitas 'berdiri sendiri'. Sebenarnya, Distribusi Poisson mendekati binomial untuk kemiringan yang sangat kecil dan sangat besar. Sekarang kita semua memiliki komputer, tidak ada alasan untuk memanggil aproksimator. Tapi, sayangnya, kebiasaan lama sulit.