Bagaimana ahli statistik menentukan distribusi mana yang sesuai untuk uji statistik yang berbeda?

8

Sebagai contoh, statistik uji yang dihitung untuk uji ANOVA dibandingkan dengan distribusi-F, sedangkan sarana perbandingan uji-t membandingkan statistik uji dengan distribusi-t.

hypothesis-testing distributions

— Stu
sumber

1

Untuk gambaran umum, lihat halaman 3 makalah ini . Ini berisi bagan yang menggambarkan hubungan antara banyak distribusi. Cukup rapi.

— COOLSerdash

Pada satu tingkat, jawabannya sederhana: distribusinya adalah statistik uji di bawah hipotesis nol. Menemukannya hanyalah perhitungan. Bagian - bagian yang sulit datang dengan model probabilitas yang cocok untuk masalah, memunculkan fungsi kehilangan, dan menemukan statistik uji yang menghasilkan tes yang baik. Banyak distribusi, termasuk Normal,

t

$t$ , dan

χ^{2}

$\chi^2$ , sebenarnya paling sering muncul sebagai perkiraan asimptotik terhadap distribusi aktual (dan di situlah terletak bagian terpisah dari jawaban yang baik).

— whuber

12

Jawaban lengkap untuk pertanyaan Anda akan menjadi kursus statistik matematika-teori semester penuh (yang akan menjadi ide yang baik untuk Anda ambil jika Anda benar-benar tertarik).

Tetapi serangkaian jawaban pendek dan parsial adalah:

Secara umum kita mulai dengan distribusi normal, telah ditemukan sebagai perkiraan yang masuk akal untuk banyak situasi dunia nyata dan teorema Central Limit (dan lainnya) memberi tahu kita bahwa itu adalah perkiraan yang lebih baik ketika melihat cara sampel acak sederhana ( ukuran sampel yang lebih besar mengarah pada perkiraan yang lebih baik oleh normal). Jadi normal sering merupakan distribusi default untuk dipertimbangkan jika tidak ada alasan untuk percaya bahwa itu tidak akan menjadi perkiraan yang masuk akal. Meskipun dengan komputer modern sekarang lebih mudah untuk menggunakan alat non-parametrik atau lainnya dan kita tidak perlu terlalu bergantung pada normal (tetapi sejarah / inersia / dll. Membuat kita menggunakan metode berbasis normal).

Jika Anda kuadratkan variabel yang berasal dari distribusi normal standar maka itu mengikuti distribusi Chi-squared. Jika Anda menambahkan variabel bersama-sama dari Chi-kuadrat Anda mendapatkan Chi-kuadrat (derajat kebebasan berubah), sehingga itu berarti bahwa varians (diskalakan) mengikuti Chi-kuadrat.

Ini juga bekerja bahwa fungsi rasio kemungkinan mengikuti distribusi Chi-kuadrat asimptotik jika nol benar dan asumsi lain berlaku.

Normal standar dibagi dengan akar kuadrat dari chi-kuadrat (dan beberapa parameter penskalaan) mengikuti distribusi-t, sehingga t-statistik umum (di bawah hipotesis nol) mengikuti t.

Rasio 2 kuadrat-KU (dibagi oleh derajat kebebasan dan pertimbangan lainnya) mengikuti distribusi-F. Uji anova F didasarkan pada rasio 2 perkiraan varians yang sama (di bawah nol) dan karena varians mengikuti Chi-kuadrat, rasio mengikuti F (di bawah nol dan asumsi memegang).

Orang pintar membuat aturan ini sehingga kita semua bisa menerapkannya. Kursus matematika / stat penuh akan memberikan lebih banyak sejarah dan derivasi (dan mungkin lebih banyak alternatif), ini hanya dimaksudkan sebagai tinjauan singkat dari tes dan distribusi yang lebih umum.

— Greg Snow
sumber

Terima kasih, ini persis apa yang saya cari. Saya pikir saya akan menunda kursus statistik teori matematika untuk saat ini.

— Stu

3

Cara berbeda untuk menjawab pertanyaan Anda adalah pemikiran berurutan berikut yang ingin saya ilustrasikan dengan contoh sederhana:

1) Apa hipotesis nol yang terkait dengan pertanyaan yang menarik? Misalnya di AS, pendapatan rata-rata adalah $ 6000 per bulan.

2) Bagaimana kita bisa mengukur penyimpangan dari hipotesis nol berdasarkan data yang tersedia? Percobaan pertama: $T =$ Pendapatan rata-rata. Semakin jauh dari 6000, semakin tidak masuk akal hipotesis nol dan semakin kita harus menolaknya.

3) Temukan distribusi $T$ jika hipotesis nol itu benar. "Distribusi nol" ini adalah dasar untuk keputusan pengujian. Dalam contoh kita, jika sampel besar, Teorema Batas Pusat memberi tahu kita hal itu $T$ kira-kira terdistribusi normal dengan rata-rata 6000 dan standar deviasi $\sigma/\sqrt{n}$ dimana $\sigma$ adalah standar deviasi sebenarnya dari pendapatan di AS. Kita tahu $n$ dan $\sigma$ dapat diperkirakan dengan standar deviasi sampel $\hat \sigma$ .

Pada prinsipnya, kita sekarang dapat bersandar dan menggunakan hasil ini untuk menemukan keputusan tes. Namun, karena kami ahli statistik sangat baik, kami biasanya mencoba memodifikasi statistik uji untuk menjaga distribusi nol bebas dari sebanyak mungkin informasi yang bergantung pada data. Dalam contoh sederhana kita, kita bisa menggunakan

T^{'} = (T - 6000) / (\hat{σ} / \sqrt{n})

$T' = (T-6000)/(\hat \sigma/\sqrt{n})$ dari pada

T

$T$ . Statistik pengujian yang dimodifikasi ini

T^{'}

$T'$ selalu mendekati standar normal jika hipotesis nol benar. Tidak peduli ukuran sampel, mean hipotesis dan deviasi standar, keputusan tes selalu didasarkan pada nilai kritis yang sama (seperti

\pm 1.96

$\pm 1.96$ ). Ini adalah Z-test satu sampel yang terkenal.

— Michael M.
sumber

-2

Hanya ada tiga distribusi berdasarkan kenyataan. (1) Binomial (2) Multinomial (3) aproksator Abraham De Moivre terhadap binomial. Distribusi lainnya adalah ekspresi 'turunan' dengan rentang dinamis yang sangat terbatas dan sangat sedikit kontak dengan kenyataan. Contoh. Seorang ahli statistik akan memberi tahu Anda data Anda sesuai dengan Distribusi Poisson. Dia benar-benar akan percaya distribusi Poisson memiliki semacam realitas 'berdiri sendiri'. Sebenarnya, Distribusi Poisson mendekati binomial untuk kemiringan yang sangat kecil dan sangat besar. Sekarang kita semua memiliki komputer, tidak ada alasan untuk memanggil aproksimator. Tapi, sayangnya, kebiasaan lama sulit.

— pengguna10739
sumber

1

Tesis yang menarik dan menggugah pikiran, tetapi pada akhirnya kurang membantu dalam konteks ini. Terlebih lagi, kebenarannya tampaknya bertumpu pada gagasan istimewa dan terbatas tentang "berbasis realitas." (Untuk membenarkan dugaan terbatas itu, pertimbangkan - di antara banyak contoh - apa yang diperlukan untuk menurunkan distribusi seperti hypergeometrik atau Benford dari tiga distribusi yang disebutkan di sini.)

— whuber

Saya tidak melihat bagaimana komputer mengurangi kebutuhan untuk memperkirakan model yang mendasari proses yang kompleks. Orang tidak menggunakan regresi Poisson karena data mereka dihasilkan dari sejumlah besar uji coba Bernoulli di mana probabilitas keberhasilan menurun sebanding dengan jumlah uji coba dan mereka hanya ingin menyelamatkan komputer mereka dari masalah. Mereka menggunakannya karena ini adalah model sederhana untuk menguji bagaimana kovariat mempengaruhi rata-rata hasil hitungan. Seorang praktisi yang cerdik memeriksa asumsi model mereka tetapi, sampai komputer menjadi paranormal, kami akan menggunakan model untuk mendekati kenyataan.

— Makro

Dalam ilmu kehidupan, penting untuk menguji set data terhadap distribusi binomial. Melakukan hal itu memberi kita ukuran jumlah total 'sumber kesalahan' yang sesuai dengan jumlah gen yang memengaruhi proses. Distribusi Poisson, antara lain, mengaburkan hubungan ini.

— user10739