Apakah angka 20 ajaib?


12

Saya memiliki referensi yang menyarankan untuk mempertimbangkan ukuran sampel minimal 20 untuk distribusi pemasangan data.

Apakah ada gunanya dalam hal ini?

Terima kasih


3
Secara umum tidak, dalam situasi tertentu mungkin. Apakah Anda memiliki referensi dan apa tujuan Anda?
image_doctor

1
Saya setuju dengan @image_doctor - tidak ada alasan umum mengapa 20 pengamatan harus dianggap sebagai minimum; itu mungkin terjadi dalam keadaan yang sangat khusus.
Glen_b -Reinstate Monica

3
Nilai tunggal akan bekerja dalam beberapa kasus praktis, seperti ketika distribusi diketahui (dengan pasti) menjadi Poisson dan pengamatannya adalah jumlah yang besar. Hal itu tidak hanya memungkinkan distribusi sesuai, tetapi juga memungkinkan kemungkinan kesalahan dalam estimasi parameternya dinilai.
whuber

1
Saya percaya saya juga sudah membaca bahwa untuk distribusi normal, 30 adalah aturan praktis. Menurut saya itu adalah sesuatu yang berkaitan dengan seberapa dekat t Student dengan 30 derajat kebebasan adalah normal. Tapi itu hanya aturan praktis. Bukan sihir dalam arti yang sama dengan nilai . e
Wayne

Jawaban:


13

Begitu banyak dari ini tergantung pada distribusi yang diharapkan dan apa pertanyaan penelitian Anda. Sebagai aturan praktis, Anda harus waspada terhadap aturan praktis. Jika Anda tahu distribusi yang diharapkan, jalankan beberapa simulasi dengan ukuran berbeda dan tentukan seberapa sering simulasi sampel mencerminkan distribusi yang sebenarnya. Ini akan memberi Anda beberapa petunjuk sebagai ukuran sampel akhir yang dibutuhkan.


+1 untuk menghindari pernyataan yang ekstrim dan dogmatis.
whuber

1
+1 sebagian karena "Sebagai aturan praktis, Anda harus waspada terhadap aturan praktis."
Wolfgang

7

Saya pikir jumlah sampel sihir ukuran 1.000. Itulah yang dimiliki oleh kebanyakan jajak pendapat nasional AS, untuk menghasilkan margin kesalahan sekitar 3%: Pada kenyataannya, ukuran sampel efektif lebih rendah dari 1.000, lebih seperti 700 atau lebih, karena probabilitas seleksi yang tidak sama dan penyesuaian non-respons, yang mengarah ke margin of error 3,7%.

z0.9750.50.5/1000=1.960.158=0.031

Dengan hanya 20 pengamatan, Anda secara teknis tidak bisa mendapatkan nilai skewness dan kurtosis yang sangat tinggi (tentu saja, dinormalisasi dengan sampel standar deviasi):

|skewness|n2n1=4.58,|kurtosis|n23n+3n1=18.05.
Jika Anda menyesuaikan distribusi dengan metode momen, Anda jelas tidak dapat mengatakan distribusi normal dengan varian log yang cukup khas sama dengan 1 (distribusi pendapatan di negara-negara kesenjangan pendapatan sedang hingga tinggi; AS, Brasil, Afrika Selatan, Rusia semua memiliki varian pendapatan log yang lebih tinggi), karena memiliki kurtosis yang sangat besar yaitu 111. Tentu saja akan konyol untuk memasukkan distribusi lognormal dengan metode momen, tetapi saya hanya ingin menunjukkan bahwa beberapa distribusi dunia nyata akan kemungkinan lebih rumit dari apa yang bisa digambarkan dengan 20 pengamatan.

Pandangan lain tentang pemasangan distribusi dapat diambil melalui estimasi kepadatan kernel: untuk sampel ukuran , aturan paling populer memberikan bandwidth yang secara efektif menjangkau seluruh distribusi menggunakan kernel Gaussian. Dengan kata lain, sebagian besar sampel ukuran 20 akan terlihat normal jika Anda menjalankan estimasi kepadatan kernel di seluruh mereka, kecuali mereka jelas memiliki kurtosis yang terkenal (yang kemudian berarti bahwa ada beberapa pengamatan terpencil yang akan muncul sebagai benjolan terpisah pada kepadatan kernel. merencanakan).n=20

h=1.06σ^n1/5=0.58σ^

Saya tidak mengikuti relevansi batas momen-momen sampel. Tentu saja Anda bisa mendapatkan perkiraan skewness dan kurtosis yang sangat tinggi dalam sampel. Cobalah: ketika adalah sampel mean dan SD sampel, maka diperkirakan skewness ketika pencocokan saat-saat dalam distribusi lognormal adalah . Hasilkan sampel dari distribusi dengan SD geometris besar ( akan bekerja) dan Anda akan mendapatkan perkiraan besar kemiringan. Jadi bagaimana jika kemiringan sampel mentah kecil? s ( s / m ) ( 3 + ( s / m ) 2 ) 20 2ms(s/m)(3+(s/m)2)202
whuber

1
Tautan wajib ke "Sindrom Kekuatan-Sepuluh" dalam konteks menggunakan 1000 sebagai ukuran sampel (dalam konteks statistik yang terkait dengan pemrograman, tetapi berlaku di tempat lain): zedshaw.com/essays/programmer_stats.html
Gary S. Weaver

1
@whuber, kamu terlalu pintar, jangan tersinggung. Kebanyakan orang akan menghitung skewness sebagai momen data, bukan melalui asumsi parametrik seperti yang baru saja Anda lakukan. Sekarang, jika saya berkata, "Misalkan Anda menyesuaikan distribusi Pearson dengan metode momen" - apakah argumen ini relevan?
Tugas

Ya, itu akan relevan dalam banyak kasus. Saya mengikuti saran Anda agar sesuai dengan distribusi lognormal menggunakan metode saat dan memperoleh kemiringan besar - tidak mengherankan di sana. Ini karena saya hanya mencocokkan dua momen pertama, membiarkan yang ketiga menjadi seperti apa adanya. Jika saya mengikuti prosedur yang sama dengan keluarga distribusi dua atau lebih sedikit parameter yang memungkinkan momen ketiga besar secara sewenang-wenang, saya pikir saya akan melihat fenomena yang sama. Dengan keluarga Pearson, yang memiliki lebih dari dua parameter, kami kemungkinan akan mencoba untuk mencocokkan kemiringan empiris, sehingga membatasi nilainya.
Whuber

2

Nggak. Tidak jauh.

Pikirkan tentang hal ini seperti ini: jika Anda memiliki ruang miliaran dimensi (kemanusiaan) dan Anda menarik 20 sampel menggunakan metode apa pun (20 orang), dapatkah Anda menggunakan informasi yang membuatnya dipahami dengan baik oleh setiap orang di planet ini? Tidak jauh. Ada 100 miliar bintang di galaksi Bima Sakti. Dengan memilih (secara acak) 20 di antaranya dapatkah Anda memahami semua astronomi galaksi? Tidak mungkin.

Dalam ruang 1-d ada beberapa heuristik, sebagian besar aturan praktis yang dapat membantu, yang menggambarkan berapa banyak pengukuran yang ingin Anda ambil. Mereka termasuk berbagai tingkat utilitas dan pembenaran tetapi dalam beberapa hal lebih baik dipertahankan daripada "20". Mereka termasuk "5 pengukuran per variabel dalam persamaan fit Anda", "setidaknya 35 sampel fungsi kepadatan Gaussian", dan "setidaknya 300 sampel fungsi binomial". Ahli statistik sungguhan dan bukan pembom nerd seperti saya akan dapat mengaitkan interval kepercayaan tertentu dan ketidakpastian dari prinsip pertama dan tanpa kalkulator.

Jika Anda menggunakan aturan "5 pengukuran per parameter dalam persamaan fit Anda" dan Anda ingin mencocokkan kepadatan kumulatif permukaan bi-kubik 2 dimensi melengkung dalam hal distribusi ketinggian Anda akan memiliki sistem yang mendasarinya , rasio polinomial orde 5 ke kubik. Itu akan memiliki 6 + 4 = 10 koefisien. Jika Anda mencoba menyesuaikan 10 nilai parameter Anda menggunakan 2 pengukuran per parameter, atau dengan menggunakan 20 pengukuran, maka Anda akan melanggar heuristik ini. Heuristik ini merekomendasikan minimal 10 * 5 = 50 pengukuran.a3r3+a2r2+a1r+a0a1r+a0dr

Harap ingat "yang terbaik" adalah ide yang tidak berarti tanpa memiliki "ukuran kebaikan". Apa jalan terbaik? Jika Anda pergi ke malapetaka, mungkin yang sangat panjang dan menyenangkan. Jika Anda akan pergi ke penobatan Anda sendiri, mungkin yang pendek dan megah. Jika Anda berjalan melintasi padang pasir, tempat teduh yang sejuk. Berapa jumlah sampel "terbaik"? Sangat tergantung pada masalah Anda bahwa itu tidak dapat mulai dijawab dengan otoritas sebelumnya. Mereka semua? Sebanyak mungkin? Itu hanya masuk akal. Ya itu seperti sebagian mati atau hamil. Menjadi tidak masuk akal sebagian adalah konsekuensi dari masalah yang sangat tidak jelas.

Jika Anda mencoba memperkirakan aliran udara di atas pesawat secara akurat? Anda mungkin perlu beberapa juta pengukuran untuk masuk ke ball-park. Jika Anda ingin tahu seberapa tinggi Anda, satu atau dua orang bisa melakukan pekerjaan itu.

Ini tidak memunculkan poin penting dari "spanning the space" dan "sampling di lokasi yang meminimalkan varians dalam estimasi parameter" tetapi pertanyaan itu menyarankan jawaban tingkat yang lebih baru akan relevan. Hal-hal ini membutuhkan mengetahui lebih banyak tentang sifat masalah sebelum dapat diimplementasikan.

Catatan: diedit untuk meningkatkan per saran.


1
Anda tampaknya telah membaca "minimum" dalam pertanyaan sebagai "maksimum" atau "cukup." Tidak ada yang Anda tulis tampaknya bertentangan dengan aturan praktis minimal 20.
whuber

2
@whuber, saya bekerja di antara orang-orang yang menganggap pengukuran tambahan itu mahal, dan jika saya memberi mereka "jumlah sampel minimum" mereka tidak menganggapnya sebagai ketidaksetaraan di mana jumlah sampel potensial lebih besar dari itu. Mereka menganggapnya sebagai batasan untuk masalah optimasi meminimalkan biaya, dan mencoba untuk beroperasi hanya pada nilai itu. Ini adalah produk dari lingkungan saya.
EngrStudent

1

Mungkin untuk konteks di mana Anda melakukan uji-t atau ANOVAR - konteks yang cukup umum dalam aplikasi statistik dasar - ini berada di sekitar ukuran sampel yang Anda butuhkan untuk masing-masing kelompok agar dapat memiliki banyak kepercayaan pada rata-rata setiap kelompok sekitar terdistribusi secara normal (sesuai dengan teorema limit pusat) ketika distribusi dapat dianggap lebih atau kurang unimodal & tidak terlalu memuncak. Dua puluh & bukan sembilan belas atau dua puluh satu karena angka bulat.


0

Periksa Halaman Kekuatan dan Ukuran Sampel Russ Lenth untuk beberapa artikel tentang subjek tersebut (di bagian Saran di bagian tengah halaman).

Jumlah minimum individu dalam sampel Anda sangat bervariasi sesuai dengan ukuran populasi, jumlah dimensi (jika Anda membagi data dalam kategori) dan ukuran (jika Anda mengambil tindakan berkelanjutan tentang sampel individu) yang Anda ambil, ukuran alam semesta Anda, teknik analisis yang ingin Anda gunakan (ini adalah hal yang sangat penting - teknik didefinisikan selama perencanaan penelitian atau selama desain eksperimental , tidak pernah setelah), dan kompleksitas ditunjukkan oleh studi sebelumnya.

Dan 20 tidak cukup untuk penelitian serius di luar mata pelajaran "penyakit langka" dan "psikologi eksperimental" (psikologi seperti yang didefinisikan Popper dalam karyanya).

Sempurnakan jawaban berdasarkan komentar di bawah ini:

Dan 20 tidak cukup untuk penelitian serius apa pun di luar mata pelajaran "penyakit langka" dan "psikologi eksperimental" (psikologi seperti yang didefinisikan Popper dalam karyanya) yang melibatkan pemasangan distribusi probabilitas .

Dan tidak, Anda tidak harus terus meracuni orang untuk mendapatkan ukuran sampel yang besar. Tes Common Sense dan Sequential memerintahkan Anda untuk berhenti.


3
Saya pikir itu terlalu ekstrim untuk memberikan pernyataan bahwa sampel 20 adalah "tidak cukup untuk penelitian serius." Ini bertentangan dengan pernyataan Anda sebelumnya bahwa ukuran sampel yang sesuai bervariasi sesuai dengan tujuan, populasi, dan sebagainya. Dalam beberapa kasus satu hasil pemalsuan cukup untuk membunuh seluruh teori.
whuber

1
Studi kasus dan penelitian kualitatif dapat dilakukan dengan baik dengan 1-5 peserta.
Behacad

Ok, tambahkan "studi kasus" dan "kelompok fokus" ke daftar :) Ini termasuk dalam apa yang saya katakan Popper disebut "psikologi eksperimental" tho.
Lucas Gallindo

4
Anda kemudian sebaiknya menambahkan astronomi, kedokteran, biologi, kimia, ... Dengan kata lain, sama buruknya dengan menyatakan bahwa 20 adalah "tidak cukup" seperti halnya menyatakan bahwa itu cukup baik. Sebenarnya, itu mungkin lebih buruk. Bayangkan percobaan keamanan makanan di mana delapan subjek pertama yang diberikan suplemen gizi meninggal karena efek samping yang tidak terduga. Apakah Anda menganjurkan pengujian lanjutan berdasarkan pernyataan "20 tidak cukup"?
whuber
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.