Mengapa beberapa (jika tidak semua) tes hipotesis parametrik menggunakan pengambilan sampel acak?

Tes seperti Z, t, dan beberapa lainnya mengasumsikan bahwa data didasarkan pada pengambilan sampel acak. Mengapa?

Misalkan saya sedang melakukan penelitian eksperimental, di mana saya lebih peduli untuk validitas internal daripada yang eksternal. Jadi, jika sampel saya mungkin sedikit bias, oke, karena saya telah menerima untuk tidak menyimpulkan hipotesis untuk seluruh populasi. Dan pengelompokan akan tetap acak, yaitu, saya akan memilih untuk kenyamanan peserta sampel, tetapi saya akan secara acak menugaskan mereka ke kelompok yang berbeda.

Mengapa saya tidak bisa mengabaikan asumsi ini?

— Bruno
sumber

Jika teknik pengambilan sampel menimbulkan bias, maka itu bukan 'acak'. Jika tidak ada bias maka itu adalah 'acak' (untuk beberapa definisi acak ;-). Saya sudah memiliki skema pengambilan sampel yang hanya mengambil setiap sampel ke-7 untuk membuat ukuran sampel yang cocok dengan sampel counter. Namun saya tahu bahwa tidak ada aspek khusus untuk pemilihan itu, jadi apa yang dapat dianggap sebagai proses pengambilan sampel non-acak masih efektif secara acak. Ini sama dengan memilih bola 1,2,3,4,5,6 pada lotre. Itu hanya acak seperti urutan lainnya.

— Philip Oakley

@PhilipOakley: memilih bola 1,2,3,4,5,6 pada lotre memberi Anda peluang yang sama untuk menang seperti pemilihan lainnya, tetapi mengurangi kemenangan yang Anda harapkan karena Anda lebih cenderung harus berbagi hadiah dengan orang lain yang punya ide yang sama

— Henry

Sampling sistematis, seperti dijelaskan oleh @Philip, sering dianalisis seolah-olah itu menghasilkan sampel acak sederhana, tetapi memiliki jebakan. Misalnya, jika Anda mengukur proses pembuatan setiap hari dan sampel setiap pengukuran ketujuh, Anda akan dikacaukan hasil Anda dengan efek hari-of-the-minggu, karena (jelas) Anda akan mengambil sampel pada hari yang sama setiap minggu. Anda perlu bekerja lebih keras untuk memikirkan dan mengatasi kehalusan seperti itu ketika berhadapan dengan sampel non-acak.

— whuber

@whuber, Tentu saja. Seseorang harus berpikir keras (dan secara luas) tentang hal-hal ini !! Dalam kasus saya, saya memiliki jam video, dengan ratusan acara, dengan kesenjangan panjang di antara, sehingga diperlukan untuk mengurangi ukuran data dari non-event yang ditetapkan untuk regresi logistik sederhana (setiap frame dipertimbangkan secara independen, sedikit perubahan di antara frame), jadi menjatuhkan banyak frame non-event adalah wajar. Aspek urutan waktu dipertimbangkan secara terpisah.

— Philip Oakley

@ Pilip Menariknya, pada saat yang hampir bersamaan Anda menulis komentar tentang keacakan yang tidak ada, NIST mengeluarkan siaran pers yang mengklaim hal itu . Sebuah akun muncul di edisi Nature (4 April 2018) hari ini .

— whuber

Jawaban:

Jika Anda tidak membuat kesimpulan untuk kelompok yang lebih luas dari sampel Anda yang sebenarnya, maka tidak ada aplikasi tes statistik di tempat pertama, dan pertanyaan "bias" tidak muncul. Dalam hal ini Anda hanya akan menghitung statistik deskriptif dari sampel Anda, yang diketahui. Demikian pula, tidak ada pertanyaan tentang model "validitas" dalam kasus ini - Anda hanya mengamati variabel dan mencatat nilainya, dan deskripsi aspek dari nilai-nilai tersebut.

Setelah Anda memutuskan untuk melampaui sampel Anda, untuk membuat kesimpulan tentang beberapa kelompok yang lebih besar, maka Anda akan memerlukan statistik dan Anda perlu mempertimbangkan masalah-masalah seperti bias pengambilan sampel, dll. Dalam aplikasi ini, pengambilan sampel acak menjadi properti yang berguna untuk membantu mendapatkan keandalan. kesimpulan dari kelompok kepentingan yang lebih luas. Jika Anda tidak memiliki pengambilan sampel acak (dan Anda tidak tahu probabilitas sampel Anda berdasarkan populasi) maka menjadi sulit / tidak mungkin untuk membuat kesimpulan yang dapat diandalkan tentang populasi.

— Ben - Pasang kembali Monica
sumber

Dalam penelitian ilmiah sungguhan, sangat jarang memiliki data yang berasal dari true random sampling. Data hampir selalu merupakan sampel kenyamanan. Ini terutama memengaruhi populasi yang dapat Anda generalisasikan. Yang mengatakan, bahkan jika mereka adalah sampel kenyamanan, mereka memang datang dari suatu tempat, Anda hanya perlu jelas tentang di mana dan batasan-batasan yang menyiratkan. Jika Anda benar-benar percaya bahwa data Anda tidak mewakili apa pun, maka studi Anda tidak akan bermanfaat pada level apa pun, tetapi itu mungkin tidak benar ¹ . Dengan demikian, sering kali masuk akal untuk menganggap sampel Anda diambil dari suatu tempat dan menggunakan tes standar ini, setidaknya dalam pengertian lindung nilai atau kualifikasi.

Namun, ada filosofi pengujian yang berbeda, yang berpendapat bahwa kita harus menjauh dari asumsi-asumsi itu dan tes yang bergantung padanya. Tukey adalah pendukung ini. Sebaliknya, sebagian besar penelitian eksperimental dianggap (secara internal) valid karena unit studi (misalnya, pasien) secara acak ditugaskan ke lengan. Dengan ini, Anda dapat menggunakan tes permutasi , yang sebagian besar hanya menganggap pengacakan dilakukan dengan benar. Pertimbangan yang terlalu mengkhawatirkan tentang hal ini adalah bahwa tes permutasi biasanya akan menunjukkan hal yang sama dengan tes klasik yang sesuai, dan lebih banyak pekerjaan yang harus dilakukan. Jadi sekali lagi, tes standar dapat diterima.

_{1. Untuk lebih lanjut di bawah ini, mungkin membantu untuk membaca jawaban saya di sini: Mengidentifikasi populasi dan sampel dalam suatu penelitian .}

— gung - Pasang kembali Monica
sumber

Tes seperti Z, t, dan beberapa lainnya didasarkan pada distribusi sampling yang diketahui dari statistik yang relevan. Distribusi sampling tersebut, seperti yang umumnya digunakan, didefinisikan untuk statistik yang dihitung dari sampel acak.

Terkadang dimungkinkan untuk merancang distribusi pengambilan sampel yang relevan untuk pengambilan sampel non-acak, tetapi secara umum itu mungkin tidak mungkin.

— Michael Lew
sumber