Pengacakan dalam sampel non-acak masih dapat menunjukkan efek yang tidak cukup dijelaskan oleh variasi acak.
Sebagai contoh, bayangkan kita memiliki populasi dengan dua subkelompok yang tidak dikenal (dengan karakteristik yang agak berbeda *) dengan ukuran yang kira-kira sama, tetapi sampel Anda adalah non-acak, memberikan pemisahan 80/20. Mari kita bayangkan 2 kelompok perlakuan dengan ukuran yang sama. Pengacakan (setidaknya dengan ukuran sampel yang layak) akan cenderung memberikan hampir 80/20 split di setiap kelompok, sehingga efek pengobatan adalah karena pengobatan, daripada alokasi yang tidak sama dari kelompok heterogen untuk perawatan.
* Mengarah ke baseline yang berbeda, katakanlah
Masalahnya muncul ketika Anda ingin memperluas kesimpulan ke beberapa populasi target selain dari apa sampel Anda mewakili (penyeleksi diri); ini memerlukan asumsi / argumen yang Anda mungkin tidak memiliki bukti (seperti mengasumsikan bahwa perbedaan perlakuan akan konsisten untuk semua himpunan bagian dari populasi).
Untuk situasi yang sama, bayangkan menguji obat hipertensi hanya pada pria, dibandingkan dengan pengobatan standar dan plasebo. Asumsikan pria secara acak diacak ke dalam kelompok perlakuan. Efek pengobatan akan nyata dalam arti bahwa itu benar-benar menggambarkan efek pada pria. Kesulitan akan datang ketika mencoba memperluas kesimpulan itu kepada wanita .
Jadi jika mereka dilakukan dengan benar dan terpisah secara acak dari rekrutmen, efek signifikan yang diamati akan seperti apa kelihatannya, tetapi itu akan berlaku untuk apa yang Anda sampel sebenarnya, tidak harus seperti apa target yang Anda inginkan - melewati celah antara keduanya membutuhkan argumen yang cermat; argumen seperti itu sering tidak ada.
Ketika saya masih mahasiswa, sangat umum untuk eksperimen psikologi dilakukan pada mahasiswa psikologi, yang diharapkan untuk menjadi sukarelawan selama beberapa jam percobaan semacam itu (ini mungkin masih terjadi tetapi saya tidak memiliki kontak teratur dengan psikolog). yang melakukan percobaan lagi). Dengan pengacakan untuk pengobatan, kesimpulannya mungkin valid (tergantung pada apa yang telah dilakukan) tetapi akan berlaku untuk populasi lokal sarjana psikologi pilihan sendiri (dalam hal itu mereka umumnya memilih eksperimen mana yang akan didaftar), yang sangat jauh dari sampel acak dari populasi yang lebih luas.