Saya merasakan dua pertanyaan. Satu tentang ukuran sampel (25%, mengapa bukan mayoritas) dan satu lagi tentang teknik pengambilan sampel (apakah itu benar-benar acak, sampel 25% secara acak di seluruh perusahaan, sampel 25% secara acak di setiap departemen, atau menggunakan beberapa distribusi lainnya).
1) Ukuran sampel tidak perlu menjadi mayoritas. Ukuran sampel yang dibutuhkan dapat berkisar antara 0 dan 100% tergantung pada akurasi yang diperlukan untuk rasio kepercayaan atau kemungkinan yang diberikan.
Kepastian 100% tidak pernah diperoleh (juga tidak dengan subset 50% atau lebih besar). Mencapai akurasi tinggi seperti itu juga bukan merupakan titik pengambilan sampel dan estimasi.
Lihat lebih lanjut tentang ukuran sampel: https://en.wikipedia.org/wiki/Sample_size_determination
Jika Anda mendapatkan hukum angka besar, Anda mungkin juga memiliki ide intuitif.
Distribusi rata-rata dari semua himpunan bagian yang mungkin (dan sampel Anda akan menjadi salah satu dari mereka), akan menjadi lebih kecil, dan lebih dekat dengan rata-rata distribusi asli, jika ukuran himpunan bagian meningkat. Jika Anda memilih satu orang maka ada kemungkinan masuk akal bahwa Anda menemukan pengecualian, tetapi untuk menemukan pengecualian yang sama di arah yang sama dua kali menjadi lebih kecil kemungkinannya. Dan seterusnya, semakin besar ukuran subset sampel semakin kecil kemungkinan subset yang luar biasa.
n
Catatan penting! Perkiraan Anda tidak akan tergantung pada ukuran populasi dari mana Anda sampel, tetapi pada distribusi populasi itu.
Dalam hal departemen ukuran 500 Anda. Penyimpangan rata-rata dari himpunan bagian acak (ukuran 125) akan menjadi 11 kali lebih kecil dari penyimpangan asli. Perhatikan bahwa kesalahan dalam pengukuran (penyimpangan rata-rata dari himpunan bagian yang dipilih secara acak), tidak tergantung pada ukuran departemen. Bisa jadi 500, 5000, atau 50000, dalam semua kasus perkiraan itu tidak akan terpengaruh selama mereka memiliki distribusi yang sama (sekarang departemen kecil mungkin memiliki beberapa distribusi aneh, tetapi itu mulai menghilang untuk kelompok yang lebih besar).
2) Pengambilan sampel tidak perlu sepenuhnya acak. Anda dapat memperhitungkan demografi.
Akhirnya, Anda akan memperlakukan masing-masing departemen secara terpisah dalam jenis analisis ini dan mengoreksi variasi di antara departemen-departemen tersebut dan bagaimana Anda mengambil sampel dalam departemen-departemen yang berukuran berbeda.
Dalam koreksi ini ada dua perbedaan penting. Orang mungkin menganggap distribusi di antara kelompok sebagai variabel acak atau tidak. Jika Anda memperlakukannya sebagai variabel acak maka analisisnya menjadi lebih kuat (mengeluarkan beberapa derajat kebebasan dalam model) tetapi mungkin asumsi yang salah jika kelompok yang berbeda tidak dapat ditukar sebagai entitas acak tanpa efek spesifik (yang tampaknya menjadi kasus Anda, seperti yang saya bayangkan bahwa departemen memiliki fungsi yang berbeda dan mungkin memiliki banyak sentimen berbeda yang tidak acak dalam hubungannya dengan departemen).