Sebagai prinsip umum, ukuran sampel kecil tidak akan meningkatkan tingkat kesalahan Tipe I karena alasan sederhana bahwa tes diatur untuk mengontrol tingkat Tipe I. (Ada beberapa pengecualian teknis kecil yang terkait dengan hasil diskrit, yang dapat menyebabkan laju nominal Tipe I tidak tercapai persis terutama dengan ukuran sampel yang kecil.)
Ada prinsip penting di sini: jika tes Anda memiliki ukuran yang dapat diterima (= tingkat Tipe I nominal) dan daya yang dapat diterima untuk efek yang Anda cari, maka bahkan jika ukuran sampel kecil itu ok.
Bahayanya adalah jika kita tidak tahu sedikit tentang situasi - mungkin ini semua data yang kita miliki - maka kita mungkin khawatir tentang kesalahan "Tipe III": yaitu, model salah spesifikasi. Mereka mungkin sulit untuk diperiksa dengan set sampel kecil.
Sebagai contoh praktis dari interaksi ide, saya akan berbagi cerita. Dahulu saya diminta untuk merekomendasikan ukuran sampel untuk mengkonfirmasi pembersihan lingkungan. Ini selama fase pra-pembersihan sebelum kami memiliki data. Rencana saya menyerukan untuk menganalisis sekitar 1000 sampel yang akan diperoleh selama pembersihan (untuk memastikan bahwa cukup tanah telah dihilangkan di setiap lokasi) untuk menilai rata-rata pasca pembersihan dan variasi konsentrasi kontaminan. Kemudian (untuk sangat menyederhanakan), saya katakan kami akan menggunakan formula buku teks - berdasarkan daya yang ditentukan dan ukuran tes - untuk menentukan jumlah sampel konfirmasi independen yang akan digunakan untuk membuktikan pembersihan berhasil.
Apa yang membuat ini berkesan adalah bahwa setelah pembersihan dilakukan, formula mengatakan hanya menggunakan 3 sampel. Tiba-tiba rekomendasi saya tidak terlihat sangat kredibel!
Alasan hanya membutuhkan 3 sampel adalah bahwa pembersihan itu agresif dan bekerja dengan baik. Ini mengurangi konsentrasi kontaminan rata-rata sekitar 100 memberi atau mengambil 100 ppm, secara konsisten di bawah target 500 ppm.
Pada akhirnya pendekatan ini berhasil karena kami telah memperoleh 1000 sampel sebelumnya (walaupun kualitas analitisnya lebih rendah: mereka memiliki kesalahan pengukuran yang lebih besar) untuk menetapkan bahwa asumsi statistik yang dibuat sebenarnya adalah yang baik untuk situs ini. Itulah bagaimana potensi kesalahan Tipe III ditangani.
Satu putaran lagi untuk pertimbangan Anda: mengetahui bahwa badan pengawas tidak akan pernah menyetujui hanya menggunakan 3 sampel, saya merekomendasikan untuk mendapatkan 5 pengukuran. Ini harus dibuat dari 25 sampel acak dari seluruh situs, dikomposisikan dalam kelompok 5. Secara statistik hanya akan ada 5 angka dalam tes hipotesis akhir, tetapi kami mencapai kekuatan yang lebih besar untuk mendeteksi "hot spot" yang terisolasi dengan mengambil 25 fisik. sampel. Ini menyoroti hubungan penting antara berapa banyak angka yang digunakan dalam tes dan bagaimana angka itu diperoleh. Ada lebih banyak pengambilan keputusan secara statistik daripada hanya algoritma dengan angka!
Yang melegakan saya, lima nilai komposit mengkonfirmasi target pembersihan terpenuhi.