Populasi adalah himpunan (hipotetis) dari semua orang yang berisiko terkena penyakit; biasanya, yang terdiri dari semua orang (atau beberapa subkelompok orang yang dapat diidentifikasi dengan jelas) yang berada di wilayah studi. Penting untuk mendefinisikan populasi ini dengan jelas, karena ini adalah target penelitian dan semua kesimpulan yang dibuat dari data.
Ketika kasus penyakit independen (yang mungkin merupakan hipotesis yang masuk akal ketika penyakit tidak mudah dikomunikasikan antara orang-orang dan tidak disebabkan oleh kondisi lingkungan setempat) dan mereka jarang, maka perhitungan harus mengikuti distribusi Poisson . Untuk distribusi ini, perkiraan standar deviasi yang baik adalah akar kuadrat dari perhitungan tersebut .
( 180 , 90 , 45 , 210 )( 13.4 , 9.5 , 6.7 , 14.5 )Bahkan, jumlah aktual penyakit yang diamati selama satu musim akan bervariasi dari angka sebenarnya. Akar kuadrat dari laju sebenarnya (tetapi tidak diketahui!) Mengkuantifikasi jumlah variasi yang mungkin terjadi. Karena diamati jumlah seharusnya menjadi dekat dengan tingkat sejati, mereka akar kuadrat harus proxy wajar untuk akar kuadrat dari tingkat yang benar. Proxy ini persis apa yang dimaksud dengan "kesalahan standar."
1657714.577
9( 20 , 10 , 5 , 23 )( 4.5 , 3.2 , 2.2 , 4.8 )9( 40 , 28.5 , 20 , 44 )
Sejauh yang bisa dilakukan dengan data terbatas ini. Perhitungan sederhana ini telah mengungkapkan bahwa:
Mengkarakterisasi populasi sangat penting,
Akar kuadrat dari hitungan adalah titik awal kasar untuk menilai kesalahan standarnya,
Akar kuadrat harus dikalikan (kira-kira) dengan beberapa faktor untuk mencerminkan kurangnya independensi dalam kasus penyakit (dan faktor ini kira-kira dapat dikaitkan dengan ukuran cluster penyakit),
Variasi di antara jumlah ini terutama mencerminkan variasi dalam tingkat penyakit dari waktu ke waktu daripada ketidakpastian (tentang intensitas Poisson yang mendasarinya).