Misalkan Anda ingin tahu berapa persen orang yang akan memilih kandidat tertentu (katakanlah, , perhatikan bahwa menurut definisi π adalah antara 0 dan 100). Anda mencicipi N pemilih secara acak untuk mengetahui bagaimana mereka akan memilih dan survei Anda terhadap N pemilih ini memberi tahu Anda bahwa persentasenya adalah p . Jadi, Anda ingin menetapkan interval kepercayaan untuk persentase yang sebenarnya.ππNNp
Jika Anda menganggap bahwa biasanya didistribusikan (asumsi yang mungkin atau mungkin tidak dibenarkan tergantung pada seberapa 'besar' N adalah) maka selang kepercayaan Anda untuk π akan menjadi bentuk berikut:
C I = [ p - k * s d ( p ) , p + k ∗ s d ( p ) ] di
mana kpNπ
CI=[p−k∗sd(p), p+k∗sd(p)]
k adalah konstanta yang tergantung pada tingkat kepercayaan yang Anda inginkan (yaitu, 95% atau 99% dll).
Dari perspektif polling, Anda ingin lebar interval kepercayaan Anda 'rendah'. Biasanya, lembaga survei bekerja dengan margin of error yang pada dasarnya adalah setengah dari CI. Dengan kata lain, . MoE=k∗sd(p)
Berikut adalah bagaimana kita pergi tentang menghitung : Menurut definisi, p = Σ X i / N di mana, X i = 1 jika pemilih i suara untuk calon dan 0 sebaliknya.sd(p)p=∑Xi/NXi=1i0
Xi
Var(P)=V(∑XiN)=∑V(Xi)N2=Nπ(1−π)N2=π(1−π)N.
sd(p)=π∗(1−π)N−−−−−−−−−√
πsd(p)π=0.5sd(p)=0.5∗0.5/N−−−−−−−−−√=0.5/N−−√
So, you see that the margin of error falls off exponentially with
N and thus you really do not need very big samples to reduce your margin of error, or in other words
N need not be very large for you to obtain a narrow confidence interval.
For example, for a 95 % confidence interval (i.e., k=1.96) and N=1000, the confidence interval is:
[p−1.960.51000−−−−√, p+1.960.51000−−−−√]=[p−0.03, p+0.03]
As we increase
N the costs of polling go up linearly but the gains go down exponentially. That is the reason why pollsters usually cap
N at 1000 as that gives them a reasonable error of margin under the worst possible assumption of
π=50%.