Selain jawaban yang sangat bagus yang sudah diposting, saya pikir mungkin akan membantu untuk memiliki visualisasi menjelajahi distribusi proporsi yang diamati untuk memvariasikan nilai dan .np
Untuk menghasilkan histogram di bawah ini, saya mengambil sampel dari percobaan Bernoulli dengan probabilitas , dan mengulangi proses ini 10.000 kali. Saya kemudian menghasilkan histogram dari proporsi yang diamati dari masing-masing 10.000 percobaan.np
Secara visual, sepertinya cukup masuk akal. Meskipun ketika tampaknya masih ada beberapa kliping yang terjadi dengan dan . Setelah Anda mencapai , dampaknya tampak cukup kecil.np≥5n=50np=5.5np=6.5np=7.5
Perhatikan juga bahwa plot ini akan simetris karena jika kita mengambil nilai .p′p′=(1−p)
Kode python untuk menghasilkan plot. Anda dapat menggunakan ini untuk mengubah dan jika Anda ingin bereksperimen sendiri.np
import matplotlib.pyplot as plt
import numpy as np
np.random.seed(20190915)
def make_hists(axs, n):
proportions = np.linspace(0.01, 0.19, len(axs))
for i, prop in enumerate(proportions):
# Draw n samples 10,000 times
x = np.random.rand(n, 10_000) < prop
means = x.mean(axis=0)
axs[i].hist(means, bins=np.linspace(0, 0.5, n//2))
axs[i].set_xlim([0, 0.5])
axs[i].set_yticklabels([])
ylim_mean = np.mean(axs[i].get_ylim())
axs[i].text(-0.08, ylim_mean * 3/2, f'$p={prop:.2f}$', va='center')
axs[i].text(-0.08, ylim_mean * 2/3, f'$np={n * prop:.1f}$', va='center')
axs[0].set_title(f'$n={n}$')
def main():
f, axs = plt.subplots(10, 2, sharex=True, figsize=(12, 8))
make_hists(axs[:, 0], 50)
make_hists(axs[:, 1], 250)
f.suptitle(
'Histograms of 10,000 sample proportions, varying $p$ and $n$',
fontsize=14
)
plt.show()
main()