Terinspirasi oleh ceramah Peter Donnelly di TED , di mana ia membahas berapa lama untuk pola tertentu muncul dalam serangkaian lemparan koin, saya membuat skrip berikut dalam R. Diberikan dua pola 'hth' dan 'htt', itu menghitung berapa lama (yaitu berapa banyak lemparan koin) rata-rata sebelum Anda menekan salah satu pola ini.
coin <- c('h','t')
hit <- function(seq) {
miss <- TRUE
fail <- 3
trp <- sample(coin,3,replace=T)
while (miss) {
if (all(seq == trp)) {
miss <- FALSE
}
else {
trp <- c(trp[2],trp[3],sample(coin,1,T))
fail <- fail + 1
}
}
return(fail)
}
n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))
hth <- c('h','t','h')
htt <- c('h','t','t')
set.seed(4321)
for (i in 1:n) {
trials[i,] <- c(hit(hth),hit(htt))
}
summary(trials)
Statistik ringkasan adalah sebagai berikut,
hth htt
Min. : 3.00 Min. : 3.000
1st Qu.: 4.00 1st Qu.: 5.000
Median : 8.00 Median : 7.000
Mean :10.08 Mean : 8.014
3rd Qu.:13.00 3rd Qu.:10.000
Max. :70.00 Max. :42.000
Dalam ceramah itu dijelaskan bahwa rata-rata jumlah lemparan koin akan berbeda untuk dua pola; seperti yang bisa dilihat dari simulasi saya. Meskipun menonton pembicaraan beberapa kali saya masih belum mengerti mengapa ini akan terjadi. Saya mengerti bahwa 'hth' tumpang tindih dengan sendirinya dan secara intuitif saya akan berpikir bahwa Anda akan mencapai 'hth' lebih cepat dari 'htt', tetapi ini tidak terjadi. Saya akan sangat menghargainya jika seseorang dapat menjelaskan hal ini kepada saya.