Mari kita mulai dengan memplot data dan melihatnya. Ini adalah jumlah data yang sangat terbatas, jadi ini akan menjadi ad hoc dengan banyak asumsi.
rotten <- c(0,1,1,0,0,0,1,1,1,1,0,0,0)
rotten <- as.factor(rotten)
mass <- c(139.08,
91.48,
74.23,
129.8,
169.22,
123.43,
104.93,
103.27,
169.01,
83.29,
157.57,
117.72,
128.63)
diam <- c(17.28,
6.57,
7.12,
16.52,
14.58,
6.99,
6.63,
6.75,
15.38,
7.45,
13.06,
6.61,
7.19)
plot(mass,diam,col=rotten,lwd=2)
title("Fruits")
Jadi ini datanya, titik merah mewakili buah busuk:
Anda benar dalam mengasumsikan bahwa ada dua jenis buah. Asumsi yang saya buat adalah sebagai berikut:
- Diameternya membagi buah menjadi dua kelompok
- Buah-buahan dengan diameter lebih besar dari 10 berada dalam satu kelompok, yang lain dalam kelompok yang lebih kecil.
- Hanya ada satu buah busuk di kelompok buah besar. Mari kita asumsikan bahwa jika buah dalam kelompok besar, maka busuk tidak mempengaruhi beratnya. Ini penting, karena kami hanya memiliki satu titik data di grup itu.
- Jika buahnya adalah buah kecil, maka busuk mempengaruhi massa.
- Mari kita asumsikan bahwa variabel diam dan massa terdistribusi normal.
Karena diberikan bahwa jumlah diameter adalah 64,2 cm, maka kemungkinan besar dua buah besar dan empat kecil. Sekarang ada 3 kasing untuk berat. Ada 2, 3 atau 4 buah kecil busuk, ( buah besar yang busuk tidak mempengaruhi massa dengan asumsi ). Jadi sekarang Anda bisa mendapatkan batasan pada massa Anda dengan menghitung nilai-nilai ini.
Kami secara empiris dapat memperkirakan probabilitas jumlah buah kecil yang busuk. Kami menggunakan probabilitas untuk menimbang estimasi massa kami, tergantung pada jumlah buah busuk:
samps <- 100000
stored_vals <- matrix(0,samps,2)
for(i in 1:samps){
numF <- 0 # Number of small rotten
numR <- 0 # Total number of rotten
# Pick 4 small fruits
for(j in 1:4){
if(runif(1) < (5/8)){ # Empirical proportion of small rotten
numF <- numF + 1
numR <- numR + 1
}
}
# Pick 2 large fruits
for(j in 1:2){
if(runif(1) < 1/5){# Empirical proportion of large rotten
numR <- numR + 1
}
}
stored_vals[i,] <- c(numF,numR)
}
# Pick out samples that had 4 rotten
fourRotten <- stored_vals[stored_vals[,2] == 4,1]
hist(fourRotten)
table(fourRotten)
# Proportions
props <- table(fourRotten)/length(fourRotten)
massBig <- mean(mass[diam>10])
massSmRot <- mean(mass[diam<10 & rotten == 1])
massSmOk <- mean(mass[diam<10 & rotten == 0])
weights <- 2*massBig + c(2*massSmOk+2*massSmRot,1*massSmOk+3*massSmRot,4*massSmRot)
Est_Mass <- sum(props*weights)
Memberi kami perkiraan final 691.5183g . Saya pikir Anda harus membuat sebagian besar asumsi yang saya buat untuk mencapai kesimpulan, tetapi saya pikir mungkin untuk melakukan ini dengan cara yang lebih cerdas. Saya juga mencicipi secara empiris untuk mendapatkan kemungkinan jumlah buah kecil busuk, itu hanya kemalasan dan dapat dilakukan "secara analitik".