Karena hanyalah faktor skala, tanpa kehilangan keumuman memilih unit pengukuran yang membuat , membuat fungsi distribusi yang mendasarinya dengan kepadatan .λλ=1F(x)=1−exp(−x)f(x)=exp(−x)
Dari pertimbangan yang paralel dengan teorema limit Tengah untuk median sampel , adalah asimtotik Normal dengan rata-rata dan variansX(m)F−1(p)=−log(1−p)
Var(X(m))=p(1−p)nf(−log(1−p))2=pn(1−p).
Karena properti tanpa memori dari distribusi eksponensial , variabel bertindak seperti statistik urutan sampel acak dari diambil dari , yang telah ditambahkan. Penulisan(X(m+1),…,X(n))n−mFX(m)
Y=1n−m∑i=m+1nX(i)
untuk rata-rata mereka, segera bahwa rata-rata adalah rata-rata (sama dengan ) dan varian adalah dikalikan varian (juga sama dengan ). Teorema Limit Sentral menyiratkan bahwa terstandarisasi adalah Standar Normal asimptotik. Selain itu, karena adalah bersyarat independen , kita secara bersamaan memiliki versi standar dari menjadi asimtotik Normal Standar dan tidak berkorelasi dengan . Itu adalah,YF1Y1/(n−m)F1YYX(m)X(m)Y
(X(m)+log(1−p)p/(n(1−p))−−−−−−−−−−√,Y−X(m)−1n−m−−−−−√)(1)
asymptotically memiliki distribusi Normal Standar bivariat.
Laporan grafik pada data simulasi untuk sampel ( iterasi) dan . Jejak kemiringan positif tetap ada, tetapi pendekatan untuk normalitas bivariat terbukti dalam kurangnya hubungan antara dan dan kedekatan histogram dengan kepadatan Standar Normal (ditunjukkan dalam titik merah).
n=1000500p=0.95Y−X(m)X(m)
Matriks kovarians dari nilai standar (seperti dalam rumus ) untuk simulasi ini adalah nyaman dekat dengan matriks unit yang didekati.(1)
(0.967−0.021−0.0211.010),
The R
kode yang dihasilkan grafis ini adalah mudah dimodifikasi untuk mempelajari nilai-nilai lain dari , , dan ukuran simulasi.np
n <- 1e3
p <- 0.95
n.sim <- 5e3
#
# Perform the simulation.
# X_m will be in the first column and Y in the second.
#
set.seed(17)
m <- floor(p * n)
X <- apply(matrix(rexp(n.sim * n), nrow = n), 2, sort)
X <- cbind(X[m, ], colMeans(X[(m+1):n, , drop=FALSE]))
#
# Display the results.
#
par(mfrow=c(2,2))
plot(X[,1], X[,2], pch=16, col="#00000020",
xlab=expression(X[(m)]), ylab="Y",
main="Y vs X", sub=paste("n =", n, "and p =", signif(p, 2)))
plot(X[,1], X[,2]-X[,1], pch=16, col="#00000020",
xlab=expression(X[(m)]), ylab=expression(Y - X[(m)]),
main="Y-X vs X", sub="Loess smooth shown")
lines(lowess(X[,2]-X[,1] ~ X[,1]), col="Red", lwd=3, lty=1)
x <- (X[,1] + log(1-p)) / sqrt(p/(n*(1-p)))
hist(x, main="Standardized X", freq=FALSE, xlab="Value")
curve(dnorm(x), add=TRUE, col="Red", lty=3, lwd=2)
y <- (X[,2] - X[,1] - 1) * sqrt(n-m)
hist(y, main="Standardized Y-X", freq=FALSE, xlab="Value")
curve(dnorm(x), add=TRUE, col="Red", lty=3, lwd=2)
par(mfrow=c(1,1))
round(var(cbind(x,y)), 3) # Should be close to the unit matrix