Akankah interval kepercayaan untuk varian lebih sempit jika kita tahu mean a-priori?


8

Katakanlah kita tahu rata-rata distribusi yang diberikan. Apakah ini mempengaruhi estimasi interval varians dari variabel acak (yang jika tidak dihitung menggunakan varians sampel)? Seperti, bisakah kita mendapatkan interval yang lebih kecil untuk tingkat kepercayaan yang sama?


Saya secara signifikan memperbarui jawaban saya, berpikir itu sepenuhnya menjawab pertanyaan OP sekarang. Perbedaan antara jawaban saya dan jawaban lainnya adalah karena saya secara implisit menggunakan varian bersyarat. Sekarang saya membuatnya secara eksplisit. Pada dasarnya, ketika Anda berbicara tentang interval kepercayaan dari penaksir varians, Anda harus memperhitungkan pengetahuan rata-rata populasi.
Aksakal

Sepertinya pertanyaannya adalah "bisakah kita memperoleh interval yang lebih akurat untuk tingkat kepercayaan yang sama".
Gregor Thomas

Jawaban:


12

Saya tidak sepenuhnya yakin jawaban saya benar, tetapi saya berpendapat tidak ada hubungan umum. Inilah poin saya:

Mari kita pelajari kasus di mana interval kepercayaan varians dipahami dengan baik, yaitu. mengambil sampel dari distribusi normal (seperti yang Anda tunjukkan dalam tag pertanyaan, tetapi sebenarnya bukan pertanyaan itu sendiri). Lihat diskusi di sini dan di sini .

Interval kepercayaan untuk mengikuti dari pivot , di mana . (Ini hanyalah cara lain untuk menulis ungkapan yang mungkin lebih familiar , di mana )σ2T=nσ^2/σ2χn12σ^2=1/ni(XiX¯)2T=(n1)s2/σ2χn12s2=1/(n1)i(XiX¯)2

Dengan demikian, kita memiliki Oleh karena itu, interval kepercayaan adalah . Kita dapat memilih dan sebagai kuantil dan .

1α=Pr{cln1<T<cun1}=Pr{cln1nσ^2<1σ2<cun1nσ^2}=Pr{nσ^2cun1<σ2<nσ^2cln1}
(nσ^2/cun1,nσ^2/cln1)cln1cun1cun1=χn1,1α/22cln1=χn1,α/22

(Perhatikan secara sepintas bahwa untuk estimasi varians mana pun yang, karena condong, kuantil akan menghasilkan ci dengan probabilitas cakupan yang tepat, tetapi tidak optimal, yaitu bukan yang sesingkat mungkin. Untuk kepercayaan diri Interval menjadi sesingkat mungkin, kami memerlukan kerapatan yang identik di ujung bawah dan atas ci, mengingat beberapa kondisi tambahan seperti unimodality. Saya tidak tahu apakah menggunakan ci optimal itu akan mengubah hal-hal dalam jawaban ini.)χ2

Seperti yang dijelaskan dalam tautan, , di mana menggunakan yang dikenal berarti. Karenanya, kami mendapatkan interval kepercayaan yang valid lagi Di sini, dan akan menjadi kuantil dari .T=ns02/σ2χn2s02=1ni(Xiμ)2

1α=Pr{cln<T<cun}=Pr{ns02cun<σ2<ns02cln}
clncunχn2

Lebar interval kepercayaan adalah dan Lebar relatif adalah Kita tahu itu sebagai mean sampel meminimalkan jumlah penyimpangan kuadrat. Di luar itu, saya melihat beberapa hasil umum mengenai lebar interval, karena saya tidak menyadari hasil yang jelas bagaimana perbedaan dan produk dari atas dan bawah quantiles berperilaku seperti yang kita meningkatkan derajat kebebasan per satu (tapi lihat gambar di bawah).

wT=nσ^2(cun1cln1)cln1cun1
wT=ns02(cuncln)clncun
wTwT=σ^2s02cun1cln1cunclnclncuncln1cun1
σ^2/s021χ2

Misalnya, membiarkan

rn:=cun1cln1cunclnclncuncln1cun1,
kita miliki

r101.226
untuk dan , yang berarti bahwa ci berdasarkan akan lebih pendek jika α=0.05n=10σ^2
σ^2s021.226

Dengan menggunakan kode di bawah ini, saya menjalankan studi simulasi kecil yang menunjukkan bahwa interval berdasarkan akan memenangkan sebagian besar waktu. (Lihat tautan yang diposting dalam jawaban Aksakal untuk rasionalisasi sampel besar dari hasil ini.)s02

Peluangnya tampaknya stabil dalam , tetapi saya tidak mengetahui penjelasan sampel hingga analitis:n

masukkan deskripsi gambar di sini

    rm(list=ls())

IntervalLengthsSigma2 <- function(n,alpha=0.05,reps=100000,mu=1) {
  cl_a <- qchisq(alpha/2,df = n-1)
  cu_a <- qchisq(1-alpha/2,df = n-1)
  cl_b <- qchisq(alpha/2,df = n)
  cu_b <- qchisq(1-alpha/2,df = n)

  winners02 <- rep(NA,reps)

  for (i in 1:reps) {
    x <- rnorm(n,mean=mu)
    xbar <- mean(x)
    s2 <- 1/n*sum((x-xbar)^2)
    s02 <- 1/n*sum((x-mu)^2)

    ci_a <- c(n*s2/cu_a,n*s2/cl_a)
    ci_b <- c(n*s02/cu_b,n*s02/cl_b)

    winners02[i] <- ifelse(ci_a[2]-ci_a[1]>ci_b[2]-ci_b[1],1,0)  
  }
  mean(winners02)
}

nvalues <- matrix(seq(5,200,by=10)) 
plot(nvalues,apply(nvalues,1,IntervalLengthsSigma2),pch=19,col="lightblue",type="b")

Gambar berikut memplot terhadap , mengungkapkan (seperti yang akan disarankan oleh intuisi) bahwa rasio cenderung 1. Seperti, apalagi, untuk besar, perbedaan antara lebar kedua cis akan lenyap sebagai . (Lihat lagi tautan yang diposting dalam jawaban Aksakal untuk rasionalisasi sampel besar dari hasil ini.)rnnX¯pμnn

masukkan deskripsi gambar di sini


1
Solusi yang bagus, tetapi bisakah Anda mengatakan lebar mana yang lebih mungkin untuk menang?
martianwars

1
Anda membutuhkan distribusi probabilitas , kebalikannya, atau atau sesuatu yang terkait. Itu akan memungkinkan Anda untuk menghitung probabilitas kemenangan secara analitis. wT/wTwTwT
Christoph Hanck

1
Ya, itu sebabnya dan . T=nσ^2/σ2χn12T=ns02/σ2χn2
Christoph Hanck

1
Saat ini saya tidak memiliki akses ke kertas, tetapi jika itu "hanya" varians dari estimator, saya tidak melihat perbedaan pendapat yang diperlukan (dan simulasi saya mengkonfirmasi bahwa yang dikenal biasanya lebih baik): bahwa satu estimator lebih baik daripada yang lain satu dalam hal varians tidak menghalangi bahwa "buruk" tidak lebih baik dalam sampel yang diberikan - sedikit sesuai dengan apa yang dikatakan @Scortchiμ
Christoph Hanck

1
Saya pikir penting untuk dicatat bahwa simulasi Anda menunjukkan bahwa sebagai , tampaknya tidak ada perbedaan. Sama sekali tidak menjelaskan apa yang terjadi sebagai , panjang meningkat. Saya menyadari bahwa itu dianggap 1, tetapi perbedaan antara dan menjadi jauh lebih penting ketika tumbuh. nkμsσ^k
Cliff AB

7

Biarkan saya yang pertama mengatur masalahnya. Kita tahu artinya populasi. Ini adalah poin yang sangat penting untuk dibuat di awal, karena tanpanya, kita tidak akan memiliki jawaban yang berarti.

Saya akan menjelaskan alasannya. Katakanlah kita memiliki sampel dan tidak tahu mean populasi. Kami memiliki penaksir varian yang biasa:

σ=1n1sumi(xix¯)2

Sekarang, kami diberitahu bahwa rata-rata populasi adalah . Naluri pertama kami adalah menghubungkannya ke penaksir varians:μ

σ=1nsumi(xiμ)2

Perhatikan, bahwa ini adalah penaksir yang berbeda sekarang! Ini memiliki penyebut yang berbeda dll. Ia memiliki varian yang berbeda itu sendiri.

Namun, apakah benar untuk membandingkan dan ? Tidak, BUKAN.Var[σ]Var[σ]

Kita harus membandingkan dan . Dengan kata lain kita harus membandingkan varian dari dua penaksir ini dengan syarat pengetahuan rata-rata populasi! Kalau tidak, kita akan jatuh ke dalam paradoks @ Scortchi.Var[σ|E[xi]=μ]Var[σ|E[xi]=μ]

Ketika Anda mendapatkan informasi baru, yaitu , Anda harus memasukkannya dalam perkiraan ! Ini memecahkan paradoks @ Scortchi dalam komentarnya secara langsung. Persamaan yang saya lihat sejauh ini dalam jawaban tidak termasuk pengetahuan ke dalam CI atau varians dari estimator varians . Dalam contoh @ Scortchi mengetahui bahwa akan menyebabkan revisi CI of .E[xi]=μVar[σ]μσx¯>>μσ

Oleh karena itu, jawaban saya di sini mengikuti pengaturan yang saya jelaskan dijelaskan.

Ya, interval kepercayaan diri akan lebih sempit.

Secara filosofis, mengetahui rata-rata populasi adalah informasi tambahan, sehingga ketidakpastian harus lebih kecil dalam kasus ini.

Contoh: jika distribusi Anda adalah Poisson, maka varians adalah rata-rata sama. Oleh karena itu, mengetahui berarti Anda mengetahui varians juga, dan interval kepercayaan menyusut ke suatu titik. Tidak ada interval.

UPDATE: Lihatlah makalah ini : "Memperkirakan Varians Populasi dengan Mean Mean" oleh Zhang, 1996. Dia membandingkan estimasi standar varians vs yang menggunakan pengetahuan tentang mean populasi . Dia sampai pada kesimpulan yang sama: varians dari estimasi yang terakhir lebih kecil dari yang sebelumnya, yaitu interval kepercayaan estimasi varians akan lebih sempit. Dia juga menunjukkan bahwa keuntungan menghilang ketika ukuran sampel cenderung tak terbatas.1n1i(xix¯)21ni(xiμ)2

Saya pikir makalah ini adalah jawaban pasti untuk pertanyaan Anda.


Apakah itu tidak bertentangan dengan jawaban saya (setidaknya dalam generalitas itu - saya yakin setuju dengan contoh Poisson yang bagus)?
Christoph Hanck

1
Nah, ada perbedaan antara yang diharapkan panjang interval kepercayaan, & panjang kepercayaan interval Anda mungkin menghitung dari data-set tertentu (mempertimbangkan apa yang terjadi ketika mean sampel, luar biasa, sangat jauh dari mean populasi yang sebenarnya) .
Scortchi

+1, poin Anda tentang distribusi Poisson (& distribusi di mana varians adalah fungsi dari mean pada umumnya) adalah yang baik. Namun, perhatikan bahwa OP tampaknya memiliki distribusi normal dalam pikiran, & seperti yang ditunjukkan oleh @ ChristophHanck, situasinya lebih rumit di sana.
gung - Reinstate Monica

@Scortchi, lihat jawaban saya untuk komentar Anda. Inti dari itu: kami menjawab berbagai pertanyaan. Saya membandingkan penduga yang BERBEDA di bawah asumsi SAMA dari populasi yang diketahui.
Aksakal

2
Saya tidak yakin saya mengerti apa yang Anda maksud dengan . Apakah ini berarti ? Jika tidak, lalu apa lagi? Jika ya, maka mungkin poin Anda akan lebih jelas jika Anda menulisnya seperti itu. Var[σ|E[xi]=μ]Var[σ|x¯=μ]
amoeba

3

Memperpanjang sedikit jawaban @Cristoph Hanck , & mengadaptasi kodenya ...

Misalkan Mr A tidak mengetahui rata-rata yang sebenarnya, atau statistik, & Mr B tidak mengetahui keduanya. Mungkin tampak aneh, bahkan tidak adil, bahwa Mr A dapat memperoleh interval kepercayaan yang lebih pendek untuk varians menggunakan pivot daripada Mr B menggunakan pivot . Tetapi dalam jangka panjang Mr B menang dalam agak rasa yang kuat: interval kepercayaan dirinya yang stokastik sempit-untuk lebar setiap Anda peduli untuk menentukan, proporsi Mr B CI sempit daripada lebih besar dari proporsi Mr A.TTww

masukkan deskripsi gambar di sini

Mengumpulkan bersama-sama bagian dari kasus di mana Mr A's CI keluar lebih sempit menunjukkan bahwa dalam ini dia mendapat cakupan yang lebih rendah (sekitar 91%); tetapi ia membayar untuk itu dengan cakupan yang lebih tinggi (sekitar 96%) dalam subset kasus di mana intervalnya keluar lebih luas, mendapatkan cakupan yang benar (95%) secara keseluruhan. Tentu saja Tuan A tidak tahu kapan CI-nya berada di bagian mana. Dan Tuan C yang licik yang mengetahui nilai sebenarnya & mengambil atau menurutnya menghasilkan CI tersempit pada akhirnya akan terungkap ketika intervalnya gagal mempertahankan cakupan yang seharusnya 95%.TT

IntervalLengthsSigma2 <- function(n,alpha=0.05,reps=100000,mu=1) {
  cl_a <- qchisq(alpha/2,df = n-1)
  cu_a <- qchisq(1-alpha/2,df = n-1)
  cl_b <- qchisq(alpha/2,df = n)
  cu_b <- qchisq(1-alpha/2,df = n)

  winners02 <- rep(NA,reps)
  width.a <- rep(NA,reps)
  width.b <- rep(NA,reps)
  sigma2.in.a <- rep(NA,reps)
  sigma2.in.b <- rep(NA,reps)

  for (i in 1:reps) {
    x <- rnorm(n,mean=mu)
    xbar <- mean(x)
    s2 <- 1/n*sum((x-xbar)^2)
    s02 <- 1/n*sum((x-mu)^2)

    ci_a <- c(n*s2/cu_a,n*s2/cl_a)
    ci_b <- c(n*s02/cu_b,n*s02/cl_b)

    winners02[i] <- ifelse(ci_a[2]-ci_a[1]>ci_b[2]-ci_b[1],1,0) 
    ci_a[2]-ci_a[1] -> width.a[i]
    ci_b[2]-ci_b[1] -> width.b[i]
    ifelse(ci_a[1]< 1 & ci_a[2] > 1, 1, 0) -> sigma2.in.a[i]
    ifelse(ci_b[1]< 1 & ci_b[2] > 1, 1, 0) -> sigma2.in.b[i]
  }

 list(n=n, width.a=width.a,width.b=width.b, sigma2.in.a=sigma2.in.a, sigma2.in.b=sigma2.in.b, winner=winners02)
}

# simulate for sample size of 6
IntervalLengthsSigma2(n=6) -> sim

# plot empirical CDFs of CI widths for mean known & mean unknown
plot(ecdf(sim$width.a), xlab="CI width", ylab="empirical CDF", sub=paste("n=",sim$n), main="")
lines(ecdf(sim$width.b), col="red")
legend("bottomright", lty=1, col=c("black", "red"), legend=c("mean unknown (Mr A)", "mean known (Mr B)"))

# coverage with mean unknown:
mean(sim$sigma2.in.a)
# coverage with mean unknown when CI is narrower than with mean known:
mean(sim$sigma2.in.a[sim$winner==0])
# coverage with mean unknown when CI is wider than with mean known:
mean(sim$sigma2.in.a[sim$winner==1])

# coverage with mean known:
mean(sim$sigma2.in.b)
# coverage with mean known when CI is wider than with mean unknown:
mean(sim$sigma2.in.b[sim$winner==0])
# coverage with mean known when CI is narrower than with mean unknown;
mean(sim$sigma2.in.b[sim$winner==1])

2

Saya tidak bisa berkomentar tetapi pernyataan Aksakal yang menyapu "mengetahui rata-rata populasi adalah informasi tambahan, sehingga ketidakpastian harus lebih kecil dalam kasus ini" tidak jelas.

Dalam kasus terdistribusi normal, penaksir kemungkinan maksimum varians ketika tidak diketahui:μ

1ni=1n(XiX¯)2

memiliki varian yang lebih rendah daripada

1ni=1n(Xiμ)2

untuk setiap nilaiμ,σ


Apakah Anda membaca koran dalam jawaban saya?
Aksakal

Tidak, tetapi varians sampel yang tidak bias yang Anda sebutkan dalam pembaruan Anda bukan penaksir kemungkinan maksimum, jadi saya tidak yakin makalah itu relevan. Anda dapat melakukan studi simulasi cepat untuk memverifikasi klaim saya.
Rand Forrester

bahkan jika Anda menggunakan estimator Anda, poin saya adalah bahwa untuk memiliki perbandingan yang bermakna Anda harus menghitung varaince dari estimator yang tergantung pada pengetahuan . Menurut Anda apa perbedaan dari dua penaksir yang Anda berikan? Sebelum menjawab pertanyaan saya, pastikan keduanya menyertakan dalam beberapa cara. μμ
Aksakal

2
Aksakal, saya sedang berbicara tentang membandingkan varians sampel MLE dari ketika Anda vs. tidak tahu . Dalam konteks itu, saya tidak tahu apa artinya "menghitung varians dari penaksir bersyarat pada pengetahuan ". Mengenai pertanyaan Anda, tidak perlu memberikan perhitungan yang tepat. Sebuah studi simulasi sederhana akan memverifikasi apa yang saya katakan. σ^μμ
Rand Forrester

3
Dengar, aku tidak akan terkejut jika kamu benar, tetapi jika kamu akan menyiratkan bahwa aku tidak kompeten, maka tolong jelaskan apa artinya "conditional on ". "Bersyarat" hanya memiliki definisi teknis (sejauh yang saya tahu) ketika mengacu pada variabel acak. Saya berasumsi itu adalah referensi singkat untuk estimasi ketika diasumsikan diketahui, misalnya MLE, bertentangan dengan MLE dari ketika Anda tidak tahu : Sepertinya Anda bermaksud sesuatu yang lain. Sangat menghargai klarifikasi. Terima kasih. μσμ
1n(Xiμ)2
σμ
1n(XiX¯)2
Rand Forrester
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.