Bagaimana cara menghitung interval kepercayaan rata-rata mean?


19

Bayangkan Anda mengulang percobaan tiga kali. Dalam setiap percobaan, Anda mengumpulkan pengukuran rangkap tiga. Rangkap tiga cenderung saling berdekatan, dibandingkan dengan perbedaan antara tiga cara eksperimental. Menghitung nilai tengah berarti cukup mudah. Tetapi bagaimana seseorang bisa menghitung interval kepercayaan untuk grand mean?

Contoh data:

Eksperimen 1: 34, 41, 39

Eksperimen 2: 45, 51, 52

Eksperimen 3: 29, 31, 35

Asumsikan bahwa nilai-nilai ulangan dalam percobaan mengikuti distribusi Gaussian, seperti halnya nilai rata-rata dari setiap percobaan. SD variasi dalam percobaan lebih kecil dari SD di antara sarana eksperimental. Asumsikan juga bahwa tidak ada urutan tiga nilai dalam setiap percobaan. Urutan kiri-ke-kanan dari ketiga nilai di setiap baris sepenuhnya arbitrer.

Pendekatan sederhana adalah pertama menghitung rata-rata dari setiap percobaan: 38.0, 49.3, dan 31.7, dan kemudian menghitung rata-rata, dan interval kepercayaan 95%, dari ketiga nilai tersebut. Dengan menggunakan metode ini, mean rata-rata adalah 39,7 dengan interval kepercayaan 95% mulai dari 17,4 hingga 61,9.

Masalah dengan pendekatan itu adalah bahwa ia benar-benar mengabaikan variasi di antara rangkap tiga. Saya ingin tahu apakah tidak ada cara yang baik untuk menjelaskan variasi itu.


1
Bukan jawaban, hanya pengamatan intuitif. CI untuk rerata data yang dikumpulkan (kesembilan obs) adalah , CI hanya berdasarkan pada mean . Tidak yakin apa yang CI Anda lakukan (salah ketik 17 bukan 27, dan 51 bukan 61?), Saya mendapatkan untuk std err dari tiga cara, dan sebagai quantile dari T dist dengan 2 df. Saya akan berpikir bahwa CI yang Anda cari akan terletak di antara keduanya - karena Anda memiliki penyatuan sebagian. Bisa juga berpikir dalam hal varians rumus , setiap CI menggunakan setengah dari rumus( 39.7 ± 12.83 ) 2.98 4.30 0.975 V ( Y ) = E [ V ( Y | Y g ) ] + V [ E ( Y | Y g ) ](39.7±2.13)(39.7±12.83)2.984.300,975V(Y)=E[V(Y|Yg)]+V[E(Y|Yg)]
probabilityislogic

2
@probabilityislogic: SEM dari tiga percobaan berarti 5.168 (bukan 2.98 seperti yang Anda tulis), dan interval kepercayaan yang saya berikan dalam posting asli (17.4 hingga 61.9) benar. SEM dihitung dari SD (8,95) dengan membaginya dengan akar kuadrat dari n (akar kuadrat dari 3). Anda dibagi dengan n (3) sebagai gantinya.
Harvey Motulsky

kesalahan saya, juga harus mengganti dengan dalam interval pooled (kesalahan yang sama di sana)6.402.136.40
probabilityislogic

apakah tautan berikut menjawab 'ini? talkstats.com/showthread.php/11554-mean-of-means

@TST, Tampaknya tidak ada yang lain selain tautan ke Wikipedia tentang varian Pooled . Mau menguraikan?
chl

Jawaban:


6

Ada interval keyakinan pasti alami untuk nenek dalam model ANOVA satu arah acak seimbang Memang, mudah untuk memeriksa bahwa distribusi sarana diamati ˉ y i adalah ˉ y i ~ iid N ( μ , τ 2 ) dengan τ 2 = σ 2 b + σ 2 w

(ysayajμsaya)iidN(μsaya,σw2),j=1,...,J,μsayaiidN(μ,σb2),saya=1,...,saya.
y¯sayay¯sayaiidN(μ,τ2) , dan diketahui bahwa antara jumlah kuadratSSbmemiliki distribusiSSbJτ2χ 2 I - 1 dan tidak tergantung pada keseluruhan rata-rata yang diamati ˉ yN(μ,τ2τ2=σb2+σw2JSSb
SSbJτ2χsaya-12
. Jadi ˉ y -μ
y¯N(μ,τ2saya)
memilikidistribusitStudentdenganI-1derajat kebebasan, dari mana mudah untuk mendapatkan interval kepercayaan yang tepat tentangμ.
y¯-μ1sayaSSbJ(saya-1)
tsaya-1μ

Perhatikan bahwa interval kepercayaan ini tidak lain adalah interval klasik untuk rata-rata Gaussian dengan hanya mempertimbangkan kelompok yang berarti sebagai pengamatany¯saya . Demikian pendekatan sederhana yang Anda sebutkan:

Pendekatan sederhana adalah pertama menghitung rata-rata dari setiap percobaan: 38.0, 49.3, dan 31.7, dan kemudian menghitung rata-rata, dan interval kepercayaan 95%, dari ketiga nilai tersebut. Dengan menggunakan metode ini, mean rata-rata adalah 39,7 dengan interval kepercayaan 95% mulai dari 17,4 hingga 61,9.

benar. Dan intuisi Anda tentang variasi yang diabaikan:

Masalah dengan pendekatan itu adalah bahwa ia benar-benar mengabaikan variasi di antara rangkap tiga. Saya ingin tahu apakah tidak ada cara yang baik untuk menjelaskan variasi itu.

salah. Saya juga menyebutkan kebenaran penyederhanaan di /stats//a/72578/8402

Pembaruan 12/04/2014

Beberapa detail sekarang ditulis di blog saya: Mengurangi model untuk mendapatkan interval kepercayaan .


Adakah yang membantu mengimplementasikan solusi ini dengan python? stackoverflow.com/questions/45682437/…
blehman

7

Ini adalah pertanyaan tentang estimasi dalam model efek campuran linier. Masalahnya adalah bahwa varians dari mean rata-rata adalah jumlah tertimbang dari dua komponen varians yang harus diperkirakan secara terpisah (melalui ANOVA data). Perkiraan memiliki tingkat kebebasan yang berbeda. Oleh karena itu, meskipun seseorang dapat mencoba untuk membangun interval kepercayaan untuk rata-rata menggunakan rumus sampel kecil (Student t) biasa, itu tidak mungkin untuk mencapai cakupan nominal karena penyimpangan dari rata-rata tidak akan persis mengikuti distribusi t Student.

Artikel terbaru (2010) oleh Eva Jarosova, Estimasi dengan Linear Mixed Effects Model , membahas masalah ini. (Pada 2015 ini tampaknya tidak lagi tersedia di Web.) Dalam konteks dataset "kecil" (meskipun begitu, sekitar tiga kali lebih besar dari ini), ia menggunakan simulasi untuk mengevaluasi dua perkiraan perkiraan perhitungan CI (sumur) pendekatan Satterthwaite yang dikenal dan "metode Kenward-Roger"). Kesimpulannya termasuk

Studi simulasi mengungkapkan bahwa kualitas estimasi parameter kovarian dan penyesuaian interval kepercayaan pada sampel kecil bisa sangat buruk .... Estimasi yang buruk dapat mempengaruhi tidak hanya tingkat kepercayaan sebenarnya dari interval konvensional tetapi juga dapat membuat penyesuaian menjadi tidak mungkin. Jelas bahwa bahkan untuk data yang seimbang, tiga jenis interval [konvensional, Satterthwaite, KR] mungkin berbeda secara substansial. Ketika perbedaan mencolok antara interval konvensional dan interval yang disesuaikan diamati, kesalahan standar estimasi parameter kovarians harus diperiksa. Di sisi lain, ketika perbedaan antara [tiga] jenis interval kecil, penyesuaian tampaknya tidak perlu.

Singkatnya, pendekatan yang bagus tampaknya

  1. Hitung CI konvensional dengan menggunakan estimasi komponen varians dan berpura-t distribusi berlaku.

  2. Juga hitung setidaknya satu dari CI yang disesuaikan.

  3. Jika perhitungannya "dekat," terima CI konvensional. Kalau tidak, laporkan bahwa tidak ada data yang memadai untuk menghasilkan CI yang andal.


Menggunakan komponen varians mengarah ke interval kepercayaan yang sama yang saya hitung di posting asli. Tabel ANOVA memiliki SS antara kolom 480,7 dengan 2 df, yang berarti MS adalah 240,3. SD adalah sqrt (MSbetween / n) = sqrt (240.3 / 3) = 8.95, yang mengarah ke CI yang sama dengan yang sebelumnya saya posting (17.4 hingga 61.9). Saya merasa sangat sulit untuk mengikuti makalah Jarasova yang Anda kutip, dan saya tidak sepenuhnya yakin itu relevan di sini (tampaknya tentang ukuran desain berulang). ???
Harvey Motulsky

@ Harvey Uraian Anda tentu terdengar seperti langkah berulang bagi saya! Saya percaya kertas Jarasova tepat.
whuber

1
Saya sedang memikirkan situasi umum di laboratorium di mana rangkap tiga hanyalah tiga tabung uji (atau sumur) yang berbeda. Urutan ketiganya sebagaimana disajikan dalam tabel adalah arbitrer. Tidak ada hubungan atau korelasi antara replikasi # 2 dalam percobaan pertama dengan replikasi # 2 dalam percobaan kedua atau ketiga. Setiap percobaan hanya memiliki tiga pengukuran. Jadi tidak benar-benar mengulangi tindakan. Baik?
Harvey Motulsky

Whuber, ada distribusi siswa yang tepat di sini. Lihat jawaban saya.
Stéphane Laurent

@whuber tautan yang Anda berikan untuk artikel Eva Jarasova sudah mati dan pencarian Google tidak menghasilkan apa-apa. Bisakah Anda memperbaiki referensi?
Placidia

0

Anda tidak dapat memiliki satu interval kepercayaan yang menyelesaikan kedua masalah Anda. Anda harus memilih satu. Anda dapat memperoleh satu dari istilah galat kuadrat rata-rata dalam varians percobaan yang memungkinkan Anda untuk mengatakan sesuatu tentang seberapa akurat Anda dapat memperkirakan nilai-nilai dalam eksperimen atau Anda dapat melakukannya di antara dan itu akan tentang antar eksperimen. Jika saya baru saja melakukan yang pertama saya cenderung ingin plot sekitar 0 daripada sekitar grand mean karena tidak memberi tahu Anda apa-apa tentang nilai rata-rata aktual, hanya tentang efek (dalam hal ini 0). Atau Anda bisa merencanakan keduanya dan menggambarkan apa yang mereka lakukan.

Anda punya pegangan di antara yang satu. Untuk di dalamnya seperti menghitung istilah kesalahan dalam ANOVA untuk mendapatkan MSE untuk bekerja dengan dan dari sana SE untuk CI hanya sqrt (MSE / n) (n = 3 dalam kasus ini).


Sebenarnya Anda dapat memiliki interval yang kredibel untuk setiap mean dan untuk mean besar. Cukup gunakan model multilevel Bayesian. Terkadang estimasi semacam ini disebut pooling parsial. Masalahnya adalah sampel kecil, saya pikir.
Manoel Galdino

Anda bisa memiliki interval kepercayaan untuk setiap mean dan grand mean juga ... tapi mereka hal yang berbeda ... sama seperti interval yang kredibel. Saya menafsirkan pertanyaan sebagai tentang CI sehubungan dengan varians dalam studi dan antara sebagai agregat. Itu semua masih membuat Anda berbeda CI artinya berbeda. (Saya juga tidak mengambil n secara harfiah)
John

1
Selain itu, cara yang saya maksud tidak bisa tidak benar-benar "tidak bisa". Entah bagaimana Anda bisa menghasilkan persamaan tunggal yang menghitung satu interval kepercayaan untuk semuanya. Itu tidak akan berarti sesuatu yang masuk akal. Itu yang saya maksudkan untuk tidak bisa.
John

Beberapa menit setelah saya menulis komentar saya, saya menyadari bahwa kami tidak seharusnya mengambil n secara harfiah. Tapi terlambat mengeditnya =).
Manoel Galdino

0

Saya pikir CI untuk grand mean terlalu lebar [17,62] bahkan untuk rentang data asli.

Eksperimen ini SANGAT umum dalam kimia. Misalnya, dalam sertifikasi bahan referensi Anda harus mengambil beberapa botol dari lot keseluruhan secara acak, dan Anda harus melakukan analisis ulangan pada setiap botol. Bagaimana Anda menghitung nilai referensi dan ketidakpastiannya? Ada banyak cara untuk melakukannya, tetapi yang paling canggih (dan saya pikir benar) menerapkan meta-analisis atau ML (Dersimonian-Laird, Vangel-Rukhin, dll)

Bagaimana dengan perkiraan bootstrap?


1
Simulasi (10.000 percobaan dengan efek dan kesalahan utama yang berdistribusi normal) menunjukkan [21, 58] adalah CI dua sisi simetris untuk mean.
Whuber

whuber: Saya ingin tahu bagaimana Anda melakukan simulasi itu. Bootstrap dari data asli? Atau benar-benar simulasi? Jika yang terakhir, berapa nilai mean dan SD yang Anda gunakan untuk mensimulasikan data ??
Harvey Motulsky
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.