Apakah rata-rata dari seperangkat rata-rata selalu sama dengan rata-rata yang diperoleh dari seluruh set data mentah?


11

Jika saya telah menghitung rata-rata untuk 4 set data (yang memang memiliki ukuran sampel berbeda), dapatkah saya memperoleh "rata-rata keseluruhan" dengan menghitung "rata-rata rata-rata"? Jika ya, apakah "rata-rata rata-rata" ini sama dengan jika saya telah menggabungkan data dari keempat set dan kemudian menghitung rata-rata?


3
Apakah Anda sudah mencoba keduanya ;-)? (No.)
gung - Reinstate Monica

Jawaban:


14

Tidak, rata-rata dari rata-rata himpunan bagian tidak sama dengan rata-rata seluruh rangkaian. Ini hanya akan menjadi nilai yang sama jika himpunan bagian ukuran sampel yang sama. Jika Anda ingin rata-rata populasi, gandakan setiap rata-rata dengan ukuran sampel asalnya untuk mendapatkan total populasi, kemudian bagi dengan jumlah total poin data (ukuran populasi).

Lihat contoh rata-rata pukulan pada paradoks Simpson untuk ilustrasi yang baik tentang mengapa rata-rata rata-rata biasanya tidak berfungsi.


2

Mari kita coba dan lihat apakah kita bisa mengetahuinya. Contoh berikut ini diberi kode R, yang gratis dan akan memungkinkan Anda mereproduksi contoh, tetapi mudah-mudahan kode ini cukup jelas:

group1 = c(1,2,3)
group2 = c(4,5,6,7,8,9)
mean(group1)
#  2
mean(group2)
#  6.5
mean(c(group1, group2))
#  5
mean(c(mean(group1), mean(group2)))
#  4.25

Jadi yang kami lihat adalah Anda tentu bisa menghitung mean dari mean, tetapi mean dari mean dan mean dari semua data mentah tidak cocok. Kami juga dapat mencoba rata - rata tertimbang menggunakan saran @ BilltheLizard untuk menggunakan ukuran sampel masing-masing kelompok sebagai bobot (bobot ditunjukkan dengan wargumen):

weighted.mean(c(mean(group1), mean(group2)), w=c(3,6))
#  5

Ini sekarang memberi kita jawaban yang sama.


1

Secara umum, jika Anda memiliki satu set m grup dengan ukuran masing-masing n1,...,nm dan sarana x¯1,...,x¯m maka rata-rata sampel keseluruhan dari semua data adalah:

x¯=k=1mnknx¯kn=i=1mnk.

Dengan demikian, rata-rata keseluruhan selalu rata - rata tertimbang dari rata - rata sampel kelompok. Dalam kasus khusus di mana semua grup memiliki ukuran yang sama (n1==nm), semua bobot akan sama dan demikian, rata-rata sampel keseluruhan akan menjadi rata-rata dari mean sampel kelompok.


0

Hanya ingin memberikan contoh (ekstrem): jika kita memiliki hit rate (1/10000) dalam satu sampel, dan hit rate (1/2) pada contoh lain, maka hititotalihititotali. Dalam kasus pertama (rata-rata berarti), kami memiliki tingkat hit "rata-rata" 0,5001 / 2 sedangkan dalam kasus kedua (rata-rata total) kami memiliki 3/10003, dan dua angka ini tidak sama. Apakah satu lebih tepat atau benar tergantung pada kasus penggunaan Anda.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.