Ini adalah pertanyaan lama tetapi jawaban yang diterima sebenarnya tidak benar atau tidak lengkap. Pengguna ingin menghitung standar deviasi selama 12 bulan data di mana rata-rata dan standar deviasi sudah dihitung setiap bulan. Dengan asumsi bahwa jumlah sampel dalam setiap bulan adalah sama, maka dimungkinkan untuk menghitung rata-rata sampel dan varians dari tahun ke tahun dari data setiap bulan. Untuk kesederhanaan anggap bahwa kita memiliki dua set data:
X= { x1, . . . . xN}
Y= { y1, . . . . , yN}
μxμyσ2xσ2y
Sekarang kami ingin menghitung taksiran yang sama untuk
Z= { x1, . . .. , xN, y1, . . . , yN}
μxσ2x
μx= ∑Ni = 1xsayaN
σ2x= ∑Ni = 1x2sayaN- μ2x
Untuk memperkirakan rata-rata dan varians dari set total, kita perlu menghitung:
μz= ∑Ni = 1xsaya+ ∑Ni = 1ysaya2 N= ( μx+ μy) / 2
σ2z= ∑Ni = 1x2saya+ ∑Ni = 1y2saya2 N- μ2z
σ2z= 12( ∑Ni = 1x2sayaN- μ2x+ ∑Ni = 1y2sayaN- μ2y) + 12( μ2x+ μ2y) - ( μx+ μy2)2
σ2z= 12( σ2x+ σ2y) + ( μx- μy2)2
Jadi jika Anda memiliki varians atas setiap subset dan Anda ingin varians atas seluruh set maka Anda dapat rata-rata varians dari setiap subset jika mereka semua memiliki rata-rata yang sama. Jika tidak, Anda perlu menambahkan varians rata-rata dari setiap subset.
Katakanlah bahwa selama paruh pertama tahun ini kami menghasilkan tepat 1.000 MWh per hari dan pada paruh kedua, kami menghasilkan 2.000 MWh per hari. Kemudian mean dan varians dari produksi energi di babak pertama dan kedua adalah 1000 dan 2000 untuk mean dan varians adalah 0 untuk kedua bagian. Sekarang ada dua hal berbeda yang mungkin menarik bagi kita:
1- Kami ingin menghitung varians dari produksi energi sepanjang tahun : kemudian dengan rata-rata dua varians kami tiba di nol, yang tidak benar karena energi per hari sepanjang tahun tidak konstan. Dalam hal ini kita perlu menambahkan varians semua sarana dari setiap subset. Secara matematis dalam hal ini variabel acak yang menarik adalah produksi energi per hari. Kami memiliki statistik sampel atas subset dan kami ingin menghitung statistik sampel lebih lama.
2- Kami ingin menghitung varian produksi energi per tahun: Dengan kata lain kami tertarik pada berapa banyak produksi energi berubah dari satu tahun ke tahun lainnya. Dalam hal ini rata-rata varians mengarah ke jawaban yang benar yaitu 0, karena di setiap tahun kami memproduksi tepat rata-rata 1500 MHW. Secara matematis dalam hal ini variabel acak bunga adalah rata-rata produksi energi per hari di mana rata-rata dilakukan sepanjang tahun.