Pertanyaan Anda yang ditautkan ditangani dengan menggunakan bobot sebagai cara pintas untuk menangani perbedaan per poin data yang sama berbobotnya di mana beberapa titik data muncul lebih dari satu kali.
@whuber telah membahas dalam komentar tentang situasi di mana varian semua titik data sama. Jadi saya akan membahas situasi di mana mereka tidak sama. Dalam situasi inilah rata-rata tertimbang yang optimal menghasilkan varian yang lebih rendah daripada rata-rata yang tidak berbobot, yaitu rata-rata yang sama-sama berbobot.
Mean tertimbang, menggunakan bobot , sama dengan , dan memiliki varian = . Jadi kami ingin meminimalkan , tunduk pada dan untuk semua i.wiΣni=1wixiΣni=1w2iVar(xi)Σni=1w2iVar(xi)Σni=1wi=1wi≥0
Kondisi Karush-Kuhn-Tucker, yang diperlukan dan cukup untuk minimum global untuk masalah ini, mengingat bahwa itu adalah masalah Pemrograman Kuadratik cembung, menghasilkan solusi bentuk tertutup, yaitu:
optimal untuk 1 = 1 .. n.wi=[1/Var(xi)]/Σnj=1[1/Var(xj)]
rata-rata tertimbang optimal yang sesuai = .1/Σni=1[1/Var(xi)]
Sebaliknya, bobot yang sama berarti untuk semua i, di mana n adalah jumlah titik data. Seperti yang ditunjukkan oleh whuber, bobot yang sama adalah optimal jika semua varian titik data sama, yang dapat dilihat dari rumus di atas untuk optimal . Namun, sebagaimana dibuktikan oleh formula itu, bobot yang sama tidak optimal jika varians titik data tidak semuanya sama, dan memang menghasilkan varians yang lebih besar (dari rata-rata tertimbang) daripada bobot optimal. Varians dari rata-rata tertimbang sama, yaitu, varian dari rata-rata tertimbang menggunakan bobot yang sama = .wi=1nwi1n2Σni=1Var(xi)
Berikut adalah beberapa contoh hasil numerik:
- Ada dua titik data, yang memiliki varian masing-masing 1 dan 4. Rata-rata tidak tertimbang memiliki varians = 1,25. Mean tertimbang menggunakan bobot optimal masing-masing 0,8 dan 0,2, memiliki varians = 0,8, yang tentu saja kurang dari 1,25.
- Ada tiga titik data, masing-masing memiliki varian 1, 4, dan 9. Rata-rata tidak tertimbang memiliki varians = 1,5556. Rata-rata tertimbang menggunakan bobot optimal masing-masing 0,7347, 0,1837, 0,0816, memiliki varians = 0,7347, yang tentu saja kurang dari 1,5556.
Tentu saja, mungkin untuk mean tertimbang untuk memiliki varian yang lebih besar dari rata-rata tidak tertimbang, jika bobot dipilih dengan cara yang buruk. Dengan memilih bobot 1 pada titik data dengan varians terbesar, dan 0 untuk semua poin data lainnya, mean tertimbang akan memiliki varians = varians terbesar dari setiap titik data. Contoh ekstrem ini akan menjadi hasil dari memaksimalkan daripada meminimalkan dalam masalah optimasi yang saya paparkan.