Saya telah normal-didistribusikan proses dari mana saya mendapatkan sampel kecil ( n biasanya 10-30) bahwa saya ingin gunakan untuk memperkirakan varians. Tetapi seringkali sampelnya sangat berdekatan sehingga kita tidak dapat mengukur titik individual di dekat pusat.
Saya memiliki pemahaman yang samar-samar ini bahwa kita harus dapat membangun penduga yang efisien menggunakan sampel yang dipesan: Misalnya, jika saya tahu sampel berisi 20 poin, dan bahwa 10 berkerumun di dekat pusat terlalu ketat untuk mengukur secara individual, tetapi saya memiliki pengukuran terpisah dari 5 pada kedua ekor, apakah ada pendekatan standar / formula untuk memperkirakan varians proses yang membuat penggunaan sampel yang optimal?
(Perhatikan bahwa saya tidak berpikir saya hanya dapat menimbang rata-rata pusat. Sebagai contoh, adalah mungkin untuk 7 sampel untuk mengelompok dengan ketat sementara tiga lainnya condong secara asimetris ke satu sisi tetapi cukup dekat kita tidak dapat mengatakannya tanpa pengambilan sampel tunggal yang lebih membosankan. .)
Jika jawabannya rumit, tip apa pun yang harus saya teliti akan dihargai. Misalnya, apakah ini masalah statistik pesanan? Apakah mungkin ada jawaban formula, atau ini masalah komputasi?
Detail yang diperbarui: Aplikasi ini menganalisis target pemotretan. Sampel yang mendasari tunggal adalah titik dampak ( x, y ) dari satu tembakan pada target. Proses yang mendasarinya memiliki distribusi normal bivariat simetris tetapi tidak ada korelasi antara sumbu, sehingga kami dapat memperlakukan sampel { x } dan { y } sebagai independen yang diambil dari distribusi normal yang sama. (Kami juga bisa mengatakan proses yang mendasari adalah Rayleigh-didistribusikan, tetapi kami tidak dapat mengukur sampel varian Rayleigh karena kami tidak dapat memastikan koordinat dari pusat "benar" dari proses, yang untuk n kecil dapat secara signifikan jauh dari pusat sampel ( , ).)
Kami diberi target dan jumlah tembakan ke dalamnya. Masalahnya adalah bahwa untuk n >> 3 senjata yang tepat biasanya akan menembak "lubang compang-camping" dikelilingi oleh tembakan yang berbeda. Kita dapat mengamati x - dan y - lebar lubang, tetapi kita tidak tahu di mana di lubang mana bidikan yang tidak berbeda terkena.
Berikut adalah beberapa contoh target yang lebih bermasalah:
(Memang, di dunia yang ideal kami akan mengubah / mengganti target setelah setiap tembakan dan kemudian mengumpulkan sampel untuk dianalisis. Ada sejumlah alasan yang sering tidak praktis, meskipun hal itu dilakukan jika memungkinkan .)
Catatan lebih lanjut berikut klarifikasi WHuber dalam komentar: Tembakan menghasilkan lubang target yang seragam dan diameternya diketahui. Ketika sebuah tembakan berada di luar "grup bergerigi" apa pun, kami mengetahui radius proyektil dan karenanya kami dapat mengukur pusat tepat . Dalam setiap "kelompok yang compang-camping" kita dapat melihat sejumlah "bola" periferal dan menandai lagi tepat pusat bidikan luar berdasarkan radius proyektil yang diketahui. Ini adalah sisa tembakan "disensor tengah" yang hanya kita ketahui terkena dampak di suatu tempat di bagian dalam "kelompok compang-camping" (yang biasanya - dan jika perlu mari kita asumsikan - satu per target).
Untuk memfasilitasi solusi, saya percaya akan lebih mudah untuk mengurangi ini ke satu set sampel satu dimensi dari normal, dengan interval pusat lebar w > d , di mana d adalah diameter proyektil, yang berisi sampel c < n "disensor".