Pertimbangkan masalah analisis data klasik di mana Anda memiliki hasil dan bagaimana hal itu terkait dengan sejumlah prediktor . Jenis dasar aplikasi yang perlu diingat di sini adalah itu
adalah beberapa hasil tingkat grup seperti tingkat kejahatan di kota .
Prediktor adalah karakteristik tingkat kelompok seperti fitur demografis kota .
Tujuan dasarnya adalah untuk menyesuaikan model regresi (mungkin dengan efek acak tetapi lupakan itu untuk saat ini):
Apakah beberapa kesulitan teknis muncul ketika satu (atau lebih) dari prediktor adalah hasil survei yang memiliki ukuran sampel yang berbeda untuk setiap unit? Sebagai contoh, anggaplah adalah skor ringkasan untuk kota i yang merupakan respons rata-rata dari sampel individu dari kota i tetapi ukuran sampel yang didasarkan pada rata-rata ini sangat berbeda:
Karena variabel prediktor tidak semuanya memiliki arti yang sama, dalam arti tertentu, untuk masing-masing kota, saya khawatir bahwa mengkondisikan variabel-variabel ini dalam model regresi seolah-olah mereka semua "diciptakan sama" dapat menyebabkan beberapa kesimpulan yang menyesatkan.
Apakah ada nama untuk jenis masalah ini? Jika demikian, apakah ada penelitian tentang cara menangani ini?
Pemikiran saya adalah memperlakukannya sebagai variabel prediktor yang diukur dengan kesalahan dan melakukan sesuatu di sepanjang garis ini tetapi ada heteroskedastisitas dalam kesalahan pengukuran, sehingga akan sangat rumit. Saya bisa memikirkan hal ini dengan cara yang salah atau mungkin membuat ini lebih rumit daripada itu tetapi diskusi di sini akan membantu.