Saya akrab dengan konsep variabel kategori dan masing-masing pengkodean variabel dummy yang memungkinkan kita untuk menyesuaikan satu level sebagai dasar untuk menghindari kolinearitas. Saya juga terbiasa dengan cara menginterpretasikan estimasi parameter dari model seperti itu: Perubahan yang diprediksi dalam hasil untuk level pas yang diberikan dari prediktor kategoris, relatif terhadap kategori baseline.
Apa yang saya tidak yakin tentang adalah bagaimana menafsirkan seperangkat variabel independen yang proporsi yang menjumlahkan satu . Kita lagi memiliki collinearity jika kita memasukkan semua proporsi dalam model, jadi mungkin kita harus meninggalkan satu kategori sebagai baseline. Saya juga berasumsi saya akan melihat tipe III SS untuk keseluruhan uji signifikansi variabel ini. Namun, bagaimana kita menginterpretasikan estimasi parameter untuk level-level yang sesuai dengan model vs yang dianggap sebagai baseline?
Contoh : Pada tingkat kode pos, variabel independen adalah proporsi batuan metamorf, batuan beku dan sedimen. Seperti yang Anda ketahui, ini adalah tiga jenis batuan utama, dan semua batuan diklasifikasikan sebagai salah satunya. Dengan demikian, proporsi di ketiga jumlah ke 1. Hasilnya adalah tingkat radon rata-rata dalam kode pos masing-masing.
Jika saya cocok, mengatakan, metamorf dan batuan beku proporsi sebagai prediktor dalam model, meninggalkan sedimen sebagai dasar, jenis keseluruhan III SS F -test dari dua tingkat dipasang akan menandakan apakah jenis batuan, secara keseluruhan, adalah penting prediktor hasil (tingkat radon rata-rata). Kemudian, saya bisa melihat nilai p individu (berdasarkan distribusi t ) untuk menentukan apakah satu atau kedua jenis batuan berbeda secara signifikan dari baseline.
Namun, ketika datang ke perkiraan parameter, otak saya terus ingin menafsirkannya murni sebagai perubahan yang diprediksi dalam hasil antara kelompok (jenis batuan), dan saya tidak mengerti bagaimana memasukkan fakta bahwa mereka cocok sebagai proporsi .
Jika perkiraan untuk metamorf adalah, katakanlah, 0,43, interpretasinya tidak hanya bahwa tingkat radon rata-rata yang diprediksi meningkat sebesar 0,43 unit ketika batuan itu metamorf vs sedimen. Namun, interpretasi ini juga tidak hanya untuk beberapa jenis peningkatan unit (katakanlah 0,1) dalam proporsi jenis batuan metamorf, karena ini tidak mencerminkan fakta bahwa itu juga relatif terhadap garis dasar ( sedimen ), dan, juga, perubahan itu proporsi metamorfik secara inheren mengubah proporsi kecocokan tingkat batuan lainnya dalam model, beku .
Apakah ada yang punya sumber yang menyediakan interpretasi model seperti itu, atau bisakah Anda memberikan contoh singkat di sini jika tidak?