Beberapa bulan yang lalu saya magang di organisasi ini; dan, sebagai hadiah pergi, saya memutuskan untuk menghabiskan minggu terakhir saya, dengan waktu luang apa pun yang saya miliki, untuk menyelidiki faktor-faktor yang mempengaruhi gaji guru. Satu masalah yang saya hadapi dengan gaji guru adalah bahwa distribusi untuk kondisi yang diberikan miring. Saya memiliki banyak pengamatan yang melekat pada ujung bawah dari spektrum upah. Saya mencoba menyelesaikan ini dengan memasukkan Indeks Upah Sebanding ke dalam variabel dependen saya (upah guru), tetapi hasil yang saya temukan benar-benar ketinggalan zaman untuk ruang lingkup proyek saya. Saya malah memutuskan untuk mencatat variabel dependen saya. Ini bagus karena sekarang upah saya memiliki distribusi normal dan terlihat sempurna dalam histogram. Ketika saya mulai menguji, saya sampai pada titik di mana saya ditinggalkan dengan satu variabel independen terakhir, pengembalian pajak properti. Masalah dengan upah normatif saya juga terlihat dalam pengamatan pengembalian pajak properti saya. Saya memiliki kecenderungan besar pada angka pengembalian pajak properti ke bagian bawah spektrum. Jadi, saya mencatat variabel ini juga dan masih lulus uji hipotesis nol.
Saya tidak yakin apakah ini benar, tetapi dengan membandingkan perubahan dari satu variabel log ke variabel log lainnya memberi saya elastisitas. Dengan asumsi bahwa ini benar, persamaan regresi saya (sesuatu seperti LogWages = B0 + B1 (LogPropertyTaxReturns)) menunjukkan elastisitas antara dua variabel. Apakah ini bermakna? Jika tujuan saya adalah untuk melihat variabel mana yang paling mempengaruhi gaji guru di negara bagian saya, maka apakah elastisitas antara kedua variabel itu membantu? Kami ingin menaikkan kabupaten dengan gaji guru terendah lebih tinggi untuk meningkatkan standar hidup mereka, tetapi saya khawatir saya telah memperkirakan jauh dari pengamatan nyata bahwa persamaan regresi kesimpulan saya tidak ada artinya.
Sunting: Salah satu ketakutan saya yang lebih besar adalah bahwa saya seharusnya menggunakan model non-linear untuk menunjukkan hubungannya. Saya merasa bahwa memaksa baik variabel dependen dan independen untuk bekerja sama dalam regresi linier ini menyesatkan dalam beberapa cara.