Saya sedang mencari studi kasus regresi linier lanjutan yang menggambarkan langkah-langkah yang diperlukan untuk memodelkan hubungan yang kompleks dan banyak non-linear menggunakan GLM atau OLS. Secara mengejutkan sulit untuk menemukan sumber daya yang melampaui contoh-contoh sekolah dasar: sebagian besar buku yang saya baca tidak akan lebih jauh dari transformasi log dari respons ditambah dengan BoxCox dari satu prediktor, atau spline alami dalam kasus terbaik. Juga semua contoh yang saya lihat sejauh ini mendekati setiap masalah transformasi data dalam model terpisah, seringkali dalam model prediktor tunggal.
Saya tahu apa itu transformasi BoxCox atau YeoJohnson. Apa yang saya cari adalah studi kasus kehidupan nyata yang terperinci di mana respons / hubungan tidak jelas. Misalnya, responsnya tidak sepenuhnya positif (sehingga Anda tidak dapat menggunakan log atau BoxCox), para prediktor memiliki hubungan non-linear antara mereka dan terhadap respons, dan transformasi data kemungkinan maksimum tampaknya tidak menyiratkan standar 0,33 atau 0,5 eksponen. Varians residual juga ditemukan non-konstan (tidak pernah ada), sehingga respons harus ditransformasikan juga dan pilihan harus dibuat antara regresi keluarga GLM non-standar atau transformasi respons. Peneliti kemungkinan akan membuat pilihan untuk menghindari overfitting data.
EDIT
Sejauh ini saya mengumpulkan sumber daya berikut:
- Strategi Pemodelan Regresi, F. Harrell
- Seri Waktu Ekonometrik Terapan, W. Enders
- Model linier dinamis dengan R, G. Petris
- Analisis Regresi Terapan, D. Kleinbaum
- Pengantar Pembelajaran Statistik, G. James / D. Tertulis
Saya hanya membaca yang terakhir (ISLR) dan itu adalah teks yang sangat bagus (5 bintang 5 di arloji saya), meskipun lebih berorientasi pada ML daripada pemodelan regresi maju.
Ada juga ini posting yang baik pada CV yang menyajikan kasus regresi menantang.