Saya menggunakan paket kuantreg untuk membuat model regresi menggunakan persentil ke-99 dari nilai-nilai saya dalam kumpulan data. Berdasarkan saran dari pertanyaan stackoverflow sebelumnya yang saya tanyakan, saya menggunakan struktur kode berikut.
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
yang saya tunjukkan diplot di atas data saya. Saya telah merencanakan ini menggunakan ggplot2, dengan nilai alpha untuk poin. Saya pikir ekor dari distribusi saya tidak dipertimbangkan secara memadai dalam analisis saya. Mungkin ini disebabkan oleh fakta bahwa ada poin individu, yang diabaikan oleh pengukuran tipe persentil.
Salah satu komentar menyarankan itu
Sketsa paket termasuk bagian tentang regresi kuantil nonlinear dan juga model dengan smoothing splines dll.
Berdasarkan pertanyaan saya sebelumnya, saya mengasumsikan hubungan logaritmik, tetapi saya tidak yakin apakah itu benar. Saya pikir saya bisa mengekstraksi semua poin pada interval persentil ke-99 dan kemudian memeriksanya secara terpisah, tetapi saya tidak yakin bagaimana melakukannya, atau jika itu merupakan pendekatan yang baik. Saya akan sangat menghargai saran tentang cara meningkatkan mengidentifikasi hubungan ini.