Adakah yang bisa menjelaskan kepada saya perbedaan nyata antara analisis regresi dan pemasangan kurva (linear dan nonlinier), dengan contoh jika mungkin?
Tampaknya keduanya mencoba untuk menemukan hubungan antara dua variabel (dependen vs independen) dan kemudian menentukan parameter (atau koefisien) yang terkait dengan model yang diusulkan. Misalnya, jika saya memiliki satu set data seperti:
Y = [1.000 1.000 1.000 0.961 0.884 0.000]
X = [1.000 0.063 0.031 0.012 0.005 0.000]
Adakah yang bisa menyarankan formula korelasi antara kedua variabel ini? Saya mengalami kesulitan memahami perbedaan antara kedua pendekatan ini. Jika Anda lebih suka mendukung jawaban Anda dengan set data lain, tidak apa-apa karena itu sepertinya sulit untuk dimasukkan (mungkin hanya untuk saya).
Kumpulan data di atas menunjukkan sumbu dan dari kurva karakteristik operasi penerima (ROC), di mana adalah tingkat positif sejati (TPR) dan adalah tingkat positif palsu (FPR).
Saya mencoba menyesuaikan kurva, atau melakukan analisis regresi sesuai pertanyaan awal saya, belum yakin, di antara poin-poin ini untuk memperkirakan TPR untuk FPR tertentu (atau sebaliknya).
Pertama, apakah secara ilmiah dapat diterima untuk menemukan fungsi pemasangan kurva antara dua variabel independen (TPR dan FPR)?
Kedua, apakah secara ilmiah dapat diterima untuk menemukan fungsi seperti itu jika saya tahu bahwa distribusi dari kasus negatif aktual dan positif sebenarnya tidak normal?