Regresi jauh lebih luas dalam tujuan dan ruang lingkup daripada klasifikasi atau pembelajaran mesin (namun yang terakhir mungkin dipahami). Namun, ada banyak tumpang tindih.
Hubungan
Hubungan yang dianalisis dengan regresi dapat terdiri dari
Asosiasi
Ketergantungan
Hal menyebabkan
Klasifikasi memberikan informasi tentang dua yang pertama, tetapi diam tentang sebab akibat. Baik regresi dan pembelajaran mesin telah digunakan - terkadang berhasil, seringkali bermasalah - untuk menarik kesimpulan tentang sebab-akibat.
Tujuan Regresi
Untuk mendapatkan ringkasan data multivarian.
Untuk menyisihkan efek variabel yang mungkin membingungkan masalah.
Berkontribusi pada upaya analisis kausal.
Ukur ukuran efek.
Cobalah untuk menemukan hukum matematika atau empiris.
Ramalan.
Pengecualian: mendapatkan "keluar dari jalan" ketika kita ingin mempelajari hubungan antara dua variabel lain yang mungkin dipengaruhi oleh .xx
(Setelah Mosteller & Tukey, Analisis dan Regresi Data, Bab 12B.)
Klasifikasi hampir tidak mencapai tujuan ini. Dalam cara yang terbatas itu mungkin memberikan semacam ringkasan (1) dan membantu dengan penemuan (5).
Pembelajaran mesin bertujuan untuk prediksi (6) hampir secara eksklusif. Sebagian besar teknik pembelajaran mesin, mulai dari hutan acak melalui jaringan saraf untuk mendukung model vektor, tidak jelas untuk pemahaman: mereka secara khusus tidak bertujuan untuk meringkas data (1), menghilangkan efek dari variabel pengganggu (2 dan 7), atau membantu kami menemukan keteraturan yang dapat diwujudkan dalam hukum empiris (5).
Posting ini adalah sedikit perluasan dari presentasi pengantar yang saya buat baru-baru ini untuk kursus semester dalam regresi. Lebih banyak bahan mengenai tujuan dan praktik regresi tersedia di sana.