Hanya dengan menambahkan jawaban sebelumnya.
Regresi linier
Dimaksudkan untuk menyelesaikan masalah memprediksi / memperkirakan nilai output untuk elemen X yang diberikan (katakanlah f (x)). Hasil prediksi adalah fungsi cotinuous di mana nilainya mungkin positif atau negatif. Dalam hal ini Anda biasanya memiliki dataset input dengan banyak contoh dan nilai output untuk masing-masingnya. Tujuannya adalah agar dapat menyesuaikan model dengan kumpulan data ini sehingga Anda dapat memprediksi output untuk elemen baru yang berbeda / yang belum pernah dilihat. Berikut ini adalah contoh klasik dari pemasangan garis ke set titik, tetapi secara umum regresi linier dapat digunakan agar sesuai dengan model yang lebih kompleks (menggunakan derajat polinomial yang lebih tinggi):
Menyelesaikan masalah
Regresi Linea dapat diselesaikan dengan dua cara berbeda:
- Persamaan normal (cara langsung untuk menyelesaikan masalah)
- Gradient descent (pendekatan berulang)
Regresi logistik
Dimaksudkan untuk menyelesaikan masalah klasifikasi di mana diberikan elemen Anda harus mengklasifikasikan yang sama dalam kategori N. Contoh-contoh umum adalah misalnya diberikan surat untuk mengklasifikasikannya sebagai spam atau tidak, atau diberi kendaraan yang menemukan kategori yang dimilikinya (mobil, truk, mobil van, dll.). Itu pada dasarnya output adalah himpunan nilai descrete yang terbatas.
Menyelesaikan masalah
Masalah regresi logistik hanya bisa diselesaikan dengan menggunakan keturunan Gradient. Formulasi secara umum sangat mirip dengan regresi linier, satu-satunya perbedaan adalah penggunaan fungsi hipotesis yang berbeda. Dalam regresi linier, hipotesis memiliki bentuk:
h(x) = theta_0 + theta_1*x_1 + theta_2*x_2 ..
di mana theta adalah model yang kami coba paskan dan [1, x_1, x_2, ..] adalah vektor input. Dalam regresi logistik fungsi hipotesis berbeda:
g(x) = 1 / (1 + e^-x)
Fungsi ini memiliki properti yang bagus, pada dasarnya memetakan nilai apa pun ke kisaran [0,1] yang sesuai untuk menangani kemungkinan penggunaan selama classificatin. Misalnya dalam kasus klasifikasi biner g (X) dapat diartikan sebagai probabilitas untuk masuk ke kelas positif. Dalam hal ini biasanya Anda memiliki kelas yang berbeda yang dipisahkan dengan batas keputusan yang pada dasarnya merupakan kurva yang menentukan pemisahan antara kelas yang berbeda. Berikut ini adalah contoh dataset yang dipisahkan dalam dua kelas.