Apakah saya perlu klasifikasi atau regresi untuk memprediksi ketersediaan pengguna yang diberikan beberapa fitur?


9

Saat mempelajari metode penambangan data, saya memahami bahwa ada dua kategori utama:

  • Metode prediksi:

    • Klasifikasi
    • Regresi
  • Metode deskriptif:

    • Clustering
    • Aturan asosiasi

Karena saya ingin memprediksi ketersediaan pengguna (output) berdasarkan lokasi, aktivitas, tingkat baterai (input untuk model pelatihan), saya pikir sudah jelas bahwa saya akan memilih "Metode prediktif", tetapi sekarang saya tidak bisa memilih antara klasifikasi dan regresi. Dari apa yang saya pahami sejauh ini, klasifikasi dapat menyelesaikan masalah saya, karena outputnya "tersedia" atau "tidak tersedia".

Bisakah klasifikasi memberi saya probabilitas (atau kemungkinan) dari pengguna yang tersedia atau tidak tersedia?

Seperti dalam output tidak hanya 0 (tidak tersedia) atau 1 (tersedia), tapi itu seperti:

  • 80% tersedia
  • 20% tidak tersedia

Bisakah masalah ini juga diselesaikan dengan menggunakan regresi?

8080%20%

Jawaban:


6
  1. Iya. Misalnya, regresi softmax yang populer memberi Anda distribusi probabilitas untuk setiap kelas.
  2. Iya. Softmax adalah regresi atas sekumpulan kelas diskrit.

Kita dapat menggunakan regresi untuk klasifikasi, strategi yang paling umum adalah mengambil kelas yang paling mungkin untuk prediksi.


1

Ya, Anda dapat pengguna baik klasifikasi atau regresi sesuai dengan kebutuhan output Anda,

Jika Anda ingin keluaran berlabel, seperti tersedia atau tidak tersedia maka klasifikasi harus digunakan.

Jika Anda ingin output dalam bentuk% ketersediaan maka regresi harus digunakan.


Bisakah Anda mendukung ini dengan sumber dari suatu tempat?
Mithical

-1

Anda dapat menggunakan klasifikasi naif bayes dan menghitung probabilitas posterior menggunakan keyakinan sebelumnya atau regresi logistik dapat digunakan dengan fungsi sigmoid.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.