Sumber daya untuk mempelajari teknik berbagai sasaran?


11

Saya mencari sumber daya (buku, catatan kuliah, dll.) Tentang teknik yang dapat menangani data yang memiliki banyak target (Contoh: tiga variabel dependen: 2 diskrit dan 1 kontinu).

Apakah ada yang punya sumber daya / pengetahuan tentang ini? Saya tahu bahwa dimungkinkan untuk menggunakan jaringan saraf untuk ini.

Jawaban:


6

Hutan acak menanganinya dengan baik, lihat Apakah Hutan Acak dengan beberapa hasil mungkin / praktis? atau dokumentasi scikit belajar . Saya kira GBM atau metode berbasis pohon apa pun dapat diadaptasi dengan cara yang serupa.

Lebih umum, ketika Anda menjalankan algoritma pembelajaran apa pun yang meminimalkan skor, Anda biasanya berupaya meminimalkan yang satu dimensi. Tetapi Anda dapat menentukan fungsi target apa pun. Jika Anda mengerjakan prediksi posisi (dua dimensi), akan menjadi metrik yang baik.Σ i ( y i - y i ) 2 + ( x i - x i ) 2i(piyi)2i(y^iyi)2+(x^ixi)2

Jika Anda memiliki output tipe campuran (klasifikasi dan regresi) maka menentukan fungsi target mungkin akan mengharuskan Anda untuk menentukan fungsi target yang memberikan bobot lebih untuk beberapa target daripada yang lain: penskalaan apa yang Anda terapkan pada tanggapan kontinu? Kerugian mana yang Anda terapkan pada klasifikasi yang salah?

Adapun bacaan akademik lebih lanjut,

SVM Structured Learning's Wikipedia

Secara simultan Meningkatkan Output dan Struktur Tugas untuk Regresi Multi-Output

Metode Pemilihan Landmark untuk Prediksi Output Berganda (berkaitan dengan variabel dependen dimensi tinggi)


1
Mengingat regresi multi-target juga bermaksud untuk memodelkan hubungan antara Ys, tidakkah Anda menginginkan fungsi kerugian yang mengukur kecocokan hubungan itu?
Max Ghenis

3

Makalah ini melakukan pekerjaan yang baik untuk menggambarkan metode saat ini, toolkit yang tersedia, serta set data untuk diuji.

Saya kebetulan bekerja pada masalah komersial yang membutuhkan regresi multi-target, dan saya menemukan bahwa toolkit Clus memiliki perpaduan yang baik antara kinerja tinggi dan ketahanan

  • Dokumentasinya sangat bagus
  • Toolkit ini memiliki beberapa metode untuk klasifikasi dan regresi multi-target
  • Ini juga mendukung induksi dan pengelompokan berbasis aturan.
  • Model ensemble (Bagging, RandomForest) yang saya gunakan dapat dibaca dan ditafsirkan dengan mudah.

Beberapa metode yang lebih baru (pasca 2012) telah diimplementasikan sebagai perpanjangan dari toolkit Mulan, inilah tautan Github . Meskipun metode ini seperti Kombinasi Target Linier Acak melaporkan kinerja yang lebih baik daripada model ansambel, saya menemukan bahwa toolkit tidak seatur Clkit toolkit dan karenanya tidak menggunakannya.


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.