Apa perbedaan antara regresi ordinal dan peringkat?

10

Baik dalam regresi maupun peringkat ordinal Anda belajar dari variabel dependen yang diurutkan, jadi pertanyaan saya adalah:

Apa perbedaan dalam formulasi (jika ada) antara masalah regresi ordinal dan pembelajaran untuk menentukan peringkat masalah?

regression ordinal-data ranking

— Fabian Pedregosa
sumber

1

"Peringkat" per Everitt (setidaknya, edisi sebelumnya) hanya berarti "proses menyortir satu set variabel ke dalam urutan naik atau turun". Jadi, apa yang Anda maksud dengan peringkat?

— Peter Flom

2

Maksud saya peringkat dalam konteks pembelajaran mesin: en.wikipedia.org/wiki/Learning_to_rank

— Fabian Pedregosa

13

3 tahun kemudian, saya menjawab pertanyaan saya sendiri.

Bagi saya, perbedaan utama adalah apa output dari model dalam masalah yang berbeda. Dalam regresi ordinal, tugasnya adalah untuk memprediksi label untuk sampel yang diberikan, maka output dari prediksi adalah label (seperti halnya misalnya dalam klasifikasi multi-kelas). Di sisi lain, dalam masalah belajar menentukan peringkat, output adalah urutan urutan sampel. Yaitu, output dari model peringkat dapat dilihat sebagai permutasi yang membuat sampel memiliki label sesuai pesanan. Oleh karena itu, tidak seperti model regresi ordinal, algoritma peringkat tidak dapat memprediksi label kelas. Karena itu, input dari model peringkat tidak perlu menentukan label kelas, tetapi hanya urutan parsial antara sampel (lihat misalnya [0] untuk aplikasi ini). Dalam hal ini, peringkat adalah masalah yang lebih mudah daripada regresi ordinal:

Ini lebih baik dijelaskan dengan sebuah contoh. Misalkan kita memiliki pasangan (sampel, label) berikut: $\{(x_1, 1), (x_2, 2), (x_3, 2)\}$ . Dengan input ini, model peringkat akan memprediksi urutan urutan sampel ini. Misalnya, untuk algoritma peringkat, permutasi $(1, 2, 3) \to (1, 2, 3)$ dan $(1, 2, 3) \to (1, 3, 2)$ adalah prediksi dengan skor sempurna karena label kedua urutan $\{(x_1, 1), (x_2, 2), (x_3, 2)\}$ dan $\{(x_1, 1), (x_3, 2), (x_2, 2)\}$ dipesan. Di sisi lain, regresi ordinal akan memprediksi label untuk masing-masing sampel, dan dalam hal ini prediksi (1, 2, 2) akan memberikan skor sempurna, tetapi tidak (1, 2, 3) atau (1, 3, 2).

[0] Mengoptimalkan Mesin Pencari menggunakan Data Clickthrough Thorsten Joachims

— Fabian Pedregosa
sumber

2

Bisakah Anda merekomendasikan beberapa algoritma peringkat? Saya menghadapi masalah peringkat agak tetapi masih tidak tahu algoritma mana yang bisa mengatasinya. Terima kasih.

— Catbuilts

-1

Itu pertanyaan yang bagus! Secara umum perbedaan antara statistik dan pembelajaran mesin atau pendekatan bidang lain untuk pertanyaan "kami" mungkin sulit untuk dipahami, karena ada kebun binatang istilah yang terkait dengan setiap bidang.

Jadi, misalnya, ketika orang menemukan bahwa jaring saraf backprop "hanya" melakukan semacam regresi linier, itu seperti temuan besar di antara para peneliti .

Saya pikir ini adalah hal yang sama: hanya ada banyak teknik yang muncul untuk menyerang masalah yang sama. Logistik ordinal adalah satu.

— isomorfisma
sumber