Saya punya dataset dengan format berikut.
Ada kanker hasil biner / tidak ada kanker. Setiap dokter dalam dataset telah melihat setiap pasien dan memberikan penilaian independen pada apakah pasien menderita kanker atau tidak. Para dokter kemudian memberikan tingkat kepercayaan mereka dari 5 bahwa diagnosis mereka benar, dan tingkat kepercayaan ditampilkan dalam tanda kurung.
Saya telah mencoba berbagai cara untuk mendapatkan perkiraan yang baik dari dataset ini.
Ini bekerja cukup baik bagi saya untuk rata-rata di seluruh dokter, mengabaikan tingkat kepercayaan mereka. Dalam tabel di atas yang akan menghasilkan diagnosa yang benar untuk Pasien 1 dan Pasien 2, walaupun itu akan salah mengatakan bahwa Pasien 3 menderita kanker, karena oleh mayoritas 2-1 para dokter berpikir Pasien 3 menderita kanker.
Saya juga mencoba metode di mana kami secara acak mengambil sampel dua dokter, dan jika mereka tidak setuju satu sama lain, maka suara yang diputuskan pergi ke dokter mana pun yang lebih percaya diri. Metode itu ekonomis karena kita tidak perlu berkonsultasi dengan banyak dokter, tetapi metode ini juga sedikit meningkatkan tingkat kesalahan.
Saya mencoba metode terkait di mana kami secara acak memilih dua dokter, dan jika mereka tidak setuju satu sama lain, kami secara acak memilih dua dokter lagi. Jika satu diagnosis didahului oleh setidaknya dua 'suara' maka kami menyelesaikan hal-hal yang mendukung diagnosis itu. Jika tidak, kami terus mengambil sampel lebih banyak dokter. Metode ini cukup ekonomis dan tidak membuat banyak kesalahan.
Saya tidak dapat menahan perasaan bahwa saya kehilangan beberapa cara yang lebih canggih dalam melakukan sesuatu. Sebagai contoh, saya bertanya-tanya apakah ada beberapa cara saya bisa membagi dataset menjadi set pelatihan dan tes, dan mencari beberapa cara optimal untuk menggabungkan diagnosis, dan kemudian melihat bagaimana bobot tersebut dilakukan pada set tes. Salah satu kemungkinan adalah semacam metode yang memungkinkan saya menurunkan berat badan dokter yang terus membuat kesalahan pada set uji coba, dan mungkin diagnosa berat badan yang dibuat dengan keyakinan tinggi (kepercayaan tidak berkorelasi dengan akurasi dalam dataset ini).
Saya punya berbagai dataset yang cocok dengan deskripsi umum ini, sehingga ukuran sampel bervariasi dan tidak semua dataset terkait dengan dokter / pasien. Namun, dalam dataset khusus ini ada 40 dokter, yang masing-masing melihat 108 pasien.
EDIT: Berikut adalah tautan ke beberapa bobot yang dihasilkan dari pembacaan saya atas jawaban @ jeremy-miles.
Hasil tidak tertimbang ada di kolom pertama. Sebenarnya dalam dataset ini nilai kepercayaan maksimum adalah 4, bukan 5 seperti yang saya katakan sebelumnya. Jadi dengan mengikuti pendekatan @ jeremy-miles, skor terbobot tertinggi yang bisa didapatkan oleh pasien adalah 7. Itu berarti bahwa setiap dokter menyatakan dengan tingkat kepercayaan 4 bahwa pasien tersebut menderita kanker. Skor tidak tertimbang terendah yang dapat diperoleh pasien adalah 0, yang berarti bahwa setiap dokter menyatakan dengan tingkat kepercayaan 4 bahwa pasien tersebut tidak menderita kanker.
Pembobotan oleh Cronbach's Alpha. Saya menemukan di SPSS bahwa ada keseluruhan Cronbach's Alpha 0,9807. Saya mencoba memverifikasi bahwa nilai ini benar dengan menghitung Cronbach's Alpha secara lebih manual. Saya membuat matriks kovarians dari 40 dokter, yang saya tempelkan di sini . Kemudian berdasarkan pada pemahaman saya tentang rumus Alpha Cronbach di manaadalah jumlah item (di sini para dokter adalah 'item') saya menghitung dengan menjumlahkan semua elemen diagonal dalam matriks kovarians, dandengan menjumlahkan semua elemen dalam matriks kovarians. Saya kemudian mendapatSaya kemudian menghitung 40 hasil Cronbach Alpha yang berbeda yang akan terjadi ketika setiap dokter dikeluarkan dari dataset. Saya menimbang dokter mana pun yang berkontribusi negatif terhadap Cronbach's Alpha di nol. Saya menemukan bobot untuk dokter yang tersisa sebanding dengan kontribusi positif mereka terhadap Cronbach's Alpha.
Bobot berdasarkan Korelasi Total Item. Saya menghitung semua Korelasi Total Item, dan kemudian bobot setiap dokter sebanding dengan ukuran korelasinya.
Bobot dengan Koefisien Regresi.
Satu hal yang saya masih tidak yakin tentang bagaimana mengatakan metode mana yang bekerja "lebih baik" daripada yang lain. Sebelumnya saya telah menghitung hal-hal seperti Skor Keterampilan Peirce, yang sesuai untuk contoh di mana ada prediksi biner dan hasil biner. Namun, sekarang saya memiliki perkiraan mulai dari 0 hingga 7 bukannya 0 hingga 1. Haruskah saya mengonversi semua skor tertimbang> 3,50 ke 1, dan semua skor tertimbang <3,50 ke 0?
Cancer (4)
hingga prediksi tidak ada kanker dengan kepercayaan maksimal No Cancer (4)
. Kita tidak bisa mengatakan itu No Cancer (3)
dan Cancer (2)
itu sama, tetapi kita bisa mengatakan ada sebuah kontinum, dan titik tengah dalam kontinum ini adalah Cancer (1)
dan No Cancer (1)
.
No Cancer (3)
adalahCancer (2)
? Itu akan sedikit menyederhanakan masalah Anda.