Berikut adalah beberapa model yang sangat sederhana . Keduanya kekurangan setidaknya dalam satu cara, tetapi mungkin mereka akan memberikan sesuatu untuk membangun. Model kedua sebenarnya tidak (cukup) membahas skenario OP (lihat keterangan di bawah), tapi saya akan membiarkannya kalau-kalau itu membantu.
Model 1 : Varian dari model Bradley-Terry
Misalkan kita terutama tertarik untuk memprediksi apakah satu tim akan mengalahkan yang lain berdasarkan pemain di setiap tim. Kami hanya dapat merekam apakah Tim 1 dengan pemain mengalahkan Tim 2 dengan pemain ( k , ℓ ) untuk setiap pertandingan, mengabaikan skor akhir. Tentu saja, ini membuang beberapa informasi, tetapi dalam banyak kasus ini masih memberikan banyak informasi.(i,j)(k,ℓ)
Model kemudian
logit(P(Team 1 beats Team 2))=αi+αj−αk−αℓ.
Artinya, kami memiliki parameter "afinitas" untuk setiap pemain yang memengaruhi seberapa banyak pemain itu meningkatkan peluang kemenangan timnya. Definisikan "kekuatan" pemain dengan . Kemudian, model ini menyatakan bahwa
P ( Tim 1 mengalahkan Tim 2 ) = s i s jsi=eαi
P(Team 1 beats Team 2)=sisjsisj+sksℓ.
Ada simetri yang sangat bagus di sini karena tidak peduli bagaimana respons dikodekan selama konsisten dengan prediktor. Yaitu, kita juga memiliki
logit(P(Team 2 beats Team 1))=αk+αℓ−αi−αj.
Ini bisa cocok dengan mudah sebagai regresi logistik dengan prediktor yang merupakan indikator (satu untuk setiap pemain) yang mengambil nilai jika pemain saya ada di Tim 1 untuk permainan yang dimaksud, - 1 jika dia di Tim 2 dan 0 jika dia tidak berpartisipasi dalam game itu.+1i−10
Dari sini kami juga memiliki peringkat alami untuk para pemain. Semakin besar (atau s ), semakin besar pemain meningkatkan peluang timnya untuk menang. Jadi, kita bisa memberi peringkat pemain sesuai dengan perkiraan koefisien mereka. (Perhatikan bahwa parameter afinitas hanya dapat diidentifikasi hingga offset umum. Oleh karena itu, biasanya untuk memperbaiki α 1 = 0 untuk membuat model dapat diidentifikasi.)αsα1=0
Model 2 : Penilaian independen
NB : Setelah membaca ulang pertanyaan OP, jelas bahwa model-model di bawah ini tidak memadai untuk pengaturannya. Secara khusus, OP tertarik pada permainan yang berakhir setelah sejumlah poin dicetak oleh satu tim atau yang lain. Model di bawah ini lebih sesuai untuk gim yang memiliki durasi waktu tetap. Modifikasi dapat dibuat agar lebih cocok dalam kerangka OP, tetapi akan membutuhkan jawaban terpisah untuk dikembangkan.
Sekarang kami ingin melacak skor. Misalkan perkiraan yang masuk akal bahwa masing-masing tim mencetak poin secara independen satu sama lain dengan jumlah poin yang dicetak dalam setiap interval terlepas dari interval terpisah. Kemudian jumlah poin yang skor masing-masing tim dapat dimodelkan sebagai variabel acak Poisson.
ij
log(μ)=γi+γj
Perhatikan bahwa model ini mengabaikan pertarungan aktual antara tim, dengan fokus murni pada penilaian.
σi=eγi(i,j)(k,ℓ)
P(Team 1 beats Team 2 in sudden death)=σiσjσiσj+σkσℓ.
ρiδi(i,j)(k,ℓ)
log(μ1)=ρi+ρj−δk−δℓ
log(μ2)=ρk+ρℓ−δi−δj
Skor masih independen dalam model ini, tetapi sekarang ada interaksi antara pemain di setiap tim yang mempengaruhi skor. Pemain juga dapat diberi peringkat sesuai dengan estimasi koefisien afinitas mereka.
Model 2 (dan variasinya) memungkinkan prediksi skor akhir juga.
Ekstensi : Salah satu cara yang berguna untuk memperluas kedua model adalah dengan menggabungkan pemesanan di mana indikator positif sesuai dengan tim "rumah" dan indikator negatif untuk tim "tandang". Menambahkan istilah intersep ke model kemudian dapat diartikan sebagai "keunggulan bidang rumah". Ekstensi lain mungkin termasuk memasukkan kemungkinan ikatan di Model 1 (sebenarnya sudah kemungkinan di Model 2).
Catatan : Setidaknya satu dari jajak pendapat terkomputerisasi ( Peter Wolfe's ) yang digunakan untuk Bowl Championship Series di sepak bola perguruan tinggi Amerika menggunakan model Bradley-Terry (standar) untuk menghasilkan peringkatnya.