Jelas bagi saya, dan dijelaskan dengan baik di beberapa situs, informasi apa yang diberikan nilai-nilai pada diagonal dari matriks topi untuk regresi linier.
Matriks topi dari model regresi logistik kurang jelas bagi saya. Apakah identik dengan informasi yang Anda dapatkan dari matriks yang menerapkan regresi linier? Ini adalah definisi dari matriks topi yang saya temukan pada topik CV lainnya (sumber 1):
dengan X vektor variabel prediktor dan V adalah matriks diagonal dengan .
Apakah itu, dengan kata lain, juga benar bahwa nilai tertentu dari matriks topi pengamatan juga hanya menyajikan posisi kovariat di ruang kovariat, dan tidak ada hubungannya dengan nilai hasil pengamatan itu?
Ini ditulis dalam buku "Analisis data kategorikal" dari Agresti:
Semakin besar tingkat pengamatan, semakin besar pengaruhnya terhadap kecocokan. Seperti dalam regresi biasa, leverage jatuh antara 0 dan 1 dan dijumlahkan ke jumlah parameter model. Tidak seperti regresi biasa, nilai topi tergantung pada kecocokan serta matriks model, dan poin yang memiliki nilai prediktor ekstrim tidak perlu memiliki leverage yang tinggi.
Jadi dari definisi ini, tampaknya kita tidak dapat menggunakannya karena kita menggunakannya dalam regresi linier biasa?
Sumber 1: Bagaimana menghitung matriks topi untuk regresi logistik di R?