Bayangkan setiap garis regresi dipasang ke beberapa data.
Sekarang bayangkan sebuah titik data tambahan, suatu outlier yang agak jauh dari badan utama data, tetapi titik yang terletak di suatu tempat di sepanjang garis regresi itu.
Jika garis regresi harus dipasang kembali, koefisien tidak akan berubah. Sebaliknya, menghapus pencilan ekstra akan memiliki pengaruh nol pada koefisien.
Jadi, titik outlier atau leverage akan memiliki pengaruh nol jika itu sangat konsisten dengan sisa data dan model yang tersirat.
Untuk "line" baca "plane" atau "hyperplane" jika diinginkan, tetapi contoh paling sederhana dari dua variabel dan plot pencar sudah cukup di sini.
Namun, karena Anda menyukai definisi - sering, tampaknya, cenderung membaca terlalu banyak ke dalamnya - inilah definisi favorit saya tentang outlier:
"Pencilan adalah nilai sampel yang menyebabkan kejutan dalam kaitannya dengan sebagian besar sampel" (WN Venables dan BD Ripley. 2002. Statistik terapan modern dengan S. New York: Springer, hal.119).
Yang terpenting, kejutan ada di benak orang yang melihatnya dan bergantung pada beberapa model data yang diam-diam atau eksplisit. Mungkin ada model lain di mana outlier tidak mengejutkan sama sekali, katakanlah jika data benar-benar lognormal atau gamma daripada normal.
PS Saya tidak berpikir bahwa poin leverage harus kurang pengamatan tetangga. Sebagai contoh, mereka dapat terjadi berpasangan.