Pertama, saya harus menyatakan bahwa saya telah mencari jawabannya di situs ini. Saya juga tidak menemukan pertanyaan yang menjawab pertanyaan saya atau tingkat pengetahuan saya sangat rendah sehingga saya tidak menyadari bahwa saya sudah membaca jawabannya.
Saya sedang belajar untuk Ujian Statistik AP. Saya harus belajar regresi linier dan salah satu topiknya adalah residual. Saya memiliki salinan Pengantar Statistik dan Analisis Data pada halaman 253 yang dinyatakannya.
Poin yang tidak biasa dalam kumpulan data bivariat adalah yang jatuh jauh dari sebagian besar titik lain di sebar baik dalam arah atau arahy
Pengamatan berpotensi pengamatan berpengaruh jika memiliki nilai yang jauh dari sisa data (dipisahkan dari sisa data dalam arah ). Untuk menentukan apakah pengamatan itu sebenarnya berpengaruh, kami menilai apakah pemindahan pengamatan ini memiliki dampak besar pada nilai kemiringan atau mencegat garis kuadrat-terkecil.x
Pengamatan adalah pencilan jika memiliki residu yang besar. Pengamatan outlier jauh dari garis kuadrat terkecil di arah .
Stattreck.com menyatakan empat metode untuk menentukan pencilan dari residual:
Poin data yang menyimpang jauh dari pola keseluruhan disebut outlier. Ada empat cara bahwa suatu titik data dapat dianggap sebagai pencilan.
- Itu bisa memiliki nilai X ekstrim dibandingkan dengan titik data lainnya.
- Itu bisa memiliki nilai Y ekstrim dibandingkan dengan titik data lainnya.
- Itu bisa memiliki nilai X dan Y yang ekstrim.
- Mungkin jauh dari sisa data, bahkan tanpa nilai X atau Y yang ekstrim.
Kedua sumber ini tampaknya saling bertentangan. Adakah yang bisa membantu menjernihkan kebingungan saya. Juga, bagaimana seseorang mendefinisikan ekstrim. Statistik AP menggunakan aturan jika titik data di luar (Q1-1.5IQR, Q3 + 1.5IQR) itu adalah outlier. Saya tidak tahu bagaimana menerapkannya hanya dari grafik dari residu.