Bagian pertama dari ini pada dasarnya benar - tetapi 64% variasi dijelaskan oleh model. Dalam regresi linier sederhana: Y ~ X, jika adalah .64 itu berarti bahwa 64% variasi dalam Y ditentukan oleh hubungan linear antara Y dan X. Dimungkinkan untuk memiliki hubungan yang kuat dengan sangat rendah , jika hubungannya sangat non-linear.R 2R2R2
Mengenai dua pertanyaan bernomor Anda, tidak ada yang benar. Memang, ada kemungkinan bahwa tidak ada poin yang terletak tepat di garis regresi. Bukan itu yang diukur. Sebaliknya, itu adalah pertanyaan tentang seberapa dekat titik rata-rata dengan garis. Jika semua atau hampir semua titik dekat (bahkan jika tidak ada yang tepat di telepon) maka akan tinggi. Jika sebagian besar poin jauh dari garis, akan rendah. Jika sebagian besar poin dekat tetapi beberapa jauh, maka regresi tidak benar (masalah outlier). Hal-hal lain juga bisa salah.R 2R2R2
Selain itu, saya telah meninggalkan gagasan "jauh" agak kabur. Ini akan tergantung pada seberapa menyebar X itu. Menjadikan gagasan ini tepat adalah bagian dari apa yang Anda pelajari dalam kursus tentang regresi; Saya tidak akan membahasnya di sini.