Estimasi parameter, seperti rata-rata sampel atau koefisien regresi OLS, adalah statistik sampel yang kami gunakan untuk menarik kesimpulan tentang parameter populasi yang sesuai. Parameter populasi adalah apa yang benar-benar kita pedulikan, tetapi karena kita tidak memiliki akses ke seluruh populasi (biasanya dianggap tak terbatas), kita harus menggunakan pendekatan ini sebagai gantinya. Namun, ada beberapa fakta tidak nyaman yang menyertai pendekatan ini. Misalnya, jika kami mengambil sampel lain, dan menghitung statistik untuk memperkirakan parameter lagi, kami hampir pasti akan menemukan bahwa itu berbeda. Selain itu, tak satu pun dari kedua estimasi ini yang cocok dengan nilai parameter sebenarnya yang ingin kami ketahui. Bahkan, jika kita melakukan ini berulang-ulang, terus mengambil sampel dan memperkirakan selamanya, kami akan menemukan bahwa frekuensi relatif dari nilai estimasi yang berbeda mengikuti distribusi probabilitas. Teorema batas pusat menunjukkan bahwa distribusi ini cenderung normal. Kita perlu cara untuk mengukur jumlah ketidakpastian dalam distribusi itu. Itulah yang dilakukan kesalahan standar untuk Anda.
Dalam contoh Anda, Anda ingin mengetahui kemiringan hubungan linear antara x1 dan y dalam populasi, tetapi Anda hanya memiliki akses ke sampel Anda. Dalam sampel Anda, kemiringan itu adalah 0,51, tetapi tanpa mengetahui berapa banyak variabilitas yang ada dalam distribusi sampel yang sesuai , sulit untuk mengetahui apa yang harus dibuat dari angka itu. Kesalahan standar, 0,05 dalam kasus ini, adalah standar deviasi dari distribusi pengambilan sampel. Untuk menghitung signifikansi, Anda membagi taksiran dengan SE dan mencari hasil bagi pada tabel. Dengan demikian, UK yang lebih besar berarti signifikansi yang lebih rendah .
Deviasi standar residual tidak ada hubungannya dengan distribusi sampel lereng Anda. Ini hanya deviasi standar dari sampel Anda yang tergantung pada model Anda. Tidak ada kontradiksi, juga tidak ada. Adapun cara Anda memiliki SD yang lebih besar dengan R ^ 2 yang tinggi dan hanya 40 titik data, saya kira Anda memiliki kebalikan dari batasan rentang - nilai x Anda tersebar sangat luas.