Perbedaan utama antara interpolasi dan regresi, adalah definisi dari masalah yang mereka pecahkan.
Diberikan titik data, ketika Anda interpolasi, Anda mencari fungsi yang dari beberapa bentuk yang telah ditentukan yang memiliki nilai di titik-titik itu persis seperti yang ditentukan. Itu berarti pasangan yang diberikan ( x i , y i ) Anda mencari F dari beberapa bentuk yang telah ditentukan yang memenuhi F ( x i ) = y i . Saya pikir paling umum F dipilih menjadi polinomial, spline (polinomial derajat rendah pada interval antara titik-titik yang diberikan).n(xi,yi)FF(xi)=yiF
Ketika Anda melakukan regresi, Anda mencari fungsi yang meminimalkan beberapa biaya, biasanya jumlah kuadrat kesalahan. Anda tidak memerlukan fungsi untuk memiliki nilai yang tepat pada titik yang diberikan, Anda hanya ingin aproximation yang bagus. Secara umum, fungsi Anda menemukan mungkin tidak memuaskan F ( x i ) = y i untuk setiap titik data, tapi fungsi biaya, yaitu Σ n i = 1 ( F ( x i ) - y i ) 2 akan menjadi sekecil mungkin dari semua fungsi bentuk yang diberikan.FF(xi)=yi∑ni=1(F(xi)−yi)2
Contoh yang baik untuk mengapa Anda mungkin hanya ingin aproximate bukannya interpolasi adalah harga di pasar saham. Anda dapat mengambil harga dalam beberapa unit waktu terbaru, dan mencoba menginterpolasinya untuk mendapatkan beberapa prediksi harga dalam satuan waktu berikutnya. Ini agak ide yang buruk, karena tidak ada alasan untuk berpikir bahwa hubungan antara harga dapat diungkapkan dengan tepat oleh polinomial. Tetapi regresi linier dapat melakukan trik, karena harga mungkin memiliki beberapa "kemiringan" dan fungsi linear mungkin merupakan aproximasi yang baik, setidaknya secara lokal (petunjuk: itu tidak mudah, tetapi regresi jelas merupakan ide yang lebih baik daripada interpolasi dalam kasus ini). ).k