Bagaimana interpolasi terkait dengan konsep regresi?


17

Jelaskan secara singkat Apa yang dimaksud dengan interpolasi. Bagaimana ini terkait dengan konsep regresi?

interpolasi adalah seni membaca di antara garis-garis sebuah tabel dan dalam matematika dasar, istilah itu biasanya menunjukkan proses penghitungan nilai-nilai perantara dari suatu fungsi dari sekumpulan nilai tabular yang diberikan atau fungsi tersebut.

Saya tidak bisa memberikan jawaban dari pertanyaan kedua. Tolong bantu


4
Regresi bertujuan mengidentifikasi fungsi untuk menggambarkan nilai yang diharapkan dari (variabel dependen) yang diberikan X (variabel independen). Interpolasi menggunakan regresi untuk memprediksi nilai Y pada nilai X yang diberikan . Perbedaannya halus tetapi mengemuka dalam model di mana Y berkorelasi, karena kemudian nilai prediksi biasanya berbeda dari nilai regresi mereka. Baik regresi maupun prediksi tidak berlaku langsung untuk interpolasi dalam tabel matematika, yang biasanya diasumsikan tidak memiliki kesalahan acak, tetapi algoritma mereka masih dapat digunakan. YXYXY
whuber

2
Apakah ini berhasil untuk beberapa kelas?
Glen_b -Reinstate Monica

Jawaban:


23

Perbedaan utama antara interpolasi dan regresi, adalah definisi dari masalah yang mereka pecahkan.

Diberikan titik data, ketika Anda interpolasi, Anda mencari fungsi yang dari beberapa bentuk yang telah ditentukan yang memiliki nilai di titik-titik itu persis seperti yang ditentukan. Itu berarti pasangan yang diberikan ( x i , y i ) Anda mencari F dari beberapa bentuk yang telah ditentukan yang memenuhi F ( x i ) = y i . Saya pikir paling umum F dipilih menjadi polinomial, spline (polinomial derajat rendah pada interval antara titik-titik yang diberikan).n(xi,yi)FF(xi)=yiF

Ketika Anda melakukan regresi, Anda mencari fungsi yang meminimalkan beberapa biaya, biasanya jumlah kuadrat kesalahan. Anda tidak memerlukan fungsi untuk memiliki nilai yang tepat pada titik yang diberikan, Anda hanya ingin aproximation yang bagus. Secara umum, fungsi Anda menemukan mungkin tidak memuaskan F ( x i ) = y i untuk setiap titik data, tapi fungsi biaya, yaitu Σ n i = 1 ( F ( x i ) - y i ) 2 akan menjadi sekecil mungkin dari semua fungsi bentuk yang diberikan.FF(xi)=yii=1n(F(xi)yi)2

Contoh yang baik untuk mengapa Anda mungkin hanya ingin aproximate bukannya interpolasi adalah harga di pasar saham. Anda dapat mengambil harga dalam beberapa unit waktu terbaru, dan mencoba menginterpolasinya untuk mendapatkan beberapa prediksi harga dalam satuan waktu berikutnya. Ini agak ide yang buruk, karena tidak ada alasan untuk berpikir bahwa hubungan antara harga dapat diungkapkan dengan tepat oleh polinomial. Tetapi regresi linier dapat melakukan trik, karena harga mungkin memiliki beberapa "kemiringan" dan fungsi linear mungkin merupakan aproximasi yang baik, setidaknya secara lokal (petunjuk: itu tidak mudah, tetapi regresi jelas merupakan ide yang lebih baik daripada interpolasi dalam kasus ini). ).k


Jawaban bagus. Saya ingin menambahkan bahwa dengan regresi, ada model statistik di belakangnya yang mendefinisikan hubungan antara dan X dalam beberapa distribusi, di mana kami memperkirakan itu berarti (atau median, atau kuantil dll dalam berbagai rasa regresi), misalnya statistik .stackexchange.com / pertanyaan / 173660 / ...YX
Tim

Bukankah contoh yang Anda gambarkan adalah ekstrapolasi dan bukan interpolasi?
bi_scholar

6

Dua jawaban sebelumnya telah menjelaskan hubungan antara interpolasi linier dan regresi linier (atau bahkan interpolasi umum dan regresi polinomial). Tetapi koneksi penting adalah bahwa sekali Anda cocok dengan model regresi Anda dapat menggunakannya untuk menginterpolasi antara poin data yang diberikan.


Jadi, ketika saya mundur, katakanlah, tinggi terhadap jenis kelamin saya dapat melakukan interpolasi untuk menemukan ketinggian yang diharapkan dari setengah pria, setengah wanita! Contoh fantastis ini menyoroti kelemahan dasar dalam respons ini, yang merupakan asumsi bahwa semua regresi dalam model regresi harus merupakan variabel kontinu.
whuber

2
Jawaban saya berlaku ketika semua variabel prediktor adalah kontinu ..
Michael R. Chernick

4

Semoga ini akan datang agak cepat dengan contoh dan visualisasi sederhana.

Misalkan Anda memiliki data berikut:

X  Y
1  6
10 15
20 25
30 35
40 45
50 55

Kita dapat menggunakan regresi untuk memodelkan Y sebagai respons terhadap X. Menggunakan R: lm(y ~ x)

Hasilnya adalah intersep dari 5, dan koefisien untuk x dari 1. Yang berarti Y sewenang-wenang dapat dihitung untuk X yang diberikan sebagai X + 5. Sebagai gambar, Anda dapat melihat dengan cara ini:

enter image description here

Perhatikan bagaimana jika Anda pergi ke sumbu X, di mana saja di sepanjang itu, dan menarik garis ke garis yang pas, dan kemudian menarik garis ke sumbu Y, Anda bisa mendapatkan nilai, apakah saya memberikan titik nilai atau tidak untuk Y. Regresi merapikan area tanpa data dengan memperkirakan hubungan yang mendasarinya.


2

perbedaan mendasar b / w Interpolasi dan regresi adalah sebagai berikut: Interpolasi: misalkan ada n poin (mis: 10 titik data), dalam interpolasi kita akan cocok dengan kurva yang melewati semua titik data (yaitu di sini 10 titik data) dengan tingkat polinomial (no.of poin data -1; yaitu di sini adalah 9). Di mana seperti dalam regresi tidak semua poin data hanya satu set yang diperlukan untuk pemasangan kurva.

umumnya urutan Interpolasi & regresi akan menjadi (1,2 atau 3) jika urutannya lebih dari 3, lebih banyak osilasi akan terlihat dalam kurva.


2
Ini menyiratkan bahwa interpolasi didasarkan pada polinomial, tetapi ada beberapa metode lain, seperti spline kubik, pietewise cubic Hermite, tetangga terdekat, dll.
Nick Cox

@Nick Meskipun Anda benar, aneh bahwa setiap metode yang Anda sebutkan sebenarnya berdasarkan polinomial! Mungkin interpolator non-polinomial paling sederhana dan paling terkenal adalah pembobotan jarak-terbalik (IDW).
whuber

@whuber Setuju; jika polinomial dapat diterapkan dengan kendala, maka sebagian besar metode memenuhi syarat, misalnya tetangga terdekat = konstan konstan, dll.
Nick Cox

2

Regresi adalah proses menemukan garis yang paling cocok [1]. Interpolasi adalah proses menggunakan garis paling cocok untuk memperkirakan nilai satu variabel dari nilai yang lain, asalkan nilai yang Anda gunakan berada dalam kisaran data Anda. Jika itu di luar kisaran, maka Anda akan menggunakan Extrapolation [1].

[1] http://mathhelpforum.com/advanced-applied-math/182558-interpolation-vs-regress.html


2
Jawaban ini tidak membedakan interpolasi dari ekstrapolasi. Apakah Anda mempertahankan mereka adalah hal yang sama? BTW, forum matematika (dan buku teks dan makalah, bahkan) umumnya bukan sumber informasi yang baik tentang masalah statistik, karena mereka cenderung berfokus pada makna matematika sempit yang - walaupun benar dan berguna dalam aplikasi matematika murni - mungkin tidak berlaku lebih luas .
whuber

1

Dengan pemasangan interpolasi atau spline, yang kita dapatkan adalah data numerik (taruhan interpolasi setiap pasangan data asli) dengan ukuran lebih besar, yang bila diplot menghasilkan efek kurva yang halus. Pada kenyataannya, antara setiap pasangan data asli polinomial yang berbeda dipasang, oleh karena itu seluruh kurva setelah interpolasi adalah kurva kontinyu sepotong-bijaksana, di mana setiap bagian dibentuk dari polinomial yang berbeda.

Jika seseorang mencari representasi parametrik dari data numerik asli, regresi harus dilakukan. Anda juga dapat mencoba menyesuaikan polinomial tingkat tinggi dengan spline. Bagaimanapun, representasi akan menjadi perkiraan. Anda juga dapat memeriksa seberapa akurat perkiraannya.


Tampaknya Anda belum memiliki kesempatan untuk membaca komentar Nick Cox , yang menunjukkan bahwa tidak semua interpolator adalah polinomial (lokal).
whuber

0

Baik regresi dan interpolasi digunakan untuk memprediksi nilai suatu variabel (Y) untuk nilai yang diberikan dari variabel lain (X). Dalam Regresi kita dapat memprediksi nilai dari variabel dependen (Y) untuk nilai yang diberikan dari variabel independen (X) Bahkan jika itu di luar kisaran nilai-nilai yang ditabulasi. Tetapi dalam kasus Interpolasi kita hanya dapat memprediksi nilai-nilai variabel dependen (Y) untuk nilai variabel independen (X) yang berada dalam kisaran nilai yang diberikan X.


0

Interpolasi adalah proses pemasangan sejumlah titik antara x = a dan x = b persis ke polinomial interpolasi. Interpolasi dapat digunakan untuk menemukan nilai perkiraan (atau nilai yang hilang) dari y dalam domain x = [a, b] dengan akurasi yang lebih baik daripada teknik regresi.

Di sisi lain, regresi adalah proses menyesuaikan sejumlah titik ke kurva yang melewati atau dekat titik dengan kesalahan kuadrat minimal. Regresi tidak akan memperkirakan nilai y dalam domain x = [a, b] seakurat interpolasi namun regresi memberikan prediksi yang lebih baik daripada interpolasi untuk nilai-nilai y dalam domain antara x = (- infinity, a) dan x = ( b, + tak terhingga).

In summary, interpolation provide better accuracy in the value of y within the domain of a known x range while regression provides better predictions of y in the domain below and beyond the known range of x.


3
It's not a definition of interpolation that a polynomial is used. Other smooth functions could be appropriate.
Nick Cox

3
There are other issues with your claims. For instance, regression can be more accurate than interpolation. The statistical distinction between the two procedures is quite different from what you represent: please see the other posts in this thread.
whuber
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.