Mengapa masalah regresi disebut masalah "regresi"?


Jawaban:


34

Istilah "regresi" digunakan oleh Francis Galton dalam makalahnya tahun 1886 "Regresi terhadap mediokritas dalam status turun temurun". Sepengetahuan saya dia hanya menggunakan istilah dalam konteks regresi menuju rata-rata . Istilah ini kemudian diadopsi oleh orang lain untuk mendapatkan lebih atau kurang arti yang dimilikinya saat ini sebagai metode statistik umum.


15
Galton memperoleh perkiraan linier untuk memperkirakan tinggi anak laki-laki dari tinggi ayah di kertas itu. Persamaannya disesuaikan sehingga ayah tinggi rata-rata akan memiliki anak tinggi rata-rata, tetapi ayah yang lebih tinggi dari rata-rata akan memiliki anak yang lebih tinggi daripada rata-rata dengan 2/3 jumlah ayahnya. Sama dengan yang lebih pendek dari rata-rata. Ini bisa dikatakan sebagai regresi linier sederhana (makna hari ini). Dan tentu saja hari ini regresi memiliki makna yang lebih luas: model apa pun yang membuat prediksi terus menerus. Sangat menarik betapa penggunaan aslinya kata itu telah berubah.
rm999

3
Jawaban oleh NRH benar. Tautan berikut memberikan lebih banyak detail pada makalah Francis Galton "Regresi terhadap mediokritas dalam status turun temurun" blog.minitab.com/blog/statistics-and-quality-data-analysis/…
Gaurav Singhal

apakah sudah waktunya bagi komunitas statistik untuk mengganti kata 'regresi' dengan istilah yang lebih langsung dan jelas, mungkin 'prediktor rumus'?
Aviad Rozenhek

4

Bertentangan dengan kemajuan, kita kembali ke titik rata-rata, yaitu kemunduran. Oleh karena itu istilah regresi! Saya pikir ini sesuatu yang diambil dan macet.


2

@Mark White menyebutkan tautannya tetapi bagi Anda yang tidak punya banyak waktu untuk memeriksa tautannya, inilah jawaban yang dirujuk dengan tepat:

Asal 'regresi'

Istilah "regresi" diciptakan oleh Francis Galton pada abad ke-19 untuk menggambarkan fenomena biologis. Fenomena itu adalah bahwa ketinggian keturunan leluhur yang tinggi cenderung mundur ke bawah rata-rata normal (sebuah fenomena yang juga dikenal sebagai regresi menuju rata-rata) (Galton, dicetak ulang 1989). Bagi Galton, regresi hanya memiliki makna biologis ini (Galton, 1887) , tetapi karyanya kemudian diperluas oleh Udny Yule dan Karl Pearson ke konteks statistik yang lebih umum (Pearson, 1903).

Referensi

https://en.wikipedia.org/wiki/Regression_analysis#History

Galton, F. (1877). Hukum khas keturunan. AKU AKU AKU. Alam, 15 (389), 512-514.

Galton, F. (dicetak ulang 1989). Kekerabatan dan Korelasi. Ilmu Statistik, 4 (2), 80-86.

Pearson, K. (1903). Hukum keturunan leluhur. Biometrika, 2 (2), 211-228.


Regresi Galton seperti dalam 'regresi ke mean' masuk akal. namun saya tidak mengerti penggunaan kata 'regresi' berarti 'belajar rumus dari variabel independen ke variabel hasil'
Aviad Rozenhek

1
Ini lebih umum berarti itu, tetapi pembelajaran mesin menggunakan regresi tetapi regresi bukanlah teknik pembelajaran mesin, meskipun populer, pendapat yang salah. Pembelajaran statistik terpisah dari pembelajaran mesin, tetapi secara umum, para pendukung ML menggunakan metode statistik dan melabeli mereka secara tidak benar sebagai ML sehingga ketidaksesuaian yang tampak muncul. Regresi Galton adalah regresi; itu ada hubungannya dengan pemodelan / prediksi kecenderungan.
LSC

0

"Regresi" berasal dari "regresi" yang pada gilirannya berasal dari bahasa latin "regressus" - untuk kembali (ke sesuatu).

Dalam hal itu, regresi adalah teknik yang memungkinkan "kembali" dari data yang berantakan, sulit ditafsirkan, menjadi model yang lebih jelas dan lebih bermakna. Sebagai seorang fisikawan, saya menyukai gagasan itu, karena fisikawan melihat fenomena alam sebagai hasil ganda dari hukum alam yang relatif sederhana.

Dengan kata lain, kata regresi tampaknya menunjukkan bahwa data hanyalah efek nyata dan nyata dari "model statistik". Dengan kata lain, model yang didahulukan, dan keinginan Anda adalah menggunakan data "untuk kembali" ke tempat asalnya.


0

Seperti yang saya tahu kata regressiondalam arti statistik adalah pengukuran hubungan antara nilai rata-rata dari satu variabel dan nilai-nilai yang sesuai dari variabel lain.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.