Saya tidak yakin metode mana yang digunakan untuk memodelkan hubungan antara dua variabel ( dan y ) dalam percobaan yang dijelaskan sebagai berikut:
- Ada 3 variabel: , x dan y .
- Nilai diatur saat mengoperasikan percobaan. Namun, x dan x a i m tidak selalu sama.
- Koefisien korelasi Pearson antara dan x adalah sekitar 0,9.
- Koefisien korelasi Pearson antara dan y jauh lebih sedikit: sekitar 0,5.
- memiliki nilai maksimum yang mungkin ( y m a x ) yang tidak dapat dilampaui.
- Setiap titik data diperoleh setelah pengaturan dan membaca x dan y .
Meskipun koefisien korelasi Pearson antara dan y tidak besar, sepertinya y cenderung meningkat dengan x .
Setelah melakukan regresi linier sederhana dan x = g ( y ) (dan mengonversi yang terakhir sebagai g - 1 , sehingga ditampilkan pada grafik yang sama dengan f misalnya), kedua lereng positif, tetapi kemiringan g - 1 lebih besar dari pada f .
Apakah masuk akal untuk mengatakan atau x m a x = g ( y m a x ) ? ( x m a x akan dicapai lebih awal dalam kasus kedua.)
Menimbang bahwa terikat oleh y m a x , apa yang dapat dikatakan tentang nilai maksimum yang mungkin dari x yang bisa dicapai?
Sejauh yang saya mengerti, masuk akal untuk melakukan regresi linier dari bentuk ketika x adalah variabel independen dan y adalah variabel dependen. Namun, dalam konteks ini, saya tidak yakin apakah masuk akal untuk mempertimbangkan bahwa x independen dan y tergantung.
Apakah total regresi kuadrat terkecil lebih tepat? Apakah ada metode lain untuk menentukan nilai dari dapat dicapai (dan dengan yang kemungkinan)?
(Jika ini penting, dan y tampaknya tidak mengikuti distribusi normal, karena lebih banyak upaya telah dilakukan untuk mencoba mencapai nilai x yang lebih tinggi .)