Mengapa perlu menempatkan asumsi distribusi pada kesalahan, yaitu
ϵ i ∼ N ( 0 , σ 2 ) , dengan .
Kenapa tidak menulis
y i ~ N ( X β , σ 2 ) , dengan ,
di mana dalam kedua kasus . Saya telah melihatnya menekankan bahwa asumsi distribusi ditempatkan pada kesalahan, bukan data, tetapi tanpa penjelasan.
Saya tidak begitu mengerti perbedaan antara kedua formulasi ini. Beberapa tempat saya melihat asumsi distribusi ditempatkan pada data (Bayesian menyala sepertinya sebagian besar), tetapi kebanyakan kali asumsi ditempatkan pada kesalahan.
Ketika menjadi model, mengapa seseorang harus memilih untuk memulai dengan asumsi satu atau yang lain?