Paket MASS yang datang dengan R Anda sudah terinstal, memiliki boxcox()
fungsi yang dapat Anda gunakan: Setelah membaca data, lakukan:
library(MASS)
boxcox(y ~ x)
Kemudian lihat grafik yang dihasilkan ini, yang menunjukkan secara grafis interval kepercayaan 95% untuk parameter transformasi boxcox. Tetapi Anda tidak benar-benar memiliki data yang cukup (n = 10) untuk melakukan ini, interval kepercayaan yang dihasilkan hampir dari -2 ke 2!, Dengan perkiraan kemungkinan maksimum sekitar 0 (log-transform, seperti yang dikatakan sebelumnya). Jika data nyata Anda memiliki lebih banyak pengamatan, Anda harus mencoba ini.
Seperti yang orang lain katakan, transformasi ini benar-benar berusaha menstabilkan varian. Ini tidak benar-benar jelas dari teori, apa yang dilakukannya, adalah mencoba untuk memaksimalkan fungsi kemungkinan berbasis distribusi normal, yang mengasumsikan varians konstan. Orang dapat berpikir bahwa memaksimalkan kemungkinan berdasarkan normal akan mencoba untuk menormalkan distribusi residu, tetapi dalam praktiknya kontribusi utama untuk memaksimalkan kemungkinan berasal dari menstabilkan varian. Ini mungkin tidak begitu mengejutkan, mengingat bahwa kemungkinan kita memaksimalkan didasarkan pada varian normal keluarga distribusi normal!
Saya pernah menulis demo berbasis slider di XLispStat, yang menunjukkan ini dengan jelas!