Ini agak seni, tetapi ada beberapa hal standar dan mudah yang selalu bisa dicoba.
Hal pertama yang harus dilakukan adalah mengekspresikan kembali variabel dependen ( ) untuk membuat residual menjadi normal. Itu tidak benar-benar berlaku dalam contoh ini, di mana titik-titik tampak jatuh sepanjang kurva nonlinier halus dengan sedikit pencar. Jadi kami melanjutkan ke langkah selanjutnya.y
Hal berikutnya adalah untuk mengekspresikan kembali variabel independen ( ) untuk linierisasi hubungan. Ada cara sederhana dan mudah untuk melakukan ini. Pilih tiga titik representatif di sepanjang kurva, lebih disukai di kedua ujung dan tengah. Dari gambar pertama saya membacakan pasangan terurut = , , dan . Tanpa informasi apa pun selain tampaknya selalu positif, pilihan yang baik adalah menjelajahi transformasi Box-Cox untuk berbagai kekuatan , biasanya dipilih kelipatan atau dan biasanya antara( r , y ) ( 10 , 7 ) ( 90 , 0 ) ( 180 , - 2 ) r r → ( r p - 1 ) / p p 1 / 2 1 / 3 - 1 1 p 0 log ( r )r(r,y)(10,7)(90,0)(180,−2)r r→(rp−1)/pp1/21/3−1 dan . (Nilai pembatas sebagai mendekati adalah .) Transformasi ini akan membuat hubungan linear perkiraan asalkan kemiringan antara dua titik pertama sama dengan kemiringan antara pasangan kedua.1p0log(r)
Misalnya, kemiringan data yang tidak diubah adalah = - dan = . Ini sangat berbeda: satu sekitar empat kali yang lain. Mencoba memberikan kemiringan , dll., Yang berfungsi ke dan : sekarang salah satunya hanya dua kali yang lain, yang merupakan peningkatan. Melanjutkan dengan cara ini (spreadsheet mudah digunakan), saya menemukan bahwa berfungsi dengan baik: lerengnya sekarang dan(0−7)/(90−10)0.088(−2−0)/(180−90)−0.022p=−1/2-16,6-32,4p≈0-7.3-6,6y=α+βlog(r)y(0−7)/(90−1/2−1−1/2−10−1/2−1−1/2)−16.6−32.4p≈0−7.3−6.6, nilai yang hampir sama. Akibatnya, Anda harus mencoba model dari bentuk . Kemudian ulangi: paskan satu baris, periksa residu, identifikasi transformasi untuk membuatnya mendekati simetris, dan iterate.y=α+βlog(r)y
John Tukey memberikan rincian dan banyak contoh dalam buku klasiknya Exploratory Data Analysis (Addison-Wesley, 1977). Dia memberikan prosedur yang serupa (tetapi sedikit lebih terlibat) untuk mengidentifikasi transformasi penstabilan varians dari . Satu dataset sampel yang ia suplai sebagai latihan menyangkut data berusia seabad tentang tekanan uap merkuri yang diukur pada berbagai suhu. Dengan mengikuti prosedur ini memungkinkan seseorang untuk menemukan kembali hubungan Clausius-Clapeyron ; residu hingga kecocokan akhir dapat diartikan sebagai efek mekanika kuantum yang terjadi pada jarak atom!y