Untuk memahami mengapa kita menggunakan t-distribusi, Anda perlu tahu apa adalah distribusi yang mendasari β dan dari jumlah sisa kuadrat ( R S S ) sebagai dua put bersama-sama ini akan memberi Anda t-distribusi.βˆRSS
Bagian mudah adalah distribusi β yang merupakan distribusi normal - untuk melihat catatan ini bahwa β = ( X T X ) - 1 X T Y sehingga merupakan fungsi linier dari Y di mana Y ~ N ( X β , σ 2 I n ) . Akibatnya ia juga terdistribusi normal, β ~ N ( β , σ 2 ( X T X ) -βˆβˆ(XTX)−1XTYYY∼N(Xβ,σ2In)- beritahu saya jika Anda membutuhkan bantuan berasal distribusi β .βˆ∼N(β,σ2(XTX)−1)βˆ
Selain itu, , di mana n adalah jumlah pengamatan dan p adalah jumlah parameter yang digunakan dalam regresi Anda. Buktinya sedikit lebih terlibat, tetapi juga langsung diturunkan (lihat buktinya di sini. Mengapa RSS didistribusikan chi square kali np? ).RSS∼σ2χ2n−pnp
Sampai titik ini saya telah dianggap segalanya dalam matriks / vektor notasi, tapi mari kita untuk digunakan kesederhanaan β i dan menggunakan distribusi normal yang akan memberi
kita: β i - β iβˆi
βˆi−βiσ(XTX)−1ii−−−−−−−−√∼N(0,1)
Selain itu, dari distribusi chi-squared dari kita memiliki bahwa:
( n - p ) s 2RSS
(n−p)s2σ2∼χ2n−p
Ini hanyalah penataan ulang dari ekspresi chi-squared pertama dan tidak bergantung pada . Selain itu, kami mendefinisikan s 2 = R S SN(0,1) , yang merupakan penaksir tidak bias untukσ2. Dengan definisi definisitn-pbahwa membagi distribusi normal dengan chi-kuadrat independen (lebih dari derajat kebebasannya) memberi Anda distribusi-t (untuk buktinya lihat:Normal dibagi dengan√s2=RSSn−pσ2tn−p memberi Anda distribusi-t - buktiχ2(s)/s−−−−−−√) Anda mendapatkan bahwa:
βˆi−βis(XTX)−1ii−−−−−−−−√∼tn−p
s(XTX)−1ii−−−−−−−−√=SE(βˆi)
Beri tahu saya jika ini masuk akal.