The t -values dan R2 digunakan untuk menilai hal yang sangat berbeda. Nilai- t digunakan untuk menilai keakuratan estimasi βi , tetapi R2 mengukur jumlah variasi dalam variabel respons yang dijelaskan oleh kovariat Anda. Misalkan Anda memperkirakan model regresi dengan n pengamatan,
Yi=β0+β1X1i+...+βkXki+ϵi
dimana ϵi∼i.i.dN(0,σ2) , i=1,...,n .
Nilai- t besar (dalam nilai absolut) mengarahkan Anda untuk menolak hipotesis nol bahwa βi=0 . Ini berarti Anda dapat yakin bahwa Anda telah memperkirakan tanda koefisien dengan benar. Juga, jika |t|> 4 dan Anda memiliki n>5 , maka 0 tidak berada dalam interval kepercayaan 99% untuk koefisien. Nilai- t untuk koefisien βi adalah selisih antara estimasi βi^ dan 0 yang dinormalisasi dengan standar kesalahan se{βi^} .
t=βi^se{βi^}
yang hanyalah perkiraan dibagi dengan ukuran variabilitasnya. Jika Anda memiliki dataset yang cukup besar, Anda akan selalu memiliki nilai- t signifikan secara statistik (besar) . Ini tidak berarti bahwa kovariat Anda menjelaskan banyak variasi dalam variabel respons.
Seperti yang disebutkan @Stat, R2 mengukur jumlah variasi dalam variabel respons Anda yang dijelaskan oleh variabel dependen Anda. Untuk informasi lebih lanjut tentang R2 , buka wikipedia . Dalam kasus Anda, tampaknya Anda memiliki set data yang cukup besar untuk memperkirakan βi secara akurat , tetapi kovariat Anda melakukan pekerjaan yang buruk dalam menjelaskan dan \ atau memprediksi nilai respons.