Dalam sejumlah paket statistik termasuk SAS, SPSS dan mungkin lebih, ada opsi untuk "menekan intersep". Mengapa Anda ingin melakukan itu?
Dalam sejumlah paket statistik termasuk SAS, SPSS dan mungkin lebih, ada opsi untuk "menekan intersep". Mengapa Anda ingin melakukan itu?
Jawaban:
Jika karena alasan tertentu Anda mengetahui intersep (terutama jika nol), Anda dapat menghindari pemborosan varians dalam data Anda untuk memperkirakan sesuatu yang sudah Anda ketahui, dan lebih percaya pada nilai yang harus Anda perkirakan.
Contoh yang agak disederhanakan adalah jika Anda sudah tahu (dari pengetahuan domain) bahwa satu variabel adalah (rata-rata) kelipatan dari yang lain, dan Anda mencoba untuk menemukan kelipatan itu.
Pertimbangkan kasus kovariat kategori 3 tingkat. Jika seseorang memiliki intersep, itu akan membutuhkan 2 variabel indikator. Menggunakan pengkodean biasa untuk variabel indikator, koefisien untuk kedua variabel indikator adalah perbedaan rata-rata dibandingkan dengan kelompok referensi. Dengan menekan intersep, Anda akan memiliki 3 variabel yang mewakili kovariat kategoris, bukan hanya 2. Koefisien kemudian estimasi rata-rata untuk grup itu. Contoh yang lebih konkret tentang di mana harus melakukan ini adalah dalam ilmu politik di mana orang dapat mempelajari 50 negara bagian Amerika Serikat. Alih-alih memiliki intersep dan 49 variabel indikator untuk status, seringkali lebih baik untuk menekan intersep dan sebaliknya memiliki 50 variabel.
Untuk mengilustrasikan poin @Nick Sabbe dengan contoh spesifik.
Saya pernah melihat seorang peneliti mempresentasikan model usia pohon sebagai fungsi dari lebarnya. Dapat diasumsikan bahwa ketika pohon itu pada usia nol, secara efektif memiliki lebar nol. Jadi, intersep tidak diperlukan.