Kedua tes secara implisit memodelkan hubungan usia-respons, tetapi mereka melakukannya dengan cara yang berbeda. Yang mana yang akan dipilih tergantung pada bagaimana Anda memilih untuk memodelkan hubungan itu. Pilihan Anda harus bergantung pada teori yang mendasarinya, jika ada; pada jenis informasi apa yang ingin Anda ekstrak dari hasil; dan tentang bagaimana sampel dipilih. Jawaban ini membahas tiga aspek ini secara berurutan.
Saya akan menjelaskan uji-t dan regresi logistik menggunakan bahasa yang mengandaikan Anda sedang mempelajari populasi orang yang terdefinisi dengan baik dan ingin membuat kesimpulan dari sampel ke populasi ini.
Untuk mendukung segala macam kesimpulan statistik kita harus mengasumsikan sampelnya acak.
Uji-t mengasumsikan orang-orang dalam sampel yang menjawab "tidak" adalah sampel acak sederhana dari semua tidak ada responden dalam populasi dan bahwa orang-orang dalam sampel menjawab "ya" adalah sampel acak sederhana dari semua responden ya dalam populasi.
Uji-t membuat asumsi teknis tambahan tentang distribusi usia dalam masing-masing dua kelompok dalam populasi. Berbagai versi uji-t ada untuk menangani kemungkinan yang mungkin terjadi.
Regresi logistik mengasumsikan semua orang dari usia berapa pun adalah sampel acak sederhana dari orang-orang dari usia itu dalam populasi. Kelompok usia yang berbeda dapat menunjukkan tingkat respons "ya" yang berbeda. Angka-angka ini, ketika dinyatakan sebagai peluang log (bukan sebagai proporsi lurus), diasumsikan terkait linear dengan usia (atau dengan beberapa fungsi usia yang ditentukan).
Regresi logistik mudah diperluas untuk mengakomodasi hubungan non-linear antara usia dan respons. Perluasan semacam itu dapat digunakan untuk mengevaluasi kemungkinan asumsi linier awal. Hal ini dapat dilakukan dengan dataset besar, yang memberikan cukup detail untuk menampilkan non-linearitas, tetapi tidak mungkin banyak digunakan dengan dataset kecil. Aturan umum - bahwa model regresi harus memiliki sepuluh kali pengamatan sebanyak parameter - menunjukkan bahwa secara substansial lebih dari 20 pengamatan diperlukan untuk mendeteksi nonlinier (yang membutuhkan parameter ketiga selain intersep dan kemiringan fungsi linier). ).
Uji-t mendeteksi apakah usia rata-rata berbeda antara tidak-dan ya-responden dalam populasi. Regresi logistik memperkirakan bagaimana tingkat respons bervariasi berdasarkan usia. Karena itu lebih fleksibel dan mampu memberikan informasi yang lebih rinci daripada uji-t. Di sisi lain, itu cenderung kurang kuat daripada uji-t untuk tujuan dasar mendeteksi perbedaan antara usia rata-rata dalam kelompok.
Adalah mungkin bagi pasangan tes untuk menunjukkan keempat kombinasi signifikansi dan non-signifikansi. Dua di antaranya bermasalah:
Uji-t tidak signifikan tetapi regresi logistik. Ketika asumsi kedua tes masuk akal, hasil seperti itu praktis tidak mungkin, karena uji-t tidak berusaha mendeteksi hubungan spesifik seperti yang diajukan oleh regresi logistik. Namun, ketika hubungan itu cukup nonlinear untuk menyebabkan subjek tertua dan termuda untuk berbagi satu pendapat dan subjek paruh baya yang lain, maka perpanjangan regresi logistik untuk hubungan nonlinear dapat mendeteksi dan mengukur situasi itu, yang tidak dapat dideteksi dengan uji-t. .
Uji-t signifikan tetapi regresi logistik tidak, seperti pada pertanyaan. Ini sering terjadi, terutama ketika ada sekelompok responden yang lebih muda, sekelompok responden yang lebih tua, dan sedikit orang di antaranya. Hal ini dapat membuat pemisahan yang besar antara tingkat respons responden yang menjawab tidak dan ya. Itu mudah terdeteksi oleh uji-t. Namun, regresi logistik akan memiliki informasi rinci yang relatif sedikit tentang bagaimana tingkat respons benar-benar berubah dengan bertambahnya usia atau akan memiliki informasi yang tidak meyakinkan: kasus "pemisahan total" di mana semua orang tua merespons dengan satu cara dan semua orang yang lebih muda dengan cara lain-- tetapi dalam kasus itu kedua tes biasanya memiliki nilai p yang sangat rendah.
Perhatikan bahwa desain eksperimental dapat membatalkan beberapa asumsi pengujian. Misalnya, jika Anda memilih orang berdasarkan usia mereka dalam desain bertingkat, maka asumsi uji-t (bahwa masing-masing kelompok mencerminkan sampel acak sederhana usia) menjadi dipertanyakan. Desain ini akan menyarankan mengandalkan regresi logistik. Jika sebaliknya Anda memiliki dua kelompok, satu dari yang tidak menanggapi dan satu dari yang menjawab ya, dan dipilih secara acak dari mereka untuk memastikan umur mereka, maka asumsi pengambilan sampel dari regresi logistik diragukan sementara yang dari uji-t akan berlaku. Desain itu akan menyarankan menggunakan beberapa bentuk uji-t.
(Desain kedua mungkin terlihat konyol di sini, tetapi dalam situasi di mana "usia" digantikan oleh beberapa karakteristik yang sulit, mahal, atau memakan waktu untuk mengukurnya dapat menarik.)