Salah satu asumsi untuk analisis regresi adalah dan tidak terjalin. Namun ketika saya memikirkannya, menurut saya masuk akal.
Berikut ini sebuah contoh. Jika kami memiliki tes dengan 3 bagian (AB dan C). Skor tes keseluruhan sama dengan jumlah skor individu untuk 3 bagian. Sekarang masuk akal untuk mengatakan itu dapat skor di bagian A dan skor tes keseluruhan. Kemudian regresi linier dapat menjawab pertanyaan ini: berapakah variabilitas dalam skor tes keseluruhan yang dikaitkan dengan bagian A? Di sini, beberapa skenario dimungkinkan:
- Bagian A adalah yang paling sulit dari 3 bagian dan siswa selalu mendapat nilai terendah di sana. Dalam kasus seperti itu, secara intuitifakan rendah. Karena sebagian besar skor tes keseluruhan akan ditentukan oleh B dan C.
- Bagian A sangat mudah bagi siswa. Dalam hal ini juga korelasinya tidak akan tinggi. Karena siswa selalu mendapat nilai 100% dari bagian ini dan oleh karena itu bagian ini tidak memberi tahu kita apa-apa tentang skor tes keseluruhan.
- Bagian A memiliki kesulitan intermmediate. Dalam hal ini korelasinya akan lebih kuat (tetapi ini juga tergantung pada skor lainnya (B dan C).
Contoh lain adalah ini: kami menganalisis konten total elemen jejak dalam urin. Dan kami menganalisis secara terpisah spesies individu (bentuk kimia) dari elemen jejak dalam urin. Mungkin ada banyak bentuk kimia. Dan jika analisis kami benar, jumlah bentuk kimia harus memberi kita sama dengan total konten elemen (dianalisis dengan teknik yang berbeda). Namun, masuk akal untuk bertanya apakah satu bentuk kimia berkorelasi dengan kandungan unsur total dalam urin, karena kandungan total ini merupakan indikator dari total asupan dari makanan unsur tersebut. Lalu, jika kita mengatakan itu adalah elemen total dalam urin dan adalah bentuk kimia A dalam urin kemudian dengan mempelajari korelasinya kita dapat mengeksplorasi apakah bentuk kimia ini adalah yang utama yang berkontribusi terhadap variabilitas keseluruhan atau tidak.
bagi saya itu masuk akal kadang-kadang bahkan ketika dan tidak independen dan bahwa ini dalam beberapa kasus dapat membantu menjawab pertanyaan ilmiah.
Apakah anda akan berpikir dapat bermanfaat atau bermakna dalam contoh di atas? Jika kita mempertimbangkan contoh nilai ujian di atas, saya sudah mengatakan akan ada sekitar 33% kontribusi setiap bagian jika kesulitannya persis sama untuk siswa. Namun dalam praktiknya hal ini belum tentu benar. Jadi saya berpikir mungkin menggunakan analisis regresi dapat membantu kita mengetahui variabilitas sebenarnya yang dikaitkan dengan setiap bagian dari ujian. Jadi menurut saya itu akan bermakna walaupun kita sudah tahu hipotesis nol itu tidak benar.
Apakah ada metode regresi alternatif yang dimodifikasi untuk memperhitungkan situasi seperti itu dan memberi kami parameter yang bermakna?