Saya telah melihat banyak dataset R, posting di DASL, dan di tempat lain, dan saya tidak menemukan banyak contoh bagus dari dataset menarik yang menggambarkan analisis kovarians untuk data eksperimen. Ada banyak dataset "mainan" dengan data yang dibuat di buku teks stat.
Saya ingin memiliki contoh di mana:
- Datanya nyata, dengan cerita yang menarik
- Setidaknya ada satu faktor pengobatan dan dua kovariat
- Setidaknya satu kovariat dipengaruhi oleh satu atau lebih faktor perawatan, dan satu tidak terpengaruh oleh perawatan.
- Eksperimental daripada observasional, lebih disukai
Latar Belakang
Tujuan saya yang sebenarnya adalah menemukan contoh yang baik untuk dimasukkan ke dalam sketsa untuk paket R. Tetapi tujuan yang lebih besar adalah bahwa orang perlu melihat contoh yang baik untuk menggambarkan beberapa masalah penting dalam analisis kovarians. Pertimbangkan skenario yang dibuat-buat berikut ini (dan tolong mengerti bahwa pengetahuan saya tentang pertanian paling tidak dangkal).
- Kami melakukan percobaan di mana pupuk diacak ke plot, dan tanaman ditanam. Setelah masa tanam yang sesuai, kami memanen tanaman dan mengukur beberapa karakteristik kualitas - itu adalah variabel respons. Tapi kami juga mencatat curah hujan total selama periode pertumbuhan, dan keasaman tanah pada saat panen - dan, tentu saja, pupuk apa yang digunakan. Jadi kami memiliki dua kovariat dan perawatan.
Cara biasa untuk menganalisis data yang dihasilkan adalah menyesuaikan model linier dengan perlakuan sebagai faktor, dan efek aditif untuk kovariat. Kemudian untuk merangkum hasil, satu menghitung "cara yang disesuaikan" (AKA kuadrat berarti), yang merupakan prediksi dari model untuk setiap pupuk, pada curah hujan rata-rata dan keasaman tanah rata-rata 3. Ini menempatkan semuanya pada pijakan yang sama, karena ketika kita membandingkan hasil ini, kita menahan curah hujan dan keasaman konstan.
Tapi ini mungkin hal yang salah untuk dilakukan - karena pupuk mungkin mempengaruhi keasaman tanah serta responsnya. Ini membuat penyesuaian berarti menyesatkan, karena efek perawatan termasuk pengaruhnya terhadap keasaman. Salah satu cara untuk mengatasi hal ini adalah dengan mengambil keasaman dari model, maka cara yang disesuaikan dengan curah hujan akan memberikan perbandingan yang adil. Tetapi jika keasaman penting, keadilan ini harus dibayar mahal, dalam peningkatan variasi residu.
Ada beberapa cara untuk mengatasinya dengan menggunakan versi keasaman yang disesuaikan dalam model alih-alih nilai aslinya. Pembaruan yang akan datang untuk paket R saya berarti membuat ini benar-benar mudah. Tetapi saya ingin memiliki contoh yang baik untuk menggambarkannya. Saya akan sangat berterima kasih kepada, dan akan dengan sepatutnya mengakui, siapa saja yang dapat mengarahkan saya ke beberapa dataset ilustrasi yang bagus.