Dalam kasus khusus ini saya mengacu pada hari di mana sebuah danau membeku. Tanggal "es" ini hanya terjadi setahun sekali, tetapi kadang-kadang tidak terjadi sama sekali (jika musim dingin hangat). Jadi pada satu tahun danau itu mungkin membeku pada hari 20 (20 Januari), dan satu tahun lagi mungkin tidak membeku sama sekali.
Tujuannya adalah untuk mencari tahu pengendara ice-on date.
Prediktor akan menjadi hal-hal seperti suhu udara musim gugur / musim dingin setiap tahun. Tahun bisa menjadi prediktor untuk tren linear jangka panjang.
1) Apakah bilangan bulat "hari tahun" merupakan variabel respons yang masuk akal (jika tidak, apa itu?)?
2) Bagaimana seharusnya seseorang menangani tahun-tahun ketika danau tidak pernah membeku?
Edit:
Saya tidak tahu apa etiket di sini, tetapi saya pikir saya akan memposting hasil dari saran yang saya terima. Ini kertasnya, akses terbuka . Saya mendapat umpan balik yang baik tentang pendekatan yang digunakan, terima kasih @pedrofigueira dan @cboettig. Tentu saja, kesalahan adalah milik saya sendiri.