Saya tidak dapat secara spesifik tentang sifat data karena ini adalah hak milik, tetapi anggaplah kami memiliki data seperti ini: Setiap bulan, beberapa orang mendaftar untuk suatu layanan. Kemudian, pada setiap bulan berikutnya, orang-orang tersebut dapat memutakhirkan layanan, menghentikan layanan atau menolak layanan (misalnya karena gagal membayar). Untuk kohort awal dalam data kami, kami memiliki sekitar 2 tahun data (24 bulan).
Jumlah orang yang bergabung setiap bulan adalah besar (dalam kisaran 100.000) dan jumlah yang melakukan salah satu dari tiga hal ini ada ribuan. Namun, kami tidak menggunakan data tingkat individu (yang akan menjadi jutaan baris) tetapi data dikumpulkan berdasarkan bulan dan kelompok (berapa proporsi masing-masing kelompok melakukan setiap hal setiap bulan).
Kami telah memodelkan data yang ada menggunakan multivariat adaptive regression splines (MARS) dan menemukan beberapa hasil menarik. Namun, saya khawatir menggunakan ini untuk memperkirakan atau memperkirakan ke masa depan. Kekhawatiran saya adalah karena prediksi ke masa depan harus di luar ruang sampel (dalam hal waktu) dan splines dapat menjadi tidak stabil untuk ekstrapolasi.
Apakah ini metode yang sah? Kekhawatiran apa yang ada dan dapat diatasi?