Saya tidak dapat menafsirkan grafik ini. Variabel dependen saya adalah jumlah tiket film yang akan dijual untuk sebuah pertunjukan. Variabel independen adalah jumlah hari yang tersisa sebelum pertunjukan, variabel dummy musiman (hari dalam seminggu, bulan dalam setahun, hari libur), harga, tiket yang terjual hingga tanggal, peringkat film, jenis film (film thriller, komedi, dll., Sebagai boneka ). Perlu diketahui juga bahwa kapasitas gedung bioskop tetap. Artinya, ia dapat menampung maksimum x jumlah orang saja. Saya membuat solusi regresi linier dan tidak cocok dengan data pengujian saya. Jadi saya berpikir untuk memulai dengan diagnosa regresi. Data berasal dari satu ruang bioskop yang ingin saya prediksi permintaannya.
Ini adalah dataset multivarian. Untuk setiap tanggal, ada 90 baris rangkap, mewakili hari sebelum pertunjukan. Jadi, untuk 1 Jan 2016 ada 90 catatan. Ada variabel 'lead_time' yang memberi saya jumlah hari sebelum pertunjukan. Jadi untuk 1 Jan 2016, jika lead_time memiliki nilai 5, itu berarti tiketnya akan terjual hingga 5 hari sebelum tanggal pertunjukan. Dalam variabel dependen, total tiket terjual, saya akan memiliki nilai yang sama 90 kali.
Juga, sebagai komentar sampingan, apakah ada buku yang menjelaskan bagaimana menafsirkan plot residual dan meningkatkan model setelahnya?