Google Trends mengembalikan data mingguan sehingga saya harus menemukan cara untuk menggabungkannya dengan data harian / bulanan saya.
Apa yang telah saya lakukan sejauh ini adalah memecah setiap seri menjadi data harian, sebagai contoh:
dari:
2013-03-03 - 2013-03-09 37
untuk:
2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 37 2013-03-08 37 2013-03-09 37
Tapi ini menambah banyak kerumitan pada masalah saya. Saya mencoba memprediksi pencarian Google dari nilai 6 bulan terakhir, atau 6 nilai dalam data bulanan. Data harian akan menyiratkan pekerjaan pada 180 nilai sebelumnya. (Saya memiliki 10 tahun data sehingga 120 poin dalam data bulanan / 500+ dalam data mingguan / 3500+ dalam data harian)
Pendekatan lain adalah "menggabungkan" data harian dalam data mingguan / bulanan. Tetapi beberapa pertanyaan muncul dari proses ini. Beberapa data dapat dirata-ratakan karena jumlah mereka mewakili sesuatu. Curah hujan misalnya, jumlah hujan dalam satu minggu tertentu akan menjadi jumlah dari jumlah untuk setiap hari yang menyusun minggu.
Dalam kasus saya, saya berurusan dengan harga, tingkat keuangan, dan hal-hal lainnya. Untuk harga, adalah hal biasa di bidang saya untuk memperhitungkan volume yang dipertukarkan, sehingga data mingguan akan menjadi rata-rata tertimbang. Untuk tarif keuangan, ini sedikit lebih rumit karena beberapa formula terlibat untuk membangun tarif mingguan dari tarif harian. Untuk hal-hal lain saya tidak tahu properti yang mendasarinya. Saya pikir sifat-sifat itu penting untuk menghindari indikator yang tidak berarti (rata-rata tingkat keuangan akan menjadi tidak masuk akal misalnya).
Jadi tiga pertanyaan:
Untuk properti yang dikenal dan tidak dikenal, bagaimana cara saya beralih dari data harian ke data mingguan / bulanan?
Saya merasa seperti memecah data mingguan / bulanan menjadi data harian seperti yang saya lakukan agak salah karena saya memperkenalkan jumlah yang tidak masuk akal dalam kehidupan nyata. Jadi pertanyaan yang hampir sama:
Untuk properti yang dikenal dan tidak dikenal, bagaimana saya harus beralih dari data mingguan / bulanan ke data harian?
Last but not least: ketika diberikan dua seri waktu dengan langkah waktu yang berbeda, apa yang lebih baik: Menggunakan langkah waktu terendah atau terbesar? Saya pikir ini adalah kompromi antara jumlah data dan kompleksitas model tetapi saya tidak dapat melihat argumen yang kuat untuk memilih antara opsi-opsi itu.
Sunting: jika Anda tahu alat (dalam R Python bahkan Excel) untuk melakukannya dengan mudah itu akan sangat dihargai.