Sebelum bertanya, saya membaca pertanyaan serupa, tetapi tidak ada yang mengarah ke jawaban yang memuaskan untuk minat khusus saya.
Saya ingin menyeragamkan serangkaian waktu iklim dari presipitasi Republik Dominika selama 64 tahun (1940-2003). Untuk itu, sangat penting untuk memilih seri referensi di antara sekelompok kandidat.
Katakanlah sjoadalah seri dasar, yang ingin saya temukan seri referensi yang bagus; bani, plcdan ramerupakan kandidat referensi, karena mereka dekat sjo. Dalam peta berikut, titik merah adalah stasiun pangkalan, dan yang hijau adalah kandidat referensi:

Saya melakukan tiga analisis korelasi (dilakukan dalam R, fungsi cor()), dengan mempertimbangkan variabel-variabel bulanan ini: nilai curah hujan mentah, perbedaan normal, dan nilai-nilai yang ditransformasikan dengan Box-Cox. Variabel-variabel tersebut masing-masing sesuai dengan bidang yang dimulai dengan p, diandan pnorm.
Perbedaan yang dinormalisasi berasal dari metode seri perbedaan pertama (FDM), yang diusulkan oleh Peterson, yang terdiri dari: , di mana adalah nilai curah hujan untuk bulan , dan adalah presipitasi untuk bulan yang sama 1 tahun sebelumnya. Saya mengikuti komentar Peterson dan rekan (1998) , yang mengatakan bahwa FDM yang diterapkan pada presipitasi mungkin bekerja lebih baik menggunakan perbedaan yang dinormalisasi.
Seperti dapat dilihat di halaman 1 file PDF ini , korelasi dihitung untuk seluruh seri waktu (1940-2003). Untuk curah hujan mentah dan nilai transformasi Box-Cox, baniadalah yang terbaik berkorelasi dengan sjo(sel latar belakang kuning menunjukkan indeks korelasi maksimum). Perhatikan bahwa untuk curah hujan mentah, banisecara signifikan lebih berkorelasi daripada yang lain. Untuk perbedaan yang dinormalisasi, rahanya sedikit lebih berkorelasi daripada yang lain. Namun, setiap stasiun kandidat memiliki indeks korelasi yang signifikan secara statistik dengan sjopada tingkat signifikansi , menunjukkan APAPUN dari mereka dapat digunakan sebagai seri referensi.
Ini agak membingungkan, jadi saya tidak puas dan memutuskan untuk membuat analisis yang lebih rinci, memisahkan seri dalam interval periode 5 tahun, dan mengevaluasi korelasi antara seri untuk 3 variabel yang sama: curah hujan mentah, perbedaan normalisasi dan Box-Cox ditransformasikan .
Tabel dari halaman 2 hingga 8 dalam PDF menunjukkan hasil korelasi parsial ini; halaman terakhir merangkum waktu setiap stasiun memiliki nilai korelasi maksimum untuk setiap variabel. Seperti dapat dilihat, baniadalah nilai yang paling sering berkorelasi untuk 3 variabel yang dianalisis (dalam semua kasus, lebih dari 7 kali dari dua belas periode 5 tahun yang dianalisis).
Dengan hasil ini, saya pikir itu baniadalah kandidat terbaik sebagai seri referensi sjo, tapi saya tidak yakin tentang itu. Apakah analisis periode lima tahun baik-baik saja? Haruskah saya melakukan beberapa analisis lain?