Saya memiliki dataset peristiwa yang terjadi selama periode waktu yang sama. Setiap acara memiliki tipe (ada beberapa tipe berbeda, kurang dari sepuluh) dan lokasi, direpresentasikan sebagai titik 2D.
Saya ingin memeriksa apakah ada korelasi antara jenis peristiwa, atau antara jenis dan lokasi. Misalnya, mungkin peristiwa tipe A biasanya tidak terjadi di mana peristiwa tipe B lakukan. Atau mungkin di beberapa daerah, ada sebagian besar peristiwa tipe C.
Alat apa yang bisa saya gunakan untuk melakukan ini? Menjadi pemula dalam analisis statistik, ide pertama saya adalah menggunakan beberapa jenis PCA (Principal Component Analysis) pada dataset ini untuk melihat apakah setiap jenis peristiwa memiliki komponennya sendiri, atau mungkin beberapa berbagi hal yang sama (yaitu berkorelasi)?
Saya harus menyebutkan bahwa dataset saya adalah dari urutan 500'000 poin , sehingga membuat hal-hal sedikit lebih sulit untuk menangani.
EDIT: Seperti disebutkan dalam jawaban di bawah dan komentar, cara untuk pergi adalah memodelkan ini sebagai proses titik yang ditandai, dan kemudian menggunakan R untuk melakukan semua pekerjaan berat, seperti yang dijelaskan secara rinci dalam laporan lokakarya ini: http: / /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html