pertanyaan ini dimulai dengan " Mengelompokkan data spasial dalam R " dan sekarang telah pindah ke pertanyaan DBSCAN.
Sebagai tanggapan terhadap pertanyaan pertama yang disarankan saya mencari informasi tentang DBSCAN dan membaca beberapa dokumen tentang. Pertanyaan baru telah muncul.
DBSCAN membutuhkan beberapa parameter, salah satunya adalah "jarak". Karena data saya tiga dimensi, bujur, lintang dan suhu, "jarak" mana yang harus saya gunakan? dimensi mana yang terkait dengan jarak itu? Saya kira seharusnya suhu. Bagaimana cara menemukan jarak minimum dengan R?
Parameter lain adalah jumlah minimum poin yang ditetapkan untuk membentuk sebuah cluster. Apakah ada metode untuk menemukan nomor itu? Sayangnya saya belum menemukan.
Mencari melalui Google saya tidak bisa menemukan contoh R untuk menggunakan dbscan dalam dataset yang mirip dengan saya, apakah Anda tahu situs web dengan contoh seperti itu? Jadi saya bisa membaca dan mencoba beradaptasi dengan kasus saya.
Pertanyaan terakhir adalah bahwa upaya R pertama saya dengan DBSCAN (tanpa jawaban yang tepat untuk pertanyaan sebelumnya) menghasilkan masalah memori. R mengatakan itu tidak dapat mengalokasikan vektor. Saya mulai dengan kisi spasi 4 km dengan 779191 poin yang berakhir pada sekitar 300.000 baris x 3 kolom (lintang, bujur dan suhu) saat melepas titik SST yang tidak valid. Ada petunjuk untuk mengatasi masalah memori ini. Apakah itu tergantung pada komputer saya atau di DBSCAN sendiri?
Terima kasih atas kesabarannya membaca pesan yang panjang dan mungkin membosankan serta atas bantuan Anda.