Bagaimana membangun kuadrat untuk proses titik yang sangat berbeda frekuensinya?


9

Saya ingin melakukan analisis jumlah kuadrat pada beberapa proses titik (atau satu proses titik yang ditandai), untuk kemudian menerapkan beberapa teknik reduksi dimensi.

Tanda tidak terdistribusi secara identik, yaitu, beberapa tanda muncul cukup sering, dan beberapa sangat jarang. Jadi, saya tidak bisa hanya membagi ruang 2D saya dalam kotak biasa, karena tanda yang lebih sering akan "membanjiri" yang lebih jarang, menutupi penampilan mereka.

Jadi, saya mencoba membangun kisi-kisi saya sehingga setiap sel memiliki paling banyak N poin di dalamnya (untuk melakukannya, saya cukup membagi masing-masing sel dalam empat sel yang lebih kecil (dan berukuran sama), secara rekursif, hingga tidak ada sel yang memiliki lebih dari N poin dalam Itu).

Apa pendapat Anda tentang teknik "normalisasi" ini? Apakah ada cara standar untuk melakukan hal-hal seperti itu?


1
Jika Anda menggunakan kisi-kisi biasa dan tanda yang lebih sering lebih banyak daripada yang kurang sering, saya tidak melihat bagaimana hal itu "berlebihan" dan "topeng". Bisakah Anda menguraikan sedikit? Apakah Anda mencoba mengganti konten setiap kuadrat dengan hanya tanda yang paling umum, atau sesuatu seperti itu?
Wayne

Jawaban:


1

Saya telah menggunakan analisis kuadrat hanya pada grid biasa. Itu membantu dalam hal tujuannya, yaitu untuk membandingkan dispersi data pengambilan sampel dengan proses yang diketahui, misalnya acak. Oleh karena itu, grid biasa berfungsi dengan baik.
Metode yang Anda kembangkan dan deskripsikan tidak pasti berupa penghitungan kuadrat. Sebagai contoh dalam metode moving average, satu opsi adalah untuk menghitung jumlah tetangga untuk proses, yaitu, rata-rata, yang hanya dilakukan dengan mencari di dalam lingkaran (dalam 2D) atau bola (dalam 3D). Metode Anda terlihat mirip dengan penggunaan sampel yang dipilih sedikit berbeda.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.