Saya bekerja dengan satu set besar data accelerometer yang dikumpulkan dengan beberapa sensor yang dikenakan oleh banyak subjek. Sayangnya, tidak ada orang di sini yang tahu spesifikasi teknis perangkat dan saya pikir mereka tidak pernah dikalibrasi ulang. Saya tidak punya banyak info tentang perangkat. Saya sedang mengerjakan tesis master saya, accelerometer itu dipinjam dari universitas lain dan secara keseluruhan situasinya agak tidak transparan. Jadi, preprocessing on-board perangkat? Tidak tahu.
Yang saya tahu adalah mereka adalah accelerometer triaksial dengan laju sampling 20Hz; digital dan mungkin MEMS. Saya tertarik pada perilaku dan gerak tubuh nonverbal, yang menurut sumber saya sebagian besar harus menghasilkan aktivitas dalam kisaran 0,3-3,5Hz.
Normalisasi data tampaknya sangat diperlukan, tetapi saya tidak yakin apa yang harus digunakan. Sebagian besar data dekat dengan nilai lainnya (nilai mentah ~ 1000, dari gravitasi), tetapi ada beberapa ekstrem seperti hingga 8000 dalam beberapa log, atau bahkan 29000 pada yang lain. Lihat gambar di bawah . Saya pikir ini membuatnya menjadi ide yang buruk untuk dibagi dengan max atau stdev untuk dinormalisasi.
Apa pendekatan yang biasa dalam kasus seperti ini? Dibagi dengan median? Nilai persentil? Sesuatu yang lain
Sebagai masalah sampingan, saya juga tidak yakin apakah saya harus memotong nilai-nilai ekstrem ..
Terima kasih atas sarannya!
Sunting : Berikut adalah sebidang data sekitar 16 menit (20.000 sampel), untuk memberi Anda gambaran tentang bagaimana data biasanya didistribusikan.