Untuk memudahkan pemahaman, saya akan menjelaskan ini menggunakan contoh. Katakanlah Anda mengumpulkan data dari perangkat yang memiliki 12 sensor. Dan Anda telah mengumpulkan data selama 10 hari.
Data yang telah Anda kumpulkan adalah sebagai berikut:
Ini disebut data jarang karena sebagian besar output sensor adalah nol. Yang berarti sensor-sensor itu berfungsi dengan baik tetapi bacaan yang sebenarnya adalah nol. Meskipun matriks ini memiliki data dimensi tinggi (12 sumbu), dapat dikatakan bahwa itu mengandung informasi yang lebih sedikit.
Katakanlah 2 sensor perangkat Anda tidak berfungsi.
Maka data Anda akan seperti:
Dalam hal ini, Anda dapat melihat bahwa Anda tidak dapat menggunakan data dari Sensor1 dan Sensor6. Entah Anda harus mengisi data secara manual tanpa memengaruhi hasil atau Anda harus mengulang percobaan.