Jangan tidak menggunakan k-cara untuk deret waktu.
DTW tidak diminimalkan dengan rata-rata; k-means mungkin tidak konvergen dan bahkan jika konvergen tidak akan menghasilkan hasil yang sangat baik. Mean adalah estimator kuadrat-terkecil pada koordinat. Ini meminimalkan varians, bukan jarak sewenang-wenang, dan k-means dirancang untuk meminimalkan varians, bukan jarak sewenang - wenang .
Asumsikan Anda memiliki dua seri waktu. Dua gelombang sinus, dengan frekuensi yang sama, dan periode pengambilan sampel yang agak panjang; tetapi mereka diimbangi oleh . Karena DTW melakukan pembengkokan waktu, DTW dapat meluruskannya sehingga cocok dengan sempurna, kecuali untuk awal dan akhir. DTW akan menetapkan jarak yang agak kecil untuk dua seri ini. Namun, jika Anda menghitung rata - rata dari dua seri, itu akan menjadi 0 datar - mereka membatalkan. Mean tidak melakukan warping waktu dinamis, dan kehilangan semua nilai yang didapat DTW. Pada data seperti itu, k-means mungkin gagal untuk bertemu , dan hasilnya tidak akan berarti. K-means benar-benar hanya boleh digunakan dengan varians (= kuadrat Euclidean), atau beberapa kasus yang setara (seperti cosinus, pada data normal L2, di mana kesamaan cosinus adalahπsama dengan jarak Euclidean kuadrat)2 -
Sebagai gantinya, hitung matriks jarak menggunakan DTW, lalu jalankan hierarchical clustering seperti single-link. Berbeda dengan k-means, seri ini mungkin memiliki panjang yang berbeda.