Ada berbagai metode pengelompokan yang sangat luas, yang bersifat eksploratif, dan saya tidak berpikir bahwa ada di antara mereka, apakah berdasarkan hierarki atau berdasarkan partisi, bergantung pada jenis asumsi yang harus dipenuhi seseorang untuk menganalisis varian.
Melihat dokumentasi [MV] di Stata untuk menjawab pertanyaan Anda, saya menemukan kutipan lucu ini di halaman 85:
Meskipun ada yang mengatakan bahwa ada banyak metode analisis cluster karena ada orang yang melakukan analisis cluster. Ini meremehkan! Ada jauh lebih banyak cara untuk melakukan analisis kluster daripada orang yang melakukannya.
Dalam konteks itu, saya ragu bahwa ada asumsi yang berlaku di seluruh metode clustering. Sisa dari teks ini hanya menetapkan sebagai aturan umum bahwa Anda memerlukan suatu bentuk "ukuran ketidaksamaan", yang bahkan tidak perlu jarak metrik, untuk membuat cluster.
Namun, ada satu pengecualian, yaitu ketika Anda mengelompokkan pengamatan sebagai bagian dari analisis pasca estimasi. Di Stata, vce
perintah tersebut disertai dengan peringatan berikut, di halaman 86 dari sumber yang sama:
Jika Anda terbiasa dengan array besar perintah estimasi Stata, berhati-hatilah untuk membedakan antara analisis cluster (perintah cluster) dan opsi vce (cluster clustvar) yang diizinkan dengan banyak perintah estimasi. Analisis cluster menemukan kelompok dalam data. Opsi vce (cluster clustvar) diizinkan dengan berbagai perintah estimasi menunjukkan bahwa pengamatan independen di seluruh kelompok yang ditentukan oleh opsi tetapi tidak harus independen dalam kelompok-kelompok tersebut. Variabel pengelompokan yang dihasilkan oleh perintah cluster akan jarang memenuhi asumsi di balik penggunaan opsi vce (cluster clustvar).
Berdasarkan itu, saya akan menganggap bahwa pengamatan independen tidak diperlukan di luar kasus khusus itu. Secara intuitif, saya akan menambahkan bahwa analisis kluster bahkan dapat digunakan untuk tujuan yang tepat untuk mengeksplorasi sejauh mana pengamatan independen atau tidak.
Aku akan menyelesaikan dengan menyebutkan bahwa, pada halaman 356 dari Statistik dengan Stata , Lawrence Hamilton menyebutkan variabel standar sebagai aspek "penting" dari analisis cluster, meskipun ia tidak pergi ke lebih mendalam mengenai masalah ini.