Pertanyaan yang diberi tag «mixed-type-data»

6
Dapatkah analisis komponen utama diterapkan pada kumpulan data yang berisi campuran variabel kontinu dan kategorikal?
Saya memiliki dataset yang memiliki data kontinu dan kategorikal. Saya menganalisis dengan menggunakan PCA dan saya bertanya-tanya apakah boleh memasukkan variabel kategori sebagai bagian dari analisis. Pemahaman saya adalah bahwa PCA hanya dapat diterapkan pada variabel kontinu. Apakah itu benar? Jika tidak dapat digunakan untuk data kategorikal, alternatif apa yang …

6
Korelasi dengan variabel kategori tidak teratur
Saya memiliki dataframe dengan banyak pengamatan dan banyak variabel. Beberapa dari mereka adalah kategoris (tidak teratur) dan yang lainnya numerik. Saya mencari hubungan antara variabel-variabel ini. Saya sudah bisa menghitung korelasi untuk variabel numerik (korelasi Spearman) tetapi: Saya tidak tahu bagaimana mengukur korelasi antara variabel kategori tidak teratur. Saya tidak …


2
Bagaimana cara menggunakan variabel biner dan kontinu bersama dalam clustering?
Saya perlu menggunakan variabel biner (nilai 0 & 1) dalam k-means. Tetapi k-means hanya bekerja dengan variabel kontinu. Saya tahu beberapa orang masih menggunakan variabel-variabel biner ini dalam k-means mengabaikan fakta bahwa k-means hanya dirancang untuk variabel kontinu. Bagi saya ini tidak bisa diterima. Pertanyaan: Jadi apa cara yang benar …

4
Mengapa data campuran merupakan masalah untuk algoritma pengelompokan berbasis euclidean?
Kebanyakan algoritma pengelompokan dan pengurangan dimensi klasik (pengelompokan hierarkis, analisis komponen utama, k-means, peta pengorganisasian sendiri ...) dirancang khusus untuk data numerik, dan data inputnya dipandang sebagai titik dalam ruang euclidean. Ini tentu saja merupakan masalah, karena banyak pertanyaan di dunia nyata melibatkan data yang dicampur: misalnya jika kita mempelajari …

8
Pengelompokan data tipe campuran dengan R
Terkunci . Pertanyaan ini dan jawabannya dikunci karena pertanyaannya di luar topik tetapi memiliki signifikansi historis. Saat ini tidak menerima jawaban atau interaksi baru. Saya bertanya-tanya apakah mungkin untuk melakukan dalam R clustering data yang memiliki variabel data campuran. Dengan kata lain saya memiliki satu set data yang berisi variabel …



1
Metode cluster kuat untuk data campuran di R
Saya mencari untuk mengelompokkan satu set data kecil (64 pengamatan dari 4 variabel interval dan satu variabel kategori tiga faktor). Sekarang, saya cukup baru dalam analisis klaster, tetapi saya sadar bahwa telah ada banyak kemajuan sejak zaman ketika hierarkis clustering atau k-means adalah satu-satunya pilihan yang tersedia. Secara khusus, nampak …


1
Data diskrit & alternatif untuk PCA
Saya memiliki dataset variabel diskrit (ordinal, meristik, dan nominal) yang menggambarkan karakter sayap morfologis pada beberapa spesies serangga yang terkait erat. Yang ingin saya lakukan adalah melakukan semacam analisis yang akan memberi saya representasi visual tentang kesamaan spesies yang berbeda berdasarkan karakteristik morfologis. Hal pertama yang muncul di kepala saya …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.