Pertanyaan yang diberi tag «categorical-data»

Data kategorikal (disebut juga nominal) dapat mengambil sejumlah nilai yang mungkin disebut kategori. Nilai kategori "label", mereka tidak "mengukur". Silakan gunakan tag [data-ordinal] untuk tipe data yang diskrit tapi terurut.



5
Cara mengkode ulang variabel kategori menjadi variabel numerik saat menggunakan SVM atau Neural Network
Untuk menggunakan SVM atau Neural Network perlu mengubah (menyandikan) variabel kategorikal menjadi variabel numerik, metode normal dalam hal ini adalah dengan menggunakan nilai biner 0-1 dengan nilai k-th kategori ditransformasikan menjadi (0,0, .. ., 1,0, ... 0) (1 ada di posisi k-th). Apakah ada metode lain untuk melakukan ini, terutama …

4
Dengan data kategorikal, dapatkah ada kelompok tanpa variabel yang terkait?
Ketika mencoba menjelaskan analisis kluster, adalah umum bagi orang-orang untuk salah memahami proses yang terkait dengan apakah variabel berkorelasi. Salah satu cara untuk membuat orang melewati kebingungan itu adalah plot seperti ini: Ini jelas menampilkan perbedaan antara pertanyaan apakah ada kelompok dan pertanyaan apakah variabel terkait. Namun, ini hanya menggambarkan …

2
Interpretasi beta ketika ada beberapa variabel kategori
Saya memahami konsep bahwa ß 0 adalah mean ketika variabel kategoris sama dengan 0 (atau kelompok referensi), memberikan interpretasi akhir bahwa koefisien regresi adalah perbedaan mean dari dua kategori. Bahkan dengan> 2 kategori saya akan menganggap setiap β menjelaskan perbedaan antara kategori ini berarti dan referensi.β^0β^0\hat\beta_0β^β^\hat\beta Tetapi, bagaimana jika lebih …

4
Non-transitivitas korelasi: korelasi antara jenis kelamin dan ukuran otak dan antara ukuran otak dan IQ, tetapi tidak ada korelasi antara jenis kelamin dan IQ
Saya menemukan penjelasan berikut di blog dan saya ingin mendapatkan informasi lebih lanjut tentang non-transitivitas korelasi: Kami memiliki fakta tak terbantahkan berikut: Rata-rata, ada perbedaan volume otak antara pria dan wanita Ada korelasi antara IQ dan ukuran otak; korelasinya adalah 0,33 dan dengan demikian sesuai dengan 10% dari variabilitas IQ …

1
Bagaimana menangani SVM dengan atribut kategorikal
Saya memiliki ruang 35 dimensi (atribut). Masalah analitik saya adalah klasifikasi sederhana. Dari 35 dimensi, lebih dari 25 adalah kategorikal dan setiap atribut mengambil lebih dari 50 jenis nilai. Dalam skenario itu, memperkenalkan variabel dummy juga tidak akan bekerja untuk saya. Bagaimana saya bisa menjalankan SVM di ruang yang memiliki …

5
Apa ringkasan statistik untuk digunakan dengan variabel kategorikal atau kualitatif?
Hanya untuk memperjelas, ketika saya maksud statistik ringkasan, saya merujuk ke Mean, rentang Kuartil Median, Varians, Deviasi Standar. Ketika meringkas univariat yang kategorikal atau kualitatif , mempertimbangkan kasus Nominal dan Ordinal , apakah masuk akal untuk menemukan rata-rata, median, rentang kuartil, varian, dan standar deviasi? Jika ya, ini berbeda dengan …

2
Deteksi Anomali dengan Fitur Dummy (dan Fitur Diskrit / Kategorikal lainnya)
tl; dr Apa cara yang disarankan untuk menangani discretedata saat melakukan deteksi anomali? Apa cara yang disarankan untuk menangani categoricaldata saat melakukan deteksi anomali? Jawaban ini menyarankan menggunakan data diskrit untuk menyaring hasil saja. Mungkin mengganti nilai kategori dengan peluang pengamatan perctage? Intro Ini adalah pertama kalinya saya memposting di …

1
Bagaimana cara menguji signifikansi statistik untuk variabel kategori dalam regresi linier?
Jika dalam regresi linier saya memiliki variabel kategorikal ... bagaimana saya tahu arti statistik variabel kategoris? Katakanlah faktor memiliki 10 level ... akan ada 10 nilai t-resultan yang berbeda, di bawah payung satu variabel faktor X 1X1X1X_1X1X1X_1 ... Tampaknya bagi saya bahwa makna statistik diuji untuk setiap tingkat variabel faktor? …

3
Apakah membangun classifier multiclass lebih baik daripada beberapa binary?
Saya perlu mengklasifikasikan URL ke dalam kategori. Katakanlah saya memiliki 15 kategori yang saya rencanakan untuk menurunkan setiap URL. Apakah pengklasifikasi 15 arah lebih baik? Di mana saya memiliki 15 label dan menghasilkan fitur untuk setiap titik data. Atau membangun 15 pengklasifikasi biner, katakan: Film atau Non-Film, dan gunakan angka …

1
Bagaimana memperlakukan prediktor kategoris di LASSO
Saya menjalankan LASSO yang memiliki beberapa prediktor variabel variabel dan beberapa yang kontinu. Saya punya pertanyaan tentang variabel kategori. Langkah pertama yang saya mengerti adalah memecah mereka masing-masing menjadi boneka, membakukan mereka untuk hukuman yang adil, dan kemudian mundur. Beberapa opsi muncul untuk merawat variabel dummy: Masukkan semua kecuali satu …

2
Pengodean variabel kualitatif dalam regresi mengarah ke "singularitas"
Saya memiliki variabel independen yang disebut "kualitas"; variabel ini memiliki 3 modalitas respons (kualitas buruk; kualitas sedang; kualitas tinggi). Saya ingin memperkenalkan variabel independen ini ke dalam regresi linier berganda. Ketika saya memiliki variabel independen biner (variabel dummy, saya dapat kode 0/ 1) mudah untuk memperkenalkannya ke dalam model regresi …


2
Fitur penting dengan variabel dummy
Saya mencoba memahami bagaimana saya bisa mendapatkan fitur penting dari variabel kategori yang telah dipecah menjadi variabel dummy. Saya menggunakan scikit-learn yang tidak menangani variabel kategorikal untuk Anda seperti R atau h2o. Jika saya memecah variabel kategori menjadi variabel dummy, saya mendapatkan fitur penting terpisah per kelas dalam variabel itu. …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.