Pertanyaan yang diberi tag «categorical-data»

Data kategorikal (disebut juga nominal) dapat mengambil sejumlah nilai yang mungkin disebut kategori. Nilai kategori "label", mereka tidak "mengukur". Silakan gunakan tag [data-ordinal] untuk tipe data yang diskrit tapi terurut.

3
Masalah dengan pengodean satu panas vs. pengodean dummy
Saya menyadari fakta bahwa variabel kategori dengan level k harus dikodekan dengan variabel k-1 dalam pengkodean dummy (sama untuk variabel kategori multi-dihargai). Saya bertanya-tanya berapa banyak masalah melakukan pengkodean satu-panas (yaitu menggunakan variabel k sebagai gantinya) atas pengkodean dummy untuk metode regresi yang berbeda, terutama regresi linier, regresi linier dihukum …



1
Apa bahaya menghitung korelasi Pearson (bukan yang tetrachoric) untuk variabel biner dalam analisis faktor?
Saya melakukan penelitian tentang game edukasi, dan beberapa proyek saya saat ini melibatkan menggunakan data dari BoardGameGeek ( BGG ) dan VideoGameGeek (VGG) untuk menguji hubungan antara elemen desain game (yaitu, "diatur dalam Perang Dunia II", "melibatkan rolling dadu" ) dan peringkat pemain dari game-game tersebut (yaitu skor dari 10). …

3
Mengapa orang harus melakukan transformasi WOE dari prediktor kategorik dalam regresi logistik?
Kapan transformasi bobot bukti (WOE) dari variabel kategori bermanfaat? Contohnya dapat dilihat pada transformasi WOE (Jadi untuk respons , & prediktor kategoris dengan kategori , & berhasil keluar dari percobaan dalam kategori dari prediktor ini, WOE untuk kategori didefinisikan sebagaiyyykkkyjyjy_jnjnjn_jjjjjjj logyj∑kjyj∑kj(nj−yj)nj−yjlog⁡yj∑jkyj∑jk(nj−yj)nj−yj\log \frac{y_j} {\sum_j^k {y_j}} \frac{\sum_j^k (n_j-y_j)}{n_j-y_j} & transformasi terdiri dari …




1
Bagaimana cara saya memasukkan pencilan inovatif pada pengamatan 48 dalam model ARIMA saya?
Saya sedang mengerjakan kumpulan data. Setelah menggunakan beberapa teknik identifikasi model, saya keluar dengan model ARIMA (0,2,1). Saya menggunakan detectIOfungsi dalam paket TSAdalam R untuk mendeteksi outlier inovatif (IO) pada pengamatan ke-48 set data asli saya. Bagaimana cara memasukkan pencilan ini ke dalam model saya sehingga saya dapat menggunakannya untuk …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
Model Multinomial-Dirichlet dengan distribusi hyperprior pada parameter konsentrasi
Saya akan mencoba menggambarkan masalah yang dihadapi secara umum. Saya memodelkan pengamatan sebagai distribusi kategoris dengan parameter probabilitas vektor theta. Kemudian, saya berasumsi vektor parameter theta mengikuti Dirichlet prior distribution dengan parameter .α1, α2, ... , αkα1,α2,…,αk\alpha_1,\alpha_2,\ldots,\alpha_k Apakah mungkin juga untuk memaksakan distribusi hyperprior ke parameter ? Apakah itu harus …


2
Korelasi antara variabel dikotomis dan kontinu
Saya mencoba menemukan korelasi antara dikotomis dan variabel kontinu. Dari pekerjaan dasar saya pada ini saya menemukan bahwa saya harus menggunakan independent t-test dan prasyarat untuk itu adalah bahwa distribusi variabel harus normal. Saya melakukan tes Kolmogorov-Smirnov untuk menguji normalitas dan menemukan bahwa variabel kontinu adalah tidak normal dan condong …

3
Bagaimana menangani variabel kategorikal non-biner dalam regresi logistik (SPSS)
Saya harus melakukan regresi logistik biner dengan banyak variabel independen. Kebanyakan dari mereka adalah biner, tetapi beberapa variabel kategori memiliki lebih dari dua level. Apa cara terbaik untuk menangani variabel seperti itu? Misalnya, untuk variabel dengan tiga nilai yang mungkin, saya kira dua variabel dummy harus dibuat. Kemudian, dalam prosedur …


4
Bagaimana membuktikan secara statistik jika suatu kolom memiliki data kategorikal atau tidak menggunakan Python
Saya memiliki bingkai data dalam python di mana saya perlu menemukan semua variabel kategori. Memeriksa jenis kolom tidak selalu berhasil karena intjenisnya juga bisa kategoris. Jadi saya mencari bantuan dalam menemukan metode pengujian hipotesis yang tepat untuk mengidentifikasi apakah suatu kolom termasuk kategori atau tidak. Saya mencoba di bawah uji …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.