Pertanyaan yang diberi tag «binary-data»

Variabel biner mengambil salah satu dari dua nilai, biasanya dikodekan sebagai "0" dan "1".



4
Ambang peluang klasifikasi
Saya punya pertanyaan tentang klasifikasi secara umum. Misalkan f adalah classifier, yang menampilkan sekumpulan probabilitas yang diberikan beberapa data D. Biasanya, orang akan mengatakan: well, jika P (c | D)> 0,5, kami akan menetapkan kelas 1, jika tidak 0 (biarkan ini menjadi biner klasifikasi). Pertanyaan saya adalah, bagaimana jika saya …




1
Apakah ada analisis Faktor atau PCA untuk data ordinal atau biner?
Saya telah menyelesaikan analisis komponen utama (PCA), analisis faktor eksploratori (EFA), dan analisis faktor konfirmatori (CFA), memperlakukan data dengan skala likert (respons 5 tingkat: tidak ada, sedikit, beberapa, ..) sebagai berkelanjutan variabel. Kemudian, menggunakan Lavaan, saya mengulangi CFA mendefinisikan variabel sebagai kategori. Saya ingin tahu jenis analisis apa yang cocok …

2
Bagaimana cara menggunakan variabel biner dan kontinu bersama dalam clustering?
Saya perlu menggunakan variabel biner (nilai 0 & 1) dalam k-means. Tetapi k-means hanya bekerja dengan variabel kontinu. Saya tahu beberapa orang masih menggunakan variabel-variabel biner ini dalam k-means mengabaikan fakta bahwa k-means hanya dirancang untuk variabel kontinu. Bagi saya ini tidak bisa diterima. Pertanyaan: Jadi apa cara yang benar …


5
Haruskah Anda membakukan variabel biner?
Saya memiliki satu set data dengan serangkaian fitur. Beberapa dari mereka adalah biner aktif atau dipecat, tidak aktif atau aktif), dan sisanya bernilai nyata, misalnya .0 = 4564.342(1=(1=(1=0=0=0=4564.3424564.3424564.342 Saya ingin mengumpankan data ini ke algoritme pembelajaran mesin, jadi saya -score semua fitur bernilai nyata. Saya mendapatkannya antara rentang dan sekitar. …

3
Visualisasi kalibrasi probabilitas prediksi model
Misalkan saya memiliki model prediktif yang menghasilkan, untuk setiap contoh, probabilitas untuk setiap kelas. Sekarang saya menyadari bahwa ada banyak cara untuk mengevaluasi model seperti itu jika saya ingin menggunakan probabilitas tersebut untuk klasifikasi (presisi, penarikan, dll.). Saya juga mengakui bahwa kurva ROC dan area di bawahnya dapat digunakan untuk …


2
Mengelompokkan matriks biner
Saya memiliki matriks semi-kecil fitur biner dimensi 250k x 100. Setiap baris adalah pengguna dan kolom adalah "tag" biner dari beberapa perilaku pengguna, misalnya "likes_cats". user 1 2 3 4 5 ... ------------------------- A 1 0 1 0 1 B 0 1 0 1 0 C 1 0 0 1 …


4
Akurasi mesin peningkat gradien menurun karena jumlah iterasi meningkat
Saya bereksperimen dengan algoritma mesin peningkat gradien melalui caretpaket di R. Menggunakan dataset penerimaan perguruan tinggi kecil, saya menjalankan kode berikut: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.