Pertanyaan yang diberi tag «train»

pelatihan (atau estimasi) model atau algoritma statistik.


1
Manfaat pengambilan sampel bertingkat vs acak untuk menghasilkan data pelatihan dalam klasifikasi
Saya ingin tahu apakah ada / beberapa keuntungan menggunakan pengambilan sampel bertingkat daripada pengambilan sampel acak, ketika membagi dataset asli ke dalam pelatihan dan set pengujian untuk klasifikasi. Juga, apakah pengambilan sampel bertingkat memperkenalkan bias lebih ke dalam pengklasifikasi daripada pengambilan sampel acak? Aplikasi, yang ingin saya gunakan pengambilan sampel …


4
Akurasi mesin peningkat gradien menurun karena jumlah iterasi meningkat
Saya bereksperimen dengan algoritma mesin peningkat gradien melalui caretpaket di R. Menggunakan dataset penerimaan perguruan tinggi kecil, saya menjalankan kode berikut: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

2
Hasil yang berbeda dari randomForest via caret dan paket randomForest dasar
Saya agak bingung: Bagaimana hasil dari Model yang terlatih melalui caret berbeda dari model dalam paket aslinya? Saya membaca apakah preprocessing diperlukan sebelum prediksi menggunakan FinalModel dari RandomForest dengan paket caret? tapi saya tidak menggunakan preprocessing di sini. Saya melatih berbagai Random Forests dengan menggunakan paket caret dan tuning untuk …


2
Scikit cara yang benar untuk mengkalibrasi pengklasifikasi dengan CalibratedClassifierCV
Scikit memiliki CalibratedClassifierCV , yang memungkinkan kita untuk mengkalibrasi model kita pada pasangan X, y tertentu. Ini juga menyatakan dengan jelas itudata for fitting the classifier and for calibrating it must be disjoint. Jika mereka harus dipisahkan, apakah sah untuk melatih pengklasifikasi dengan yang berikut? model = CalibratedClassifierCV(my_classifier) model.fit(X_train, y_train) …


4
Contoh / buku / sumber yang bagus untuk belajar tentang pembelajaran mesin terapan (bukan hanya ML itu sendiri)
Saya telah mengambil kursus ML sebelumnya, tetapi sekarang saya bekerja dengan proyek-proyek terkait ML di pekerjaan saya, saya berjuang sedikit untuk benar-benar menerapkannya. Saya yakin hal-hal yang saya lakukan telah diteliti / ditangani sebelumnya, tetapi saya tidak dapat menemukan topik tertentu. Semua contoh pembelajaran mesin yang saya temukan online sangat …



6
Apakah menggunakan data yang sama untuk pemilihan fitur dan validasi silang bias atau tidak?
Kami memiliki kumpulan data kecil (sekitar 250 sampel * 100 fitur) yang kami inginkan untuk membangun klasifikasi biner setelah memilih subset fitur terbaik. Katakanlah bahwa kita mempartisi data menjadi: Pelatihan, Validasi dan Pengujian Untuk pemilihan fitur, kami menerapkan model pembungkus berdasarkan pada pemilihan fitur yang mengoptimalkan kinerja pengklasifikasi X, Y …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.