Pertanyaan yang diberi tag «unsupervised-learning»

Menemukan struktur (statistik) tersembunyi dalam data yang tidak berlabel, termasuk pengelompokan dan ekstraksi fitur untuk pengurangan dimensi.

2
Bagaimana cara memahami jaringan keyakinan mendalam konvolusional untuk klasifikasi audio?
Dalam " Jaringan keyakinan mendalam konvolusional untuk pembelajaran terwakili terwakili terwakili " oleh Lee et. al. ( PDF ) DBN konvolusional diusulkan. Juga metode dievaluasi untuk klasifikasi gambar. Ini terdengar logis, karena ada fitur gambar lokal alami, seperti sudut dan tepi kecil dll. Dalam " Pembelajaran fitur tanpa pengawasan untuk …

1
Mengapa Anova () dan drop1 () memberikan jawaban berbeda untuk GLMM?
Saya memiliki GLMM formulir: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Ketika saya menggunakan drop1(model, test="Chi"), saya mendapatkan hasil yang berbeda daripada jika saya menggunakan Anova(model, type="III")dari paket mobil atau summary(model). Dua yang terakhir ini memberikan jawaban yang sama. Menggunakan banyak data yang …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 




1
Model pembelajaran dalam mana yang dapat mengklasifikasikan kategori yang tidak eksklusif satu sama lain
Contoh: Saya memiliki kalimat dalam deskripsi pekerjaan: "Java senior engineer in UK". Saya ingin menggunakan model pembelajaran yang mendalam untuk memperkirakannya sebagai 2 kategori: English dan IT jobs. Jika saya menggunakan model klasifikasi tradisional, hanya dapat memprediksi 1 label dengan softmaxfungsi di lapisan terakhir. Dengan demikian, saya dapat menggunakan 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Pemilihan fitur untuk masalah pengelompokan
Saya mencoba untuk membuat kelompok kumpulan data yang berbeda menggunakan algoritma yang tidak diawasi (clustering). Masalahnya adalah saya memiliki banyak fitur (~ 500) dan sejumlah kecil case (200-300). Sejauh ini saya hanya melakukan masalah klasifikasi yang selalu saya beri label data sebagai set pelatihan. Di sana saya menggunakan beberapa kriteria …

1
Tidak dapat membuat jaringan autoencoder ini berfungsi dengan baik (dengan lapisan convolutional dan maxpool)
Jaringan Autoencoder tampaknya jauh lebih rumit daripada jaringan MLP classifier normal. Setelah beberapa upaya menggunakan Lasagne semua yang saya dapatkan dalam output yang direkonstruksi adalah sesuatu yang menyerupai yang terbaik, rata-rata buram dari semua gambar dari database MNIST tanpa perbedaan pada apa digit input sebenarnya. Struktur jaringan yang saya pilih …

6
Cara menyiapkan / membuat fitur untuk deteksi anomali (data keamanan jaringan)
Tujuan saya adalah untuk menganalisis log jaringan (mis., Apache, syslog, audit keamanan Direktori Aktif, dan sebagainya) menggunakan deteksi pengelompokan / anomali untuk tujuan deteksi intrusi. Dari log saya memiliki banyak bidang teks seperti alamat IP, nama pengguna, nama host, port tujuan, port sumber, dan sebagainya (total 15-20 bidang). Saya tidak …

4
Bagaimana cara melakukan beberapa tes post-hoc chi-square pada tabel 2 X 3?
Kumpulan data saya terdiri dari angka kematian total atau kelangsungan hidup suatu organisme pada tiga tipe lokasi, inshore, midchannel, dan offshore. Angka-angka dalam tabel di bawah ini mewakili jumlah situs. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 Saya ingin tahu apakah # situs tempat …


1
Kapan menggunakan LDA daripada GMM untuk pengelompokan?
Saya memiliki dataset yang berisi aktivitas pengguna dengan 168 dimensi, di mana saya ingin mengekstraksi kluster menggunakan pembelajaran tanpa pengawasan. Tidak jelas bagi saya apakah akan menggunakan pendekatan pemodelan topik dalam alokasi Latent Dirichlet (LDA) atau Gaussian Mixture Model (GMM), yang lebih merupakan pendekatan Bayesian. Dalam hal itu saya punya …

2
Mengapa hanya nilai rata-rata yang digunakan dalam metode pengelompokan (K-means)?
Dalam metode pengelompokan seperti K-means , jarak euclidean adalah metrik yang digunakan. Akibatnya, kami hanya menghitung nilai rata-rata di dalam setiap kluster. Dan kemudian penyesuaian dilakukan pada elemen-elemen berdasarkan jarak mereka ke setiap nilai rata-rata. Saya bertanya-tanya mengapa fungsi Gaussian tidak digunakan sebagai metrik? Alih-alih menggunakan xi -mean(X), kita bisa …

1
Peta yang diatur sendiri vs kernel k-means
Untuk aplikasi, saya ingin mengelompokkan data (berpotensi berdimensi tinggi) dan mengekstraksi kemungkinan milik sebuah cluster. Saya mempertimbangkan pada saat ini peta mengatur diri sendiri atau kernel k-cara untuk melakukan pekerjaan. Apa pro dan kontra dari setiap classifier untuk tugas ini? Apakah saya kehilangan algoritme pengelompokan orang lain yang bisa tampil …

2
Klaster data clickstream
Baru-baru ini saya memasuki bidang pembelajaran mesin dan proyek yang sedang saya kerjakan mengharuskan saya untuk mengelompokkan pengguna berdasarkan urutan mereka mengunjungi halaman web di situs web. Saya punya data dalam bentuk: ['user_id', 1, 2, 4, 6, 3, 7, 3, 2, 4...] Di mana setiap angka adalah kategori / halaman …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.