Pertanyaan yang diberi tag «clustering»

Analisis Cluster adalah tugas mempartisi data menjadi himpunan bagian objek sesuai dengan "kesamaan" mereka, tanpa menggunakan pengetahuan yang sudah ada sebelumnya seperti label kelas. [Clustered-standard-error dan / atau cluster-samples harus ditandai seperti itu; JANGAN gunakan tag "clustering" untuk mereka.]

1
Pada korelasi cophenetic untuk clustering dendrogram
Pertimbangkan konteks pengelompokan dendrogram. Mari kita sebut perbedaan asli jarak antara individu. Setelah membuat dendrogram, kami mendefinisikan ketidaksamaan cophenetic antara dua individu sebagai jarak antara kelompok-kelompok di mana individu-individu ini berada. Beberapa orang menganggap bahwa korelasi antara perbedaan asli dan perbedaan cophenetic (disebut korelasi cophenetic ) adalah "indeks kesesuaian" dari …

2
Mendeteksi Cluster kode sumber "mirip"
Asumsikan saya memiliki 400 siswa (yang ada di universitas besar) yang harus melakukan proyek ilmu komputer, dan bahwa mereka harus bekerja sendiri (tidak ada kelompok siswa). Contoh proyek dapat membiarkan "menerapkan algoritma transformasi fourier cepat di fortran" (Saya tahu, itu tidak terdengar seksi tetapi itu membuat pertanyaan saya lebih sederhana). …

3
Distribusi pengelompokan
Saya memiliki beberapa distribusi (10 distribusi pada gambar di bawah). Sebenarnya ini adalah histogram: ada 70 nilai pada sumbu x yang merupakan ukuran beberapa partikel dalam larutan dan untuk setiap nilai x nilai y yang sesuai adalah proporsi partikel yang ukurannya berada di sekitar nilai x. Saya ingin mengelompokkan distribusi …
10 clustering 

3
Bagaimana cara mengelompokkan variabel longitudinal?
Saya memiliki banyak variabel yang berisi data longitudinal dari hari 0 hingga hari 7. Saya mencari pendekatan pengelompokan yang sesuai yang dapat mengelompokkan variabel-variabel longitudinal ini (bukan kasus) ke dalam kelompok yang berbeda. Saya mencoba menganalisis kumpulan data ini secara terpisah berdasarkan waktu, tetapi hasilnya cukup sulit untuk dijelaskan secara …
10 clustering 

2
Mendeteksi pola melingkar dalam data cloud titik
Untuk beberapa algoritma rekonstruksi volume yang sedang saya kerjakan, saya perlu mendeteksi sejumlah pola melingkar dalam data titik 3d (yang berasal dari perangkat LIDAR). Pola-pola ini dapat diorientasikan secara sewenang-wenang di ruang angkasa, dan diasumsikan terletak (meskipun tidak sempurna) di bidang tipis 2d. Berikut ini adalah contoh dengan dua lingkaran …

1
Menggunakan paket statistik dalam R untuk kmeans clustering
Saya mengalami kesulitan memahami satu atau dua aspek dari paket cluster. Saya mengikuti contoh dari Quick-R dengan cermat, tetapi tidak memahami satu atau dua aspek analisis. Saya telah memasukkan kode yang saya gunakan untuk contoh khusus ini. ## Libraries library(stats) library(fpc) ## Data mydata = structure(list(a = c(461.4210925, 1549.524107, 936.42856, …
10 r  clustering 

1
Analisis Cluster diikuti oleh Analisis Diskriminan
Apa alasannya, jika ada, untuk menggunakan Analisis Diskriminan (DA) pada hasil algoritma pengelompokan seperti k-means, seperti yang saya lihat dari waktu ke waktu dalam literatur (pada dasarnya pada subtyping klinis gangguan mental)? Umumnya tidak direkomendasikan untuk menguji perbedaan kelompok pada variabel yang digunakan selama konstruksi cluster karena mereka mendukung maksimalisasi …


2
Adjusted Rand Index vs Adjusted Mutual Information
Saya mencoba mengevaluasi kinerja pengelompokan. Saya sedang membaca dokumentasi skiscit-learning tentang metrik . Saya tidak mengerti perbedaan antara ARI dan AMI. Tampak bagi saya bahwa mereka melakukan hal yang sama dalam dua cara berbeda. Mengutip dari dokumentasi: Mengingat pengetahuan tentang tugas kelas kebenaran ground label_true dan penugasan algoritma pengelompokan sampel …


1
Nilai variabel tersembunyi regresi linear R "bernilai"
Ini hanya contoh yang saya temui beberapa kali, jadi saya tidak punya data sampel. Menjalankan model regresi linier di R: a.lm = lm(Y ~ x1 + x2) x1adalah variabel kontinu. x2bersifat kategorikal dan memiliki tiga nilai, mis. "Rendah", "Sedang" dan "Tinggi". Namun output yang diberikan oleh R akan menjadi seperti: …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
Clustering sebagai reduksi dimensi
Saya membaca buku "Machine learning with Spark" oleh Nick Pentreath, dan di halaman 224-225 penulis membahas tentang penggunaan K-means sebagai bentuk pengurangan dimensionalitas. Saya belum pernah melihat pengurangan dimensi seperti ini, apakah ada nama atau / dan berguna untuk bentuk data tertentu ? Saya mengutip buku yang menggambarkan algoritma: Asumsikan …


1
Model pembelajaran dalam mana yang dapat mengklasifikasikan kategori yang tidak eksklusif satu sama lain
Contoh: Saya memiliki kalimat dalam deskripsi pekerjaan: "Java senior engineer in UK". Saya ingin menggunakan model pembelajaran yang mendalam untuk memperkirakannya sebagai 2 kategori: English dan IT jobs. Jika saya menggunakan model klasifikasi tradisional, hanya dapat memprediksi 1 label dengan softmaxfungsi di lapisan terakhir. Dengan demikian, saya dapat menggunakan 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Menerapkan inferensi variatif stokastik untuk Bayesian Mixture of Gaussian
Saya mencoba untuk menerapkan model Campuran Gaussian dengan inferensi variasional stokastik, berikut ini kertas . Ini adalah pgm dari Campuran Gaussian. Menurut makalah itu, algoritma penuh inferensi variatif stokastik adalah: Dan saya masih sangat bingung dengan metode untuk menskalakannya menjadi GMM. Pertama, saya pikir parameter variasional lokal hanya dan yang …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.