Pertanyaan yang diberi tag «k-means»

k-means adalah metode untuk mempartisi data ke dalam kluster dengan menemukan sejumlah cara, k, st ketika data ditugaskan ke kluster dengan rata-rata terdekat, jumlah kluster w / i kuadrat diminimalkan

3
k-means vs k-means ++
Sejauh yang saya tahu k-means memilih pusat awal secara acak. Karena mereka didasarkan pada keberuntungan murni, mereka dapat dipilih dengan sangat buruk. Algoritma K-means ++ mencoba untuk memecahkan masalah ini, dengan menyebarkan pusat awal secara merata. Apakah kedua algoritma menjamin hasil yang sama? Atau ada kemungkinan bahwa centroid awal yang …
10 k-means 



1
Tentukan jumlah lokasi dunia nyata yang tidak diketahui dari laporan berbasis GPS
Saya sedang mengerjakan beberapa perangkat lunak yang harus menentukan lokasi dunia nyata (kamera kecepatan) dari beberapa laporan berbasis GPS . Seorang pengguna akan mengemudi saat melaporkan lokasi, sehingga laporannya sangat tidak akurat. Untuk mengatasi masalah itu saya harus mengelompokkan laporan tentang lokasi yang sama dan menghitung rata-rata. Pertanyaan saya adalah …

3
Memilih cluster untuk k-means: kasus 1 cluster
Adakah yang tahu metode yang baik untuk menentukan apakah pengelompokan menggunakan kmeans bahkan sesuai? Artinya, bagaimana jika sampel Anda sebenarnya homogen? Saya tahu sesuatu seperti model campuran (melalui mclust di R) akan memberikan statistik yang cocok untuk kasus klaster 1: k, tetapi sepertinya semua teknik untuk mengevaluasi kman memerlukan setidaknya …
9 r  clustering  k-means 

1
Bagaimana cara membandingkan acara yang diamati dengan yang diharapkan?
Misalkan saya punya satu sampel frekuensi dari 4 peristiwa yang mungkin: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 dan saya memiliki probabilitas yang diharapkan dari peristiwa saya terjadi: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dengan jumlah frekuensi yang diamati …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

3
Bersepeda dalam algoritma k-means
Menurut wiki kriteria konvergensi yang paling banyak digunakan adalah "tugas belum berubah". Saya bertanya-tanya apakah bersepeda dapat terjadi jika kita menggunakan kriteria konvergensi? Saya akan senang jika ada orang yang menunjuk referensi ke artikel yang memberikan contoh bersepeda atau membuktikan bahwa ini tidak mungkin.


1
Kriteria siku untuk menentukan jumlah cluster
Disebutkan di sini bahwa salah satu metode untuk menentukan jumlah cluster optimal dalam satu set data adalah "metode siku". Di sini persentase varians dihitung sebagai rasio varians antara-kelompok dengan total varians. Saya merasa sulit memahami perhitungan ini. Adakah yang bisa menjelaskan bagaimana cara menghitung persentase varian untuk set data yang …

1
Manfaat SVM sebagai alat untuk pengenalan angka
Saya cukup baru dalam pengenalan digit, dan saya perhatikan bahwa banyak tutorial menggunakan klasifikasi SVM, misalnya: http://hanzratech.in/2015/02/24/handwritten-digit-recognition-using-opencv-sklearn-and-python.html http://scikit-learn.org/stable/auto_examples/classification/plot_digits_classification.html Saya ingin tahu apakah ada manfaat (khusus domain) untuk alat itu, dibandingkan dengan misalnya Belajar jaringan saraf yang mendalam Klasifikasi berdasarkan k-means Terima kasih atas komentarnya. Klarifikasi, mengapa SVM adalah alat yang …

1
K-means sebagai batas kasus algoritma EM untuk campuran Gaussian dengan kovarian akan
Tujuan saya adalah untuk melihat bahwa algoritma K-means sebenarnya adalah algoritma Ekspektasi-Maksimalisasi untuk campuran Gaussian di mana semua komponen memiliki kovarian dalam batas sebagai .σ2Iσ2I\sigma^2 Ilimσ→0limσ→0\lim_{\sigma \to 0} Misalkan kita memiliki kumpulan data {x1,…,xN}{x1,…,xN}\{x_1, \dots ,x_N\} pengamatan dari variabel acak XXX . Fungsi objektif untuk M-means diberikan oleh: J=∑n=1N∑k=1Krnk||xn−μk||2J=∑n=1N∑k=1Krnk||xn−μk||2J = …

3
Menggunakan k-means dengan metrik lainnya
Jadi saya menyadari ini telah ditanyakan sebelumnya: misalnya Apa kasus penggunaan terkait dengan analisis cluster metrik jarak yang berbeda? tetapi saya telah menemukan jawaban yang agak kontradiktif dengan apa yang disarankan harus dimungkinkan dalam literatur. Baru-baru ini saya telah membaca dua makalah yang menyebutkan menggunakan algoritma kmeans dengan metrik lain, …

4
Clusterings yang bisa disebabkan oleh K-means
Saya mendapatkan pertanyaan berikut sebagai pertanyaan ujian untuk ujian saya dan saya tidak bisa memahami jawabannya. Plot sebar data yang diproyeksikan ke dua komponen utama pertama ditunjukkan di bawah ini. Kami ingin memeriksa apakah ada beberapa struktur grup dalam kumpulan data. Untuk melakukan ini, kami telah menjalankan algoritma k-means dengan …

2
Mengapa hanya nilai rata-rata yang digunakan dalam metode pengelompokan (K-means)?
Dalam metode pengelompokan seperti K-means , jarak euclidean adalah metrik yang digunakan. Akibatnya, kami hanya menghitung nilai rata-rata di dalam setiap kluster. Dan kemudian penyesuaian dilakukan pada elemen-elemen berdasarkan jarak mereka ke setiap nilai rata-rata. Saya bertanya-tanya mengapa fungsi Gaussian tidak digunakan sebagai metrik? Alih-alih menggunakan xi -mean(X), kita bisa …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.