Pertanyaan yang diberi tag «distance-functions»

Fungsi jarak mengacu pada fungsi yang digunakan untuk mengukur gagasan jarak antara anggota suatu set, atau antara objek.

8
Mengapa jarak Euclidean bukan metrik yang baik dalam dimensi tinggi?
Saya membaca bahwa 'jarak Euclidean bukan jarak yang baik dalam dimensi tinggi'. Saya kira pernyataan ini ada hubungannya dengan kutukan dimensi, tetapi apa sebenarnya? Selain itu, apa itu 'dimensi tinggi'? Saya telah menerapkan pengelompokan hierarkis menggunakan jarak Euclidean dengan 100 fitur. Hingga berapa banyak fitur yang aman untuk menggunakan metrik …

6
Memilih metode pengelompokan
Ketika menggunakan analisis klaster pada kumpulan data untuk mengelompokkan kasus-kasus serupa, seseorang perlu memilih di antara sejumlah besar metode pengelompokan dan ukuran jarak. Terkadang, satu pilihan mungkin memengaruhi yang lain, tetapi ada banyak kemungkinan kombinasi metode. Apakah ada yang punya rekomendasi tentang bagaimana memilih di antara berbagai algoritma / metode …

6
Mengapa algoritme k-means hanya menggunakan metrik jarak Euclidean?
Apakah ada tujuan khusus dalam hal efisiensi atau fungsionalitas mengapa algoritma k-means tidak menggunakan misalnya cosine (dis) kesamaan sebagai metrik jarak, tetapi hanya dapat menggunakan norma Euclidean? Secara umum, akankah metode K-means patuh dan benar ketika jarak selain Euclidean dipertimbangkan atau digunakan? [Tambahan oleh @ttnphns. Pertanyaannya adalah dua kali lipat. …

3
Berapa distribusi jarak Euclidean antara dua variabel acak yang terdistribusi normal?
Asumsikan Anda diberikan dua objek yang lokasi pastinya tidak diketahui, tetapi didistribusikan sesuai dengan distribusi normal dengan parameter yang diketahui (misalnya a∼N(m,s)a∼N(m,s)a \sim N(m, s) dan b∼N(v,t))b∼N(v,t))b \sim N(v, t)) . Kita dapat mengasumsikan ini adalah normal bivariat, sehingga posisinya dijelaskan oleh distribusi di atas (x,y)(x,y)(x,y) koordinat (yaitu mmm dan …



1
Membandingkan dendrogram pengelompokan hierarkis yang diperoleh dengan jarak & metode yang berbeda
[Judul awal "Pengukuran kesamaan untuk hierarki pohon clustering" kemudian diubah oleh @ttnphns untuk lebih mencerminkan topik] Saya melakukan sejumlah analisis kluster hierarkis pada kerangka data catatan pasien (misalnya mirip dengan http://www.biomedcentral.com/1471-2105/5/126/figure/F1?highres=y ) Saya bereksperimen dengan langkah-langkah jarak yang berbeda, bobot parameter yang berbeda dan metode hierarkis yang berbeda , untuk …


2
Apakah ada penaksir yang tidak bias tentang jarak Hellinger antara dua distribusi?
Dalam pengaturan di mana seseorang mengamati didistribusikan dari distribusi dengan kepadatan , saya ingin tahu apakah ada penduga yang tidak bias (berdasarkan ) dari jarak Hellinger ke distribusi lain dengan kepadatan , yaitu X1,…,XnX1,…,XnX_1,\ldots,X_nfffXiXiX_if0f0f_0H(f,f0)={1−∫Xf(x)f0(x)−−−−−−−−√dx}1/2.H(f,f0)={1−∫Xf(x)f0(x)dx}1/2. \mathfrak{H}(f,f_0) = \left\{ 1 - \int_\mathcal{X} \sqrt{f(x)f_0(x)} \text{d}x \right\}^{1/2}\,.




3
Metrik
Apakah ada yang menggunakan metrik atau L .5 untuk pengelompokan, bukan L 2 ? Aggarwal et al., Tentang perilaku mengejutkan metrik jarak dalam ruang dimensi tinggi mengatakan (pada 2001) ituL1L1L_1L.5L.5L_.5L2L2L_2 secara konsisten lebih disukai daripada metrik jarak Euclidean L 2 untuk aplikasi penambangan data dimensi tinggiL1L1L_1L2L2L_2 dan mengklaim bahwa atau …

3
Skor jarak dan kesamaan Euclidean
Saya hanya bekerja dengan buku Collective Intelligence (oleh Toby Segaran) dan menemukan skor jarak Euclidean. Dalam buku ini penulis menunjukkan bagaimana menghitung kesamaan antara dua array rekomendasi (yaitu skor .orang × film ↦ skor )person×movie↦score)\textrm{person} \times \textrm{movie} \mapsto \textrm{score}) Dia menghitung jarak Euclidean untuk dua orang, dan p 2 dengan …

1
Perbedaan antara PROC Mixed dan lme / lmer dalam R - derajat kebebasan
Catatan: pertanyaan ini adalah repost, karena pertanyaan saya sebelumnya harus dihapus karena alasan hukum. Sambil membandingkan PROC CAMPURAN dari SAS dengan fungsi lmedari nlmepaket di R, saya menemukan beberapa perbedaan yang agak membingungkan. Lebih khusus lagi, derajat kebebasan dalam berbagai tes berbeda antara PROC MIXEDdan lme, dan saya bertanya-tanya mengapa. …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.