Pertanyaan yang diberi tag «k-nearest-neighbour»

k-Nearest-Neighbor Classifier Kelas-kelas ini berbasis memori, dan tidak memerlukan model yang sesuai. Diberi poin permintaan x0, kami menemukan poin pelatihan k x (r), r = 1, ..., k paling dekat jaraknya ke x0, dan kemudian mengklasifikasikan menggunakan suara terbanyak di antara tetangga k.


2
Bagaimana cara merencanakan batas keputusan classifier tetangga k-terdekat dari Elemen Pembelajaran Statistik?
Saya ingin membuat plot yang dijelaskan dalam buku ElemStatLearn "Unsur-unsur Pembelajaran Statistik: Penambangan Data, Inferensi, dan Prediksi. Edisi Kedua" oleh Trevor Hastie & Robert Tibshirani & Jerome Friedman. Plotnya adalah: Saya bertanya-tanya bagaimana saya bisa menghasilkan grafik yang tepat ini R, khususnya perhatikan grafik kotak dan perhitungan untuk menunjukkan batas.

1
Menghitung pengulangan efek dari model lmer
Saya baru saja menemukan makalah ini , yang menjelaskan bagaimana menghitung pengulangan (alias reliabilitas, alias korelasi intraclass) dari pengukuran melalui pemodelan efek campuran. Kode R adalah: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 


3
Menggabungkan model pembelajaran mesin
Saya agak baru dalam pendataan / pembelajaran mesin / dll. dan telah membaca tentang beberapa cara untuk menggabungkan beberapa model dan menjalankan model yang sama untuk meningkatkan prediksi. Kesan saya dari membaca beberapa makalah (yang sering menarik dan hebat dalam teori dan huruf Yunani tetapi kekurangan kode dan contoh aktual) …

2
Kapan "Tetangga Terdekat" bermakna, hari ini?
Pada tahun 1999, Beyer et al. bertanya, Kapan "Tetangga Terdekat" bermakna? Adakah cara yang lebih baik untuk menganalisis dan memvisualisasikan efek jarak rata pada pencarian NN sejak 1999? Apakah set data yang diberikan memberikan jawaban yang berarti untuk masalah 1-NN? Masalah 10-NN? Masalah 100-NN? Bagaimana Anda para pakar mendekati pertanyaan …

1
kompleksitas komputasi k-NN
Apa kompleksitas waktu dari algoritma k -NN dengan pendekatan pencarian naif (tidak ada pohon kd atau similars)? Saya tertarik pada kompleksitas waktunya mempertimbangkan juga hyperparameter k . Saya telah menemukan jawaban yang bertentangan: O (nd + kn), di mana n adalah kardinalitas set pelatihan dan d dimensi masing-masing sampel. [1] …


3
Memilih K optimal untuk KNN
Saya melakukan CV 5 kali lipat untuk memilih K yang optimal untuk KNN. Dan sepertinya semakin besar K, semakin kecil kesalahannya ... Maaf saya tidak punya legenda, tetapi warna yang berbeda mewakili cobaan yang berbeda. Ada 5 total dan sepertinya ada sedikit variasi di antara mereka. Kesalahan sepertinya selalu berkurang …

2
Mengapa Anda perlu skala data di KNN
Bisakah seseorang tolong jelaskan kepada saya mengapa Anda perlu menormalkan data saat menggunakan K tetangga terdekat. Saya sudah mencoba mencari ini, tetapi saya masih belum bisa memahaminya. Saya menemukan tautan berikut: https://discuss.analyticsvidhya.com/t/why-it-is-n perlu-to-normalisasi-in-knn/2715 Namun dalam penjelasan ini, saya tidak mengerti mengapa kisaran yang lebih besar di salah satu fitur mempengaruhi …

1
Apakah kutukan Dimensi mempengaruhi beberapa model lebih dari yang lain?
Tempat saya telah membaca tentang kutukan dimensionalitas menjelaskannya dalam hubungannya dengan kNN terutama, dan model linier secara umum. Saya secara teratur melihat peringkat teratas di Kaggle menggunakan ribuan fitur pada dataset yang hampir tidak memiliki 100k titik data. Mereka terutama menggunakan pohon Boosted dan NN, antara lain. Banyak fitur yang …

5
Paket R KNutasi imputasi
Saya mencari paket imputasi KNN. Saya telah melihat paket imputasi ( http://cran.r-project.org/web/packages/imputation/imputation.pdf ) tetapi untuk beberapa alasan fungsi impute KNN (bahkan ketika mengikuti contoh dari deskripsi) hanya tampak untuk memasukkan nilai nol (sesuai di bawah ini). Saya telah melihat-lihat tetapi belum menemukan sesuatu, dan karenanya bertanya-tanya apakah ada yang punya …


3
Penduga kepadatan kernel adaptif?
Adakah yang bisa melaporkan pengalaman mereka dengan penaksir kepadatan kernel adaptif? (Ada banyak sinonim: adaptif | variabel | lebar variabel, KDE | histogram | interpolator ...) Estimasi kepadatan kernel variabel mengatakan "kami memvariasikan lebar kernel di berbagai daerah ruang sampel. Ada dua metode ..." sebenarnya, lebih: tetangga dalam beberapa radius, …

4
Apa tujuan dari normalisasi baris
Saya mengerti alasan di balik normalisasi kolom, karena hal itu menyebabkan fitur-fitur menjadi tertimbang sama rata, bahkan jika mereka tidak diukur pada skala yang sama - namun, sering dalam literatur tetangga terdekat, baik kolom dan baris dinormalisasi. Apa normalisasi baris untuk / mengapa menormalkan baris? Secara khusus, bagaimana hasil normalisasi …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.