Pertanyaan yang diberi tag «algorithms»

Daftar langkah-langkah komputasi jelas terlibat dalam menemukan solusi untuk kelas masalah.


4
Cara sampel ketika Anda tidak tahu distribusinya
Saya cukup baru dalam hal statistik (beberapa program Uni tingkat pemula) dan ingin tahu tentang pengambilan sampel dari distribusi yang tidak diketahui. Khususnya, jika Anda tidak tahu tentang distribusi yang mendasarinya, apakah ada cara untuk "menjamin" bahwa Anda mendapatkan sampel yang representatif? Contoh untuk mengilustrasikan: katakanlah Anda mencoba mencari tahu …

3
Algoritma Apriori dalam bahasa Inggris biasa?
Saya membaca artikel wiki tentang Apriori. Saya kesulitan memahami langkah prune dan Join. Adakah yang bisa menjelaskan kepada saya bagaimana algoritma Apriori bekerja secara sederhana (sehingga pemula seperti saya dapat mengerti dengan mudah)? Akan lebih baik jika seseorang menjelaskan proses langkah demi langkah yang terlibat di dalamnya.

3
Bersepeda dalam algoritma k-means
Menurut wiki kriteria konvergensi yang paling banyak digunakan adalah "tugas belum berubah". Saya bertanya-tanya apakah bersepeda dapat terjadi jika kita menggunakan kriteria konvergensi? Saya akan senang jika ada orang yang menunjuk referensi ke artikel yang memberikan contoh bersepeda atau membuktikan bahwa ini tidak mungkin.

3
Pengelompokan yang efisien ruang
Kebanyakan algoritma pengelompokan yang saya lihat dimulai dengan membuat jarak masing-masing untuk setiap titik, yang menjadi masalah pada kumpulan data yang lebih besar. Apakah ada yang tidak melakukannya? Atau apakah itu dalam semacam pendekatan parsial / perkiraan / terhuyung-huyung? Algoritma / implementasi clustering mana yang membutuhkan waktu kurang dari O …

2
Memaksa satu set angka ke kurva lonceng gaussian
( Ini berkaitan dengan pertanyaan pemrograman saya tentang Stack Overflow : Bell Curve Gaussian Algorithm (Python dan / atau C #) .) Di Answers.com, saya menemukan contoh sederhana ini: Temukan rata-rata aritmatika (rata-rata) => Jumlah semua nilai dalam set, dibagi dengan jumlah elemen dalam set Temukan jumlah kuadrat dari semua …

2
Hitung kurva ROC untuk data
Jadi, saya memiliki 16 percobaan di mana saya mencoba untuk mengotentikasi seseorang dari sifat biometrik menggunakan Hamming Distance. Ambang batas saya diatur ke 3.5. Data saya di bawah dan hanya percobaan 1 yang Benar-Benar Positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
Perbedaan antara anil simulasi dan serakah ganda
Saya mencoba untuk memahami apa perbedaan antara anil simulasi dan menjalankan beberapa algoritma mendaki bukit serakah. Pada pemahaman saya, algoritma serakah akan mendorong skor ke maksimum lokal, tetapi jika kita mulai dengan beberapa konfigurasi acak dan menerapkan serakah untuk semuanya, kita akan memiliki beberapa maksimum lokal. Lalu kami memilih maks …

2
Kebijakan dan kondisi konvergensi algoritma iterasi nilai
Algoritme kebijakan dan nilai iterasi dapat digunakan untuk menyelesaikan masalah proses keputusan Markov. Saya mengalami kesulitan memahami kondisi yang diperlukan untuk konvergensi. Jika kebijakan optimal tidak berubah selama dua langkah (yaitu selama iterasi i dan i +1 ), dapatkah disimpulkan bahwa algoritma telah konvergen? Jika tidak, lalu kapan?

3
Bagaimana melakukan SVD untuk memasukkan nilai yang hilang, contoh konkret
Saya telah membaca komentar yang bagus mengenai bagaimana menangani nilai yang hilang sebelum menerapkan SVD, tetapi saya ingin tahu cara kerjanya dengan contoh sederhana: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Mengingat matriks di atas, jika saya …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

2
Mengapa model statistik cocok jika diberi set data yang sangat besar?
Proyek saya saat ini mungkin mengharuskan saya untuk membuat model untuk memprediksi perilaku sekelompok orang tertentu. set data pelatihan hanya berisi 6 variabel (id hanya untuk tujuan identifikasi): id, age, income, gender, job category, monthly spend di mana monthly spendadalah variabel respon. Tetapi dataset pelatihan berisi sekitar 3 juta baris, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 



4
FA: Memilih matriks Rotasi, berdasarkan “Kriteria Struktur Sederhana”
Salah satu masalah terpenting dalam menggunakan analisis faktor adalah interpretasinya. Analisis faktor sering menggunakan rotasi faktor untuk meningkatkan interpretasinya. Setelah rotasi yang memuaskan, matriks pemuatan faktor yang diputar L ' akan memiliki kemampuan yang sama untuk mewakili matriks korelasi dan dapat digunakan sebagai matriks pemuatan faktor, bukan matriks L yang …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.