Pertanyaan yang diberi tag «naive-bayes»

Klasifikasi Bayes naif adalah penggolong probabilistik sederhana berdasarkan penerapan teorema Bayes dengan asumsi independensi yang kuat. Istilah yang lebih deskriptif untuk model probabilitas yang mendasarinya adalah "model fitur independen".

1
Mengapa classifier naif bayes optimal untuk kerugian 0-1?
Klasifikasi Naive Bayes adalah pengklasifikasi yang menetapkan item ke kelas berdasarkan pada memaksimalkan posterior untuk keanggotaan kelas, dan mengasumsikan bahwa fitur dari item tersebut independen.xxxCCCP(C|x)P(C|x)P(C|x) Kehilangan 0-1 adalah kerugian yang menyebabkan hilangnya klasifikasi "miss", dan hilangnya "0" untuk klasifikasi yang benar. Saya sering membaca (1) bahwa "Naive Bayes" Classifier, optimal …



2
Klasifikasi Akinator.com dan Naive Bayes
Konteks: Saya seorang programmer dengan beberapa (setengah terlupakan) pengalaman dalam statistik dari kursus uni. Baru-baru ini saya menemukan http://akinator.com dan menghabiskan beberapa waktu mencoba membuatnya gagal. Dan siapa yang tidak? :) Saya telah memutuskan untuk mencari tahu cara kerjanya. Setelah googling dan membaca posting blog terkait dan menambahkan beberapa (terbatas) …



1
Model pembelajaran dalam mana yang dapat mengklasifikasikan kategori yang tidak eksklusif satu sama lain
Contoh: Saya memiliki kalimat dalam deskripsi pekerjaan: "Java senior engineer in UK". Saya ingin menggunakan model pembelajaran yang mendalam untuk memperkirakannya sebagai 2 kategori: English dan IT jobs. Jika saya menggunakan model klasifikasi tradisional, hanya dapat memprediksi 1 label dengan softmaxfungsi di lapisan terakhir. Dengan demikian, saya dapat menggunakan 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
Apakah Naive Bayes menjadi lebih populer? Mengapa?
Ini adalah hasil tren google yang diperoleh untuk frasa "Naive Bayes" dari Jan 2004-April 2017 ( tautan ). Menurut angka ini, rasio pencarian untuk "Naive Bayes" pada bulan April 2017 adalah sekitar% 25 lebih tinggi dari maksimum dalam periode waktu keseluruhan. Apakah ini menyiratkan bahwa metode lama dan sederhana ini …

1
Pengklasifikasi aljabar, informasi lebih lanjut?
Saya telah membaca pengklasifikasi aljabar: pendekatan umum untuk validasi silang cepat, pelatihan online, dan pelatihan paralel dan kagum dengan kinerja algoritma yang diturunkan. Namun, tampaknya di luar Naif Bayes (dan GBM) tidak ada banyak algoritma yang disesuaikan dengan kerangka kerja. Apakah ada makalah lain yang bekerja pada pengklasifikasi yang berbeda? …

2
Hitung kurva ROC untuk data
Jadi, saya memiliki 16 percobaan di mana saya mencoba untuk mengotentikasi seseorang dari sifat biometrik menggunakan Hamming Distance. Ambang batas saya diatur ke 3.5. Data saya di bawah dan hanya percobaan 1 yang Benar-Benar Positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

4
Menghitung kesalahan pengklasifikasi Bayes secara analitis
Jika dua kelas dan memiliki distribusi normal dengan parameter yang diketahui ( , sebagai sarana dan , adalah kovarian mereka) bagaimana kita dapat menghitung kesalahan dari classifier Bayes untuk mereka secara teori?w1w1w_1w2w2w_2M.1M.1M_1M.2M.2M_2Σ1Σ1\Sigma_1Σ2Σ2\Sigma_2 Anggap pula variabel-variabel berada dalam ruang dimensi-N. Catatan: Salinan pertanyaan ini juga tersedia di https://math.stackexchange.com/q/11891/4051 yang masih belum …

3
Temukan distribusi dan ubah ke distribusi normal
Saya memiliki data yang menggambarkan seberapa sering suatu peristiwa berlangsung selama satu jam ("angka per jam", nph) dan berapa lama acara berlangsung ("durasi dalam detik per jam", dph). Ini adalah data asli: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, 15.3750000002237, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 

2
Naif Bayes pada variabel kontinu
Tolong izinkan saya untuk mengajukan pertanyaan dasar. Saya memahami mekanisme Naive Bayes untuk variabel diskrit, dan dapat mengulang perhitungan "dengan tangan". (kode HouseVotes84 semua jalan per di bawah ini). Namun - Saya berjuang untuk melihat bagaimana mekanisme bekerja untuk variabel kontinu (contoh kode per di bawah). Bagaimana paket menghitung probabilitas …
8 r  naive-bayes  bayes 

4
Apakah Bayesian Classifier merupakan pendekatan yang baik untuk teks dengan meta-data numerik?
Saya mencoba membuat pendekatan untuk mendeteksi iklan penipuan di situs web saya. Saya pikir masalahnya ada banyak kesamaan dengan mendeteksi email spam (yang mana Bayesian classifier adalah solusi umum) karena banyak sinyal yang mengindikasikan penipuan akan ditemukan dalam teks iklan. Namun, ada beberapa informasi lain yang bisa menjadi indikator scam …

3
Bagaimana klasifikasi digabungkan dalam klasifikasi ensemble?
Bagaimana penggolong ensemble menggabungkan prediksi penggolong konstituennya? Saya mengalami kesulitan menemukan deskripsi yang jelas. Dalam beberapa contoh kode yang saya temukan, ansambel hanya memperkirakan rata-rata, tetapi saya tidak melihat bagaimana ini bisa membuat akurasi keseluruhan yang "lebih baik". Pertimbangkan kasus berikut. Penggolong ensemble terdiri dari 10 pengklasifikasi. Satu classifier memiliki …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.