Pertanyaan yang diberi tag «modeling»

Tag ini menjelaskan proses membuat model pembelajaran statistik atau mesin. Selalu tambahkan tag yang lebih spesifik.

2
Memodelkan kriket bowler mengeluarkan batsmen
Saya memiliki satu set data yang merinci banyak game kriket (beberapa ribu). Dalam kriket "bowler" berulang kali melempar bola pada suksesi "batsmen". Bowler sedang mencoba untuk mendapatkan batsman "keluar". Dalam hal ini sangat mirip dengan pitcher dan batter di baseball. Jika saya mengambil seluruh dataset dan membagi jumlah total bola …

5
Apa cara yang baik untuk secara grafis mewakili sejumlah besar titik data berpasangan?
Di bidang saya, cara yang biasa untuk memplot data berpasangan adalah sebagai serangkaian segmen garis miring tipis, menimpanya dengan median dan CI median untuk dua kelompok: Namun, plot semacam ini menjadi lebih sulit dibaca karena jumlah titik data menjadi sangat besar (dalam kasus saya yang saya miliki di urutan 10.000 …

2
Pengujian ulang atau validasi silang ketika proses pembuatan model bersifat interaktif
Saya memiliki beberapa model prediktif yang kinerjanya ingin saya uji kembali (yaitu, ambil dataset saya, "putar kembali" ke titik waktu sebelumnya, dan lihat bagaimana model tersebut akan tampil secara prospektif). Masalahnya adalah bahwa beberapa model saya dibangun melalui proses interaktif. Misalnya, mengikuti saran dalam Strategi Pemodelan Regresi Frank Harrell , …

5
Regresi Logistik pada Big Data
Saya memiliki kumpulan data sekitar 5000 fitur. Untuk data itu saya pertama kali menggunakan uji Chi Square untuk pemilihan fitur; setelah itu, saya mendapat sekitar 1500 variabel yang menunjukkan hubungan signifikan dengan variabel respon. Sekarang saya harus menyesuaikan regresi logistik. Saya menggunakan paket glmulti untuk R (paket glmulti menyediakan pilihan …

4
Pemodelan untuk skor sepakbola
Dalam Dixon, Coles ( 1997 ), mereka telah menggunakan estimasi kemungkinan maksimum untuk dua model Poisson independen yang dimodifikasi dalam (4.3) untuk memodelkan skor dalam sepak bola. Saya mencoba menggunakan R untuk "mereproduksi" alfa dan beta serta parameter efek rumah (hal 274, Tabel 4) tanpa menggunakan paket apa pun (menggunakan …


2
Bagaimana memodelkan jumlah variabel acak Bernoulli untuk data dependen?
Saya memiliki pertanyaan yang hampir sama seperti ini: Bagaimana saya bisa memodelkan jumlah variabel acak Bernoulli secara efisien? Tetapi pengaturannya sangat berbeda: S=∑i=1,NXiS=∑i=1,NXiS=\sum_{i=1,N}{X_i} , , ~ 20, p_i ~ 0.1P(Xi=1)=piP(Xi=1)=piP(X_{i}=1)=p_iNNNpipip_i Kami memiliki data untuk hasil variabel acak Bernoulli: Xi,jXi,jX_{i,j} , Sj=∑i=1,NXi,jSj=∑i=1,NXi,jS_j=\sum_{i=1,N}{X_{i,j}} Jika kita memperkirakan pipip_i dengan estimasi kemungkinan maksimum (dan …


2
Hitung kurva ROC untuk data
Jadi, saya memiliki 16 percobaan di mana saya mencoba untuk mengotentikasi seseorang dari sifat biometrik menggunakan Hamming Distance. Ambang batas saya diatur ke 3.5. Data saya di bawah dan hanya percobaan 1 yang Benar-Benar Positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 



3
Menghitung subset prediktor terbaik untuk regresi linier
Untuk pemilihan prediktor dalam regresi linier multivariat dengan prediktor yang cocok, apa metode yang tersedia untuk menemukan 'optimal' subset dari prediktor tanpa secara eksplisit menguji semua 2 p subset? Dalam 'Analisis Kelangsungan Hidup Terapan,' Hosmer & Lemeshow membuat referensi ke metode Kuk, tetapi saya tidak dapat menemukan kertas aslinya. Adakah …


4
Dapatkah regresi berbasis pohon berkinerja lebih buruk daripada regresi linier biasa?
Hai, saya sedang mempelajari teknik regresi. Data saya memiliki 15 fitur dan 60 juta contoh (tugas regresi). Ketika saya mencoba banyak teknik regresi yang dikenal (gradient boosted tree, Decision tree regression, AdaBoostRegressor dll) regresi linier dilakukan dengan sangat baik. Skor hampir terbaik di antara algoritma tersebut. Apa yang bisa menjadi …

4
Bagaimana data dihasilkan dalam kerangka Bayesian dan apa sifat pada parameter yang menghasilkan data?
Saya mencoba mempelajari kembali statistik Bayesian (setiap kali saya pikir saya akhirnya mendapatkannya, sesuatu yang lain muncul yang tidak saya pertimbangkan sebelumnya ....) tetapi tidak jelas (bagi saya) apa proses pembuatan data dalam Bayesian Framework sebenarnya. Kerangka kerja frequentist jelas bagi saya. Ada beberapa parameter "true" dan parameter itu menghasilkan …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.