Pertanyaan yang diberi tag «modeling»

Tag ini menjelaskan proses membuat model pembelajaran statistik atau mesin. Selalu tambahkan tag yang lebih spesifik.

9
Apakah kita melebih-lebihkan pentingnya asumsi model dan evaluasi di era ketika analisis sering dilakukan oleh orang awam
Intinya , semakin banyak saya belajar tentang statistik, semakin sedikit saya percaya makalah yang diterbitkan di bidang saya; Saya hanya percaya bahwa para peneliti tidak melakukan statistik mereka dengan cukup baik. Saya seorang awam, untuk berbicara. Saya dilatih dalam biologi tetapi saya tidak memiliki pendidikan formal dalam statistik atau matematika. …

5
Memahami regresi - peran model
Bagaimana model regresi dapat digunakan jika Anda tidak tahu fungsi yang Anda cari parameternya? Saya melihat sebuah penelitian yang mengatakan bahwa ibu yang menyusui anak-anak mereka cenderung menderita diabetes di kemudian hari. Penelitian ini berasal dari survei terhadap sekitar 1.000 ibu dan dikontrol untuk faktor-faktor lain-lain dan model loglinear digunakan. …

8
Apakah semua model tidak berguna? Apakah model yang tepat mungkin - atau berguna?
Pertanyaan ini telah membekas di benak saya selama lebih dari sebulan. Amstat News edisi Februari 2015 memuat artikel oleh Profesor Berkeley Mark van der Laan yang memarahi orang-orang karena menggunakan model yang tidak tepat. Dia menyatakan bahwa dengan menggunakan model, statistik lebih merupakan seni daripada sains. Menurutnya, kita selalu dapat …

4
Model statistik lembar contekan
Saya bertanya-tanya apakah ada model statistik "lembar contekan" yang mencantumkan informasi apa pun atau lebih: kapan harus menggunakan model kapan tidak menggunakan model input yang diperlukan dan opsional output yang diharapkan sudahkah model diuji di berbagai bidang (kebijakan, bio, teknik, manufaktur, dll)? apakah itu diterima dalam praktik atau penelitian? variasi …

2
Memahami parameter di dalam Distribusi Binomial Negatif
Saya mencoba untuk menyesuaikan data saya ke dalam berbagai model dan tahu bahwa fitdistrfungsi dari perpustakaan MASSdari Rmemberi saya Negative Binomialsebagai yang terbaik-fit. Sekarang dari halaman wiki , definisi diberikan sebagai: Distribusi NegBin (r, p) menggambarkan probabilitas kegagalan k dan keberhasilan r dalam percobaan k + r Bernoulli (p) dengan …

5
Apa praktik terbaik dalam mengidentifikasi efek interaksi?
Selain secara harfiah menguji setiap kemungkinan kombinasi variabel dalam suatu model ( x1:x2atau x1*x2 ... xn-1 * xn). Bagaimana Anda mengidentifikasi jika interaksi HARUS atau BISA ada antara variabel independen Anda (semoga)? Apa praktik terbaik dalam mencoba mengidentifikasi interaksi? Apakah ada teknik grafis yang bisa atau tidak Anda gunakan?

7
Memilih variabel untuk dimasukkan dalam model regresi linier berganda
Saat ini saya sedang bekerja untuk membangun model menggunakan regresi linier berganda. Setelah mengutak-atik model saya, saya tidak yakin bagaimana cara terbaik menentukan variabel mana yang harus disimpan dan yang harus dihapus. Model saya mulai dengan 10 prediktor untuk DV. Saat menggunakan semua 10 prediktor, empat dianggap signifikan. Jika saya …

3
Bagaimana cara memasang model ARIMAX dengan R?
Saya memiliki empat seri pengukuran waktu yang berbeda: Konsumsi panas di dalam rumah Suhu di luar rumah Radiasi matahari Kecepatan angin Saya ingin dapat memprediksi konsumsi panas di dalam rumah. Ada tren musiman yang jelas, baik secara tahunan, dan setiap hari. Karena ada korelasi yang jelas antara seri yang berbeda, …


3
Mengapa pemilihan variabel diperlukan?
Prosedur pemilihan variabel berbasis data umum (misalnya, maju, mundur, bertahap, semua himpunan bagian) cenderung menghasilkan model dengan sifat yang tidak diinginkan, termasuk: Koefisien yang bias jauh dari nol. Kesalahan standar yang terlalu kecil dan interval kepercayaan yang terlalu sempit. Uji statistik dan nilai-p yang tidak memiliki makna yang diiklankan. Perkiraan …

2
Apa model statistik di belakang algoritma SVM?
Saya telah belajar bahwa, ketika berhadapan dengan data menggunakan pendekatan berbasis model, langkah pertama adalah memodelkan prosedur data sebagai model statistik. Kemudian langkah selanjutnya adalah mengembangkan algoritma inferensi / pembelajaran yang efisien / cepat berdasarkan pada model statistik ini. Jadi saya ingin bertanya model statistik mana yang berada di belakang …


1
Menghitung pengulangan efek dari model lmer
Saya baru saja menemukan makalah ini , yang menjelaskan bagaimana menghitung pengulangan (alias reliabilitas, alias korelasi intraclass) dari pengukuran melalui pemodelan efek campuran. Kode R adalah: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 


6
Bagaimana cara memilih antara skor ROC AUC dan F1?
Saya baru-baru ini menyelesaikan kompetisi Kaggle di mana skor roc auc digunakan sesuai persyaratan kompetisi. Sebelum proyek ini, saya biasanya menggunakan skor f1 sebagai metrik untuk mengukur kinerja model. Ke depan, saya bertanya-tanya bagaimana saya harus memilih antara dua metrik ini? Kapan menggunakan yang mana, dan apa pro dan kontra …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.