Pertanyaan yang diberi tag «predictive-models»

Model prediktif adalah model statistik yang tujuan utamanya adalah untuk memprediksi pengamatan lain dari suatu sistem secara optimal, berbeda dengan model yang tujuannya adalah untuk menguji hipotesis tertentu atau menjelaskan suatu fenomena secara mekanis. Dengan demikian, model prediktif kurang menekankan pada interpretabilitas dan lebih menekankan pada kinerja.




8
Hasilkan variabel acak dengan korelasi yang ditentukan dengan variabel yang ada
Untuk studi simulasi saya harus membuat variabel acak yang menunjukkan korelasi (populasi) prefined ke variabel .YYY Saya melihat ke dalam Rpaket copuladan CDVineyang dapat menghasilkan distribusi multivarian acak dengan struktur ketergantungan yang diberikan. Namun, tidak mungkin untuk memperbaiki salah satu variabel yang dihasilkan ke variabel yang ada. Setiap ide dan …

15
Pemikiran praktis tentang pemodelan eksplanatif vs prediktif
Kembali pada bulan April, saya menghadiri ceramah di seri seminar kelompok Statistik Departemen Matematika UMD yang disebut "To Explain or To Predict?". Pembicaraan diberikan oleh Prof. Galit Shmueli yang mengajar di Smith Business School UMD. Ceramahnya didasarkan pada penelitian yang dia lakukan untuk makalah yang berjudul "Pemodelan Prediktif vs Penjelasan …

8
Bagaimana saya bisa membantu memastikan data pengujian tidak bocor ke dalam data pelatihan?
Misalkan kita memiliki seseorang yang membangun model prediktif, tetapi seseorang belum tentu berpengalaman dalam prinsip-prinsip statistik atau pembelajaran mesin yang tepat. Mungkin kita membantu orang itu saat mereka sedang belajar, atau mungkin orang itu menggunakan semacam paket perangkat lunak yang membutuhkan pengetahuan minimal untuk digunakan. Sekarang orang ini mungkin sangat …


6
Alternatif untuk regresi logistik di R
Saya ingin banyak algoritma yang melakukan tugas yang sama dengan regresi logistik. Itu adalah algoritma / model yang dapat memberikan prediksi untuk respon biner (Y) dengan beberapa variabel penjelas (X). Saya akan senang jika setelah Anda menyebutkan algoritma, jika Anda juga akan menunjukkan cara mengimplementasikannya dalam R. Berikut adalah kode …

5
Apakah menyesuaikan nilai-p dalam regresi berganda untuk beberapa perbandingan adalah ide yang bagus?
Mari kita asumsikan bahwa Anda adalah seorang peneliti ilmu sosial / ekonometrik yang mencoba menemukan prediktor yang relevan dari permintaan layanan. Anda memiliki 2 variabel hasil / dependen yang menggambarkan permintaan (menggunakan layanan ya / tidak, dan jumlah kesempatan). Anda memiliki 10 variabel prediktor / independen yang secara teoritis dapat …

5
Kapan data tidak seimbang benar-benar masalah dalam Pembelajaran Mesin?
Kami sudah memiliki beberapa pertanyaan tentang data yang tidak seimbang ketika menggunakan regresi logistik , SVM , pohon keputusan , mengantongi dan sejumlah pertanyaan serupa lainnya, yang menjadikannya topik yang sangat populer! Sayangnya, masing-masing pertanyaan tampaknya khusus untuk algoritma dan saya tidak menemukan pedoman umum untuk menangani data yang tidak …

3
Interpretasi dari prediktor dan / atau respons yang diubah log
Saya bertanya-tanya apakah itu membuat perbedaan dalam interpretasi apakah hanya dependen, baik dependen dan independen, atau hanya variabel independen yang ditransformasikan log. Pertimbangkan kasus log(DV) = Intercept + B1*IV + Error Saya bisa menafsirkan IV sebagai peningkatan persen tetapi bagaimana ini berubah ketika saya punya log(DV) = Intercept + B1*log(IV) …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

1
dihitung secara manual tidak cocok dengan randomForest () untuk menguji data baru
Saya tahu ini adalah Rpertanyaan yang cukup spesifik , tetapi saya mungkin berpikir tentang perbedaan proporsi yang dijelaskan, , salah. Ini dia.R2R2R^2 Saya mencoba menggunakan Rpaket randomForest. Saya memiliki beberapa data pelatihan dan data pengujian. Ketika saya cocok dengan model hutan acak, randomForestfungsi ini memungkinkan Anda untuk memasukkan data pengujian …

3
Varian dari estimasi cross-validasi lipat sebagai : apa peran "stabilitas"?
TL, DR: Tampaknya, bertentangan dengan saran yang sering diulang, validasi silang tinggalkan-satu-keluar (LOO-CV) - yaitu,lipat CV dengan(jumlah lipatan) sama dengan(angka pengamatan pelatihan) - menghasilkan perkiraan kesalahan generalisasi yang merupakanvariabel terkecil untuk setiap, bukan variabel terbanyak, dengan asumsikondisi stabilitas tertentubaik pada model / algoritma, dataset, atau keduanya (saya tidak yakin yang …

2
Kapan dan bagaimana menggunakan variabel penjelas terstandarisasi dalam regresi linier
Saya punya 2 pertanyaan sederhana tentang regresi linier: Kapan disarankan untuk membakukan variabel penjelas? Setelah estimasi dilakukan dengan nilai-nilai terstandarisasi, bagaimana seseorang dapat memprediksi dengan nilai-nilai baru (bagaimana seseorang harus membuat standar nilai-nilai baru)? Beberapa referensi akan sangat membantu.


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.