Pertanyaan yang diberi tag «predictive-models»

Model prediktif adalah model statistik yang tujuan utamanya adalah untuk memprediksi pengamatan lain dari suatu sistem secara optimal, berbeda dengan model yang tujuannya adalah untuk menguji hipotesis tertentu atau menjelaskan suatu fenomena secara mekanis. Dengan demikian, model prediktif kurang menekankan pada interpretabilitas dan lebih menekankan pada kinerja.

2
Apakah prediksi merupakan 'kriteria emas' untuk menilai kemampuan para ahli statistik?
Saya sedang membaca model linear buku teks Faraway dengan R (edisi 1) akhir pekan lalu. Faraway memiliki bab yang disebut "Strategi Statistik dan Ketidakpastian Model". Dia menggambarkan (halaman 158) bahwa ia artifisial dihasilkan beberapa data menggunakan model yang sangat rumit, maka ia meminta murid-muridnya untuk memodelkan data dan membandingkan siswa …

1
Ketika membangun model regresi menggunakan pemodelan / set validasi yang terpisah, apakah pantas untuk "menyirkulasi ulang" data validasi?
Misalkan saya punya pemisahan 80/20 antara pemodelan / pengamatan validasi. Saya telah memasukkan model ke set data pemodelan, dan saya merasa nyaman dengan kesalahan yang saya lihat pada set data validasi. Sebelum saya meluncurkan model saya untuk menilai pengamatan di masa depan, apakah pantas untuk menggabungkan validasi kembali dengan data …

2
Kapan Harus Log / Exp Variabel Anda saat menggunakan Model Hutan Acak?
Saya sedang melakukan regresi menggunakan Hutan Acak untuk memprediksi harga berdasarkan beberapa atribut. Kode ditulis dalam Python menggunakan Scikit-learn. Bagaimana Anda memutuskan apakah Anda harus mengubah variabel Anda menggunakan exp/ logsebelum menggunakannya agar sesuai dengan model regresi? Apakah perlu ketika menggunakan pendekatan Ensemble seperti Hutan Acak?

2
Bagging dengan oversampling untuk model prediksi kejadian langka
Adakah yang tahu apakah yang berikut ini telah dijelaskan dan (bagaimanapun juga) apakah itu terdengar seperti metode yang masuk akal untuk mempelajari model prediksi dengan variabel target yang sangat tidak seimbang? Seringkali dalam aplikasi CRM data mining, kami akan mencari model di mana peristiwa positif (sukses) sangat jarang relatif terhadap …


2
Prediksi regresi kuantitatif
Saya tertarik menggunakan regresi kuantil untuk beberapa model saya, tetapi ingin memiliki beberapa klarifikasi tentang apa yang dapat saya capai dengan menggunakan metodologi ini. Saya mengerti saya bisa mendapatkan analisis yang lebih kuat tentang hubungan IV / DV , terutama ketika dihadapkan dengan outlier dan heteroskedastisitas, tetapi dalam kasus saya …

2
Apa itu penyusutan?
Kata susut banyak dilemparkan ke lingkaran tertentu. Tapi apa susutnya, sepertinya tidak ada definisi yang jelas. Jika saya memiliki deret waktu (atau kumpulan pengamatan dari suatu proses), apa sajakah cara saya dapat mengukur beberapa jenis penyusutan empiris pada deret tersebut? Apa saja jenis susut teoretis yang dapat saya bicarakan? Bagaimana …

2
Bagaimana memilih lebar bin optimal saat mengkalibrasi model probabilitas?
Latar belakang: Ada beberapa pertanyaan / jawaban yang bagus di sini tentang cara mengkalibrasi model yang memprediksi probabilitas hasil yang terjadi. Sebagai contoh Skor Brier , dan penguraiannya menjadi resolusi, ketidakpastian dan keandalan . Plot kalibrasi dan regresi isotonik . Metode-metode ini sering memerlukan penggunaan metode binning pada probabilitas yang …

1
Uji good-of-fit dalam regresi logistik; 'cocok' mana yang ingin kita uji?
Saya merujuk pada pertanyaan dan jawabannya: Bagaimana cara membandingkan (kemungkinan) kemampuan prediksi model yang dikembangkan dari regresi logistik? oleh @Clark Chong dan jawaban / komentar oleh @ Frank Harrell. dan untuk pertanyaan Derajat kebebasan dalam tes Hosmer-Lemeshowχ2χ2\chi^2 dan komentar-komentarnya. Saya telah membaca makalah DW Hosmer, T. Hosmer, S. Le Cessie, …

1
Apakah ada masalah dengan multikolinearitas dan untuk regresi splines?
Ketika menggunakan splines kubik alami (yaitu dibatasi), fungsi dasar yang dibuat sangat linier, dan ketika digunakan dalam regresi tampaknya menghasilkan statistik VIF (variance inflation factor) yang sangat tinggi, menandakan multikolinieritas. Ketika seseorang mempertimbangkan kasus model untuk tujuan prediksi, apakah ini masalah? Sepertinya itu akan selalu menjadi masalah karena sifat dari …

1
Perbedaan antara PROC Mixed dan lme / lmer dalam R - derajat kebebasan
Catatan: pertanyaan ini adalah repost, karena pertanyaan saya sebelumnya harus dihapus karena alasan hukum. Sambil membandingkan PROC CAMPURAN dari SAS dengan fungsi lmedari nlmepaket di R, saya menemukan beberapa perbedaan yang agak membingungkan. Lebih khusus lagi, derajat kebebasan dalam berbagai tes berbeda antara PROC MIXEDdan lme, dan saya bertanya-tanya mengapa. …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 


2
Memprediksi banyak target atau kelas?
Misalkan saya sedang membangun model prediksi di mana saya mencoba untuk memprediksi beberapa peristiwa (misalnya, gulungan dadu dan lemparan koin). Sebagian besar algoritma yang saya kenal bekerja dengan hanya satu target, jadi saya bertanya-tanya apakah ada pendekatan standar untuk hal semacam ini. Saya melihat dua opsi yang memungkinkan. Mungkin pendekatan …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.