Pertanyaan yang diberi tag «predictive-models»

Model prediktif adalah model statistik yang tujuan utamanya adalah untuk memprediksi pengamatan lain dari suatu sistem secara optimal, berbeda dengan model yang tujuannya adalah untuk menguji hipotesis tertentu atau menjelaskan suatu fenomena secara mekanis. Dengan demikian, model prediktif kurang menekankan pada interpretabilitas dan lebih menekankan pada kinerja.

2
Apakah ini metodologi regresi yang canggih?
Saya telah mengikuti kompetisi Kaggle untuk waktu yang lama dan saya menyadari bahwa banyak strategi kemenangan melibatkan menggunakan setidaknya satu dari "bertiga besar": mengantongi, meningkatkan dan menumpuk. Untuk regresi, daripada berfokus pada membangun satu model regresi terbaik, membangun beberapa model regresi seperti (linier) regresi linier, hutan acak, KNN, NN, dan …


6
Haruskah kekikiran benar-benar masih menjadi standar emas?
Hanya pemikiran saja: Model Parsimonious selalu menjadi pilihan standar dalam pemilihan model, tetapi sampai sejauh mana pendekatan ini sudah usang? Saya ingin tahu tentang seberapa besar kecenderungan kita terhadap kekikiran adalah peninggalan zaman abaci dan aturan geser (atau, lebih serius, komputer non-modern). Kekuatan komputasi saat ini memungkinkan kami untuk membangun …

3
Apa akar penyebab masalah ketidakseimbangan kelas?
Saya telah banyak berpikir tentang "masalah ketidakseimbangan kelas" dalam pembelajaran mesin / statistik akhir-akhir ini, dan saya semakin dalam merasakan bahwa saya tidak mengerti apa yang sedang terjadi. Pertama, biarkan saya mendefinisikan (atau mencoba) mendefinisikan istilah saya: Masalah ketidakseimbangan kelas dalam pembelajaran mesin / statistik adalah pengamatan bahwa beberapa algoritma …

3
apakah akan mengubah indikator / biner / prediktor tiruan untuk LASSO
Untuk LASSO (dan prosedur pemilihan model lainnya), sangat penting untuk mengubah skala prediktor. The umum Rekomendasi saya tindak hanya menggunakan 0 berarti, 1 standar deviasi normalisasi untuk variabel kontinyu. Tapi apa yang harus dilakukan dengan boneka? Misalnya beberapa contoh terapan dari sekolah musim panas yang sama (luar biasa) yang saya …

2
Mengapa nilai-p menyesatkan setelah melakukan seleksi bertahap?
Mari kita pertimbangkan misalnya model regresi linier. Saya mendengar bahwa, dalam penambangan data, setelah melakukan seleksi bertahap berdasarkan kriteria AIC, adalah keliru untuk melihat nilai-p untuk menguji hipotesis nol bahwa setiap koefisien regresi yang benar adalah nol. Saya mendengar bahwa orang harus mempertimbangkan semua variabel yang tersisa dalam model memiliki …

1
Bisakah derajat kebebasan menjadi angka non-integer?
Ketika saya menggunakan GAM, itu memberi saya sisa DF adalah (baris terakhir dalam kode). Apa artinya? Melampaui contoh GAM, Secara umum, bisakah jumlah derajat kebebasan menjadi angka yang bukan bilangan bulat?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

9
Kapan korelasi dapat berguna tanpa sebab-akibat?
Pepatah hewan peliharaan dari banyak ahli statistik adalah "Korelasi tidak menyiratkan sebab-akibat." Ini memang benar, tetapi satu hal yang TIDAK TERLIHAT di sini adalah bahwa korelasi memiliki sedikit atau tidak ada nilai. Apakah ini benar? Apakah tidak berguna memiliki pengetahuan bahwa dua variabel berkorelasi? Saya tidak bisa membayangkan itu masalahnya. …

4
Memprediksi dengan fitur berkelanjutan dan kategorikal
Beberapa teknik pemodelan prediktif lebih dirancang untuk menangani prediktor berkelanjutan, sementara yang lain lebih baik untuk menangani variabel kategorikal atau diskrit. Tentu saja ada teknik untuk mengubah satu jenis ke yang lain (diskritisasi, variabel dummy, dll.). Namun, apakah ada teknik pemodelan prediktif yang dirancang untuk menangani kedua jenis input pada …

1
Apakah ada algoritma yang menggabungkan klasifikasi dan regresi?
Saya bertanya-tanya apakah ada algoritma yang bisa melakukan klasifikasi dan regresi pada saat yang sama. Sebagai contoh, saya ingin membiarkan algoritma mempelajari classifier, dan pada saat yang sama dalam setiap label, ia juga mempelajari target yang berkelanjutan. Jadi, untuk setiap contoh pelatihan, ia memiliki label kategoris dan nilai kontinu. Saya …

4
Masalah apa yang dipecahkan oleh oversampling, undersampling, dan SMOTE?
Dalam pertanyaan yang baru-baru ini diterima dengan baik, Tim bertanya kapan data yang tidak seimbang benar-benar menjadi masalah dalam Pembelajaran Mesin ? Premis dari pertanyaan ini adalah bahwa ada banyak literatur pembelajaran mesin yang membahas keseimbangan kelas dan masalah kelas yang tidak seimbang . Idenya adalah bahwa dataset dengan ketidakseimbangan …

2
Apakah model campuran bermanfaat sebagai model prediksi?
Saya agak bingung tentang kelebihan model campuran dalam hal pemodelan prediktif. Karena model prediktif biasanya dimaksudkan untuk memprediksi nilai dari pengamatan yang sebelumnya tidak diketahui maka tampak jelas bagi saya bahwa satu-satunya cara model campuran mungkin berguna adalah melalui kemampuannya untuk memberikan prediksi tingkat populasi (yaitu tanpa menambahkan efek acak). …

3
Validasi silang atau bootstrap untuk mengevaluasi kinerja klasifikasi?
Apa metode pengambilan sampel yang paling tepat untuk mengevaluasi kinerja classifier pada set data tertentu dan membandingkannya dengan classifier lain? Cross-validasi tampaknya menjadi praktik standar, tetapi saya telah membaca bahwa metode seperti .632 bootstrap adalah pilihan yang lebih baik. Sebagai tindak lanjut: Apakah pilihan metrik kinerja memengaruhi jawaban (jika saya …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.