Pertanyaan yang diberi tag «regression-strategies»

Strategi Pemodelan Regresi


7
Apa manfaat memecah variabel prediktor kontinu?
Saya bertanya-tanya apa nilainya dalam mengambil variabel prediktor kontinu dan memecahnya (misalnya, menjadi kuintil), sebelum menggunakannya dalam model. Sepertinya saya bahwa dengan binning variabel kita kehilangan informasi. Apakah ini hanya agar kita dapat memodelkan efek non-linear? Jika kita menyimpan variabel kontinu dan itu bukan hubungan linear yang lurus, apakah kita …



1
Derajat kebebasan residual yang sesuai setelah menjatuhkan persyaratan dari suatu model
Saya merenungkan diskusi seputar pertanyaan ini dan khususnya komentar Frank Harrell bahwa estimasi untuk varians dalam model yang dikurangi (yaitu satu dari mana sejumlah variabel penjelas telah diuji dan ditolak) harus menggunakan Tingkat Kemerdekaan Umum Ye . Profesor Harrell menunjukkan ini akan jauh lebih dekat dengan derajat sisa kebebasan dari …

3
Mengevaluasi regresi logistik dan interpretasi Hosmer-Lemeshow Goodness of Fit
Seperti kita ketahui, ada 2 metode untuk mengevaluasi model regresi logistik dan mereka menguji hal-hal yang sangat berbeda Kekuatan prediksi: Dapatkan statistik yang mengukur seberapa baik Anda dapat memprediksi variabel dependen berdasarkan variabel independen. Pseudo R ^ 2 yang terkenal adalah McFadden (1974) dan Cox and Snell (1989). Statistik Good-of-fit …



2
Bayesian berpikir tentang overfitting
Saya telah mencurahkan banyak waktu untuk pengembangan metode dan perangkat lunak untuk memvalidasi model prediktif dalam domain statistik frequentist tradisional. Dalam menerapkan lebih banyak gagasan Bayes ke dalam praktik dan pengajaran, saya melihat beberapa perbedaan utama yang harus dianut. Pertama, pemodelan prediktif Bayesian meminta analis untuk berpikir keras tentang distribusi …

2
Apakah LASSO menderita masalah yang sama dengan regresi bertahap?
Metode pemilihan variabel algoritmik bertahap cenderung memilih model yang bias kurang lebih setiap perkiraan dalam model regresi ( s dan UK, nilai- p , statistik F , dll.), Dan hampir sama dengan mengecualikan prediktor sejati sebagai termasuk prediktor palsu menurut literatur simulasi yang cukup matang.ββ\beta Apakah LASSO menderita dengan cara …


3
Pembuatan model dan pemilihan menggunakan Hosmer et al. 2013. Regresi Logistik Terapan di R
Ini adalah posting pertama saya di StackExchange, tetapi saya telah menggunakannya sebagai sumber daya selama beberapa waktu, saya akan melakukan yang terbaik untuk menggunakan format yang sesuai dan melakukan pengeditan yang sesuai. Juga, ini adalah pertanyaan multi-bagian. Saya tidak yakin apakah saya harus membagi pertanyaan menjadi beberapa posting berbeda atau …

5
Dapatkah saya mengabaikan koefisien untuk level faktor yang tidak signifikan dalam model linier?
Setelah mencari klarifikasi tentang koefisien model linier di sini saya punya pertanyaan lanjutan tentang non-signfikan (nilai p tinggi) untuk koefisien tingkat faktor. Contoh: Jika model linier saya menyertakan faktor dengan 10 level, dan hanya 3 level tersebut yang memiliki nilai p signifikan yang terkait dengannya, ketika menggunakan model untuk memprediksi …


4
Variabel mana yang menjelaskan komponen PCA mana, dan sebaliknya?
Menggunakan data ini: head(USArrests) nrow(USArrests) Saya dapat melakukan PCA sebagai berikut: plot(USArrests) otherPCA <- princomp(USArrests) Saya bisa mendapatkan komponen baru otherPCA$scores dan proporsi varian dijelaskan oleh komponen dengan summary(otherPCA) Tetapi bagaimana jika saya ingin tahu variabel mana yang sebagian besar dijelaskan oleh komponen utama mana? Dan sebaliknya: apakah PC1 atau …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.