Pertanyaan yang diberi tag «r»

Gunakan tag ini untuk setiap * pada topik * pertanyaan yang (a) melibatkan `R` baik sebagai bagian penting dari pertanyaan atau jawaban yang diharapkan, & (b) bukan * hanya * tentang cara menggunakan` R`.


4
Cara mengambil banyak sampel 10 dari daftar besar, tanpa penggantian keseluruhan
Saya punya satu set besar data (20.000 titik data), dari mana saya ingin mengambil sampel berulang 10 titik data. Namun, setelah saya mengambil 10 poin data itu, saya ingin mereka tidak dipilih lagi. Saya sudah mencoba menggunakan samplefungsi ini, tetapi sepertinya tidak memiliki opsi untuk mengambil sampel tanpa penggantian lebih …
12 r  sample 

2
Teori di balik argumen bobot dalam R saat menggunakan lm ()
Setelah satu tahun di sekolah pascasarjana, pemahaman saya tentang "kuadrat terkecil tertimbang" adalah sebagai berikut: biarkan y∈Rny∈Rn\mathbf{y} \in \mathbb{R}^n , XX\mathbf{X} menjadi beberapa matriks desain n×pn×pn \times p , menjadi parameter vektor, \ boldsymbol \ epsilon \ in \ mathbb {R} ^ n menjadi vektor kesalahan sedemikian rupa sehingga \ …

3
Regresi hutan acak tidak memprediksi lebih tinggi dari data pelatihan
Saya perhatikan ketika membangun model regresi hutan acak, setidaknya dalam R, nilai prediksi tidak pernah melebihi nilai maksimum dari variabel target yang terlihat dalam data pelatihan. Sebagai contoh, lihat kode di bawah ini. Saya sedang membangun model regresi untuk memprediksi mpgberdasarkan mtcarsdata. Saya membuat OLS dan model hutan acak, dan …
12 r  random-forest 

3
Sumber daya untuk analisis deret waktu Terganggu dalam R
Saya cukup baru di R. Saya telah mencoba membaca tentang analisis deret waktu dan telah selesai Analisis seri Waktu Shumway dan Stoffer dan penerapannya Edisi ke-3 , Peramalan Hyndman yang sangat baik : prinsip dan praktik Avril Coghlan's Menggunakan R untuk Time Series Analysis A. Ian McLeod dkk. Analisis Rangkaian …
12 r  time-series 

2
Mengoptimalkan Mesin Vektor Dukungan dengan Pemrograman Quadratic
Saya mencoba memahami proses pelatihan mesin vektor dukungan linear . Saya menyadari bahwa properti SMV memungkinkan mereka dioptimalkan lebih cepat daripada dengan menggunakan pemecah pemrograman kuadratik, tetapi untuk tujuan pembelajaran saya ingin melihat bagaimana ini bekerja. Data pelatihan set.seed(2015) df <- data.frame(X1=c(rnorm(5), rnorm(5)+5), X2=c(rnorm(5), rnorm(5)+3), Y=c(rep(1,5), rep(-1, 5))) df X1 …
12 r  svm  optimization 

2
Menafsirkan model regresi logistik dengan beberapa prediktor
Saya melakukan regresi logistik multivariat dengan variabel dependen Yadalah kematian di panti jompo dalam periode masuk tertentu dan mendapatkan hasil berikut (perhatikan jika variabel yang dimulai di Adalamnya adalah nilai yang berkelanjutan sedangkan yang mulai dalam Bkategori): Call: glm(Y ~ A1 + B2 + B3 + B4 + B5 + …
12 r  regression  logistic 

1
Apa itu "nilai awal" dalam fungsi glm ()?
Parameter apa start, etastart, mustartdi GLM () function ? Saya telah mencari di dokumen dan internet tetapi saya belum menemukan penjelasan yang jelas apa artinya ini. Ini menyerupai "nilai awal" bayesian untuk rantai, tapi saya ragu ini terkait, karena fungsi glm () dalam R adalah statistik frequentist ...

1
Menemukan nilai yang dipasang dan diprediksi untuk model statistik
Katakanlah saya memiliki data berikut dan saya menjalankan model regresi: df=data.frame(income=c(5,3,47,8,6,5), won=c(0,0,1,1,1,0), age=c(18,18,23,50,19,39), home=c(0,0,1,0,0,1)) Di satu sisi, saya menjalankan model linier untuk memprediksi pendapatan: md1 = lm(income ~ age + home + home, data=df) Kedua, saya menjalankan model logit untuk memprediksi variabel yang dimenangkan: md2 = glm(factor(won) ~ age + …
12 r 

6
Menafsirkan hasil ur.df (Dickey-Fuller unit root test) R
Saya menjalankan tes root unit berikut (Dickey-Fuller) pada serangkaian waktu menggunakan ur.df()fungsi dalam urcapaket. Perintahnya adalah: summary(ur.df(d.Aus, type = "drift", 6)) Outputnya adalah: ############################################### # Augmented Dickey-Fuller Test Unit Root Test # ############################################### Test regression drift Call: lm(formula = z.diff ~ z.lag.1 + 1 + z.diff.lag) Residuals: Min 1Q Median …


1
Apa perbedaan antara AIC () dan extractAIC () dalam R?
Dokumentasi R untuk keduanya tidak menjelaskan banyak hal. Semua yang bisa saya dapatkan dari tautan ini adalah bahwa menggunakan salah satu dari keduanya harus baik-baik saja. Yang tidak saya dapatkan adalah mengapa mereka tidak sama. Fakta: Fungsi regresi bertahap di R, step()menggunakan extractAIC(). Menariknya, menjalankan lm()model dan model glm()'null' (hanya …


1
RandomForest dan bobot kelas
Pertanyaan dalam satu kalimat: Apakah ada yang tahu cara menentukan bobot kelas yang baik untuk hutan acak? Penjelasan: Saya bermain-main dengan dataset yang tidak seimbang. Saya ingin menggunakan Rpaket randomForestuntuk melatih model pada dataset yang sangat miring dengan hanya sedikit contoh positif dan banyak contoh negatif. Saya tahu, ada metode …
11 r  random-forest 

1
Metode lonjakan dan lempengan Bayesian versus hukuman
Saya membaca slide Steven Scott tentang paket BSTS R (Anda dapat menemukannya di sini: slide ). Pada titik tertentu, ketika berbicara tentang memasukkan banyak regressor dalam model deret waktu struktural ia memperkenalkan spike dan slab prior dari koefisien regresi dan mengatakan bahwa mereka lebih baik dibandingkan dengan metode hukuman. Scott …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.