Pertanyaan yang diberi tag «r»

Gunakan tag ini untuk setiap * pada topik * pertanyaan yang (a) melibatkan `R` baik sebagai bagian penting dari pertanyaan atau jawaban yang diharapkan, & (b) bukan * hanya * tentang cara menggunakan` R`.

5
Paket Pilihan Fitur dalam R, yang melakukan regresi dan klasifikasi
Terkunci . Pertanyaan ini dan jawabannya dikunci karena pertanyaannya di luar topik tetapi memiliki signifikansi historis. Saat ini tidak menerima jawaban atau interaksi baru. Saya sangat baru di R. Saya belajar pembelajaran mesin sekarang. Maaf, jika pertanyaan ini tampaknya sangat mendasar. Saya mencoba menemukan paket pemilihan fitur yang bagus di …




1
Deseasonalisasi data hitungan
Saya menggunakan stl () di R untuk menguraikan data hitungan menjadi komponen tren, musiman & tidak teratur. Nilai tren yang dihasilkan bukan bilangan bulat lagi. Saya punya pertanyaan berikut: Apakah stl () cara yang tepat untuk menasionalisasi data hitungan? Karena tren yang dihasilkan tidak lagi dinilai interger, dapatkah saya menggunakan …


1
Regresi linier dengan tindakan berulang di R
Saya tidak dapat menemukan cara melakukan regresi linier dalam R dalam untuk desain ukuran berulang. Dalam pertanyaan sebelumnya (masih belum dijawab) disarankan kepada saya untuk tidak menggunakan lmmelainkan menggunakan model campuran. Saya menggunakan lmcara berikut: lm.velocity_vs_Velocity_response <- lm(Velocity_response~Velocity*Subject, data=mydata) (detail lebih lanjut tentang dataset dapat ditemukan di tautan di atas) …

3
STL pada deret waktu dengan nilai yang hilang untuk deteksi anomali
Saya mencoba mendeteksi nilai-nilai anomali dalam serangkaian waktu data iklim dengan beberapa pengamatan yang hilang. Mencari di web saya menemukan banyak pendekatan yang tersedia. Dari semua itu, dekomposisi pertama tampaknya menarik, dalam arti menghilangkan tren dan komponen musiman dan mempelajari sisanya. Membaca STL: Prosedur Dekomposisi Tren Musiman Berdasarkan Loess , …

1
Mengapa dekomposisi eigen dan svd dari matriks kovarians didasarkan pada data yang jarang menghasilkan hasil yang berbeda?
Saya mencoba untuk menguraikan matriks kovarians berdasarkan pada set data yang jarang / gappy. Saya memperhatikan bahwa jumlah lambda (dijelaskan varians), sebagaimana dihitung dengan svd, sedang diperkuat dengan data yang semakin gappy. Tanpa celah, svddan eigenhasil yang sama. Ini sepertinya tidak terjadi dengan eigendekomposisi. Saya telah condong ke arah penggunaan …
12 r  svd  eigenvalues 

2
randomForest memilih regresi daripada klasifikasi
Saya menggunakan paket randomForest dalam R dan menggunakan data iris, hutan acak yang dihasilkan adalah klasifikasi tetapi ketika saya menggunakan dataset dengan sekitar 700 fitur (fitur-fiturnya adalah masing-masing piksel dalam gambar 28x28 piksel) dan kolom label dinamai label, yang randomForestdihasilkan adalah regresi. Saya menggunakan baris berikut: rf <- randomForest(label ~ …
12 r  random-forest 

4
Perbedaan deret waktu sebelum Arima atau di dalam Arima
Apakah lebih baik untuk membedakan rangkaian (dengan asumsi perlu) sebelum menggunakan Arima ATAU lebih baik menggunakan parameter d dalam Arima? Saya terkejut betapa berbedanya nilai-nilai yang dipasang tergantung pada rute mana yang diambil dengan model dan data yang sama. Atau apakah saya melakukan sesuatu yang salah? install.packages("forecast") library(forecast) wineindT<-window(wineind, start=c(1987,1), …
12 r  time-series  arima 

1
Grafik Kurva Probabilitas untuk Model Logit Dengan Banyak Prediktor
Saya memiliki fungsi probabilitas berikut: Prob=11+e−zProb=11+e−z\text{Prob} = \frac{1}{1 + e^{-z}} dimana z=B0+B1X1+⋯+BnXn.z=B0+B1X1+⋯+BnXn.z = B_0 + B_1X_1 + \dots + B_nX_n. Model saya terlihat seperti Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)])Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(bid)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid})]\right)} Ini divisualisasikan melalui kurva probabilitas yang terlihat seperti yang di bawah ini. Saya sedang mempertimbangkan menambahkan beberapa variabel ke …

1
Bagaimana saya bisa mengoptimalkan efisiensi komputasi ketika memasang model yang kompleks ke kumpulan data besar berulang kali?
Saya mengalami masalah kinerja menggunakan MCMCglmmpaket di R untuk menjalankan model efek campuran. Kode ini terlihat seperti ini: MC1<-MCMCglmm(bull~1,random=~school,data=dt,family="categorical" , prior=list(R=list(V=1,fix=1), G=list(G1=list(V=1, nu=0))) , slice=T, nitt=iter, ,burnin=burn, verbose=F) Ada sekitar 20.000 pengamatan dalam data dan mereka terkelompok di sekitar 200 sekolah. Saya telah membuang semua variabel yang tidak digunakan dari …

2
Bagaimana cara mensimulasikan data fungsional?
Saya mencoba menguji berbagai pendekatan analisis data fungsional. Idealnya, saya ingin menguji panel pendekatan yang saya miliki pada data fungsional yang disimulasikan. Saya sudah mencoba untuk menghasilkan FD simulasi menggunakan pendekatan berdasarkan pada penjumlahan Gaussian noise (kode di bawah), tetapi kurva yang dihasilkan terlihat terlalu kasar dibandingkan dengan yang asli …

2
Secara otomatis menentukan distribusi probabilitas yang diberikan satu set data
Diberikan dataset: x <- c(4.9958942,5.9730174,9.8642732,11.5609671,10.1178216,6.6279774,9.2441754,9.9419299,13.4710469,6.0601435,8.2095239,7.9456672,12.7039825,7.4197810,9.5928275,8.2267352,2.8314614,11.5653497,6.0828073,11.3926117,10.5403929,14.9751607,11.7647580,8.2867261,10.0291522,7.7132033,6.3337642,14.6066222,11.3436587,11.2717791,10.8818323,8.0320657,6.7354041,9.1871676,13.4381778,7.4353197,8.9210043,10.2010750,11.9442048,11.0081195,4.3369520,13.2562675,15.9945674,8.7528248,14.4948086,14.3577443,6.7438382,9.1434984,15.4599419,13.1424011,7.0481925,7.4823108,10.5743730,6.4166006,11.8225244,8.9388744,10.3698150,10.3965596,13.5226492,16.0069239,6.1139247,11.0838351,9.1659242,7.9896031,10.7282936,14.2666492,13.6478802,10.6248561,15.3834373,11.5096033,14.5806570,10.7648690,5.3407430,7.7535042,7.1942866,9.8867927,12.7413156,10.8127809,8.1726772,8.3965665) .. Saya ingin menentukan distribusi probabilitas yang paling pas (gamma, beta, normal, eksponensial, poisson, chi-square, dll) dengan estimasi parameter. Saya sudah mengetahui pertanyaan pada tautan berikut, di mana solusi disediakan menggunakan R: /programming/2661402/given-a-set-of-random-number-drawn-from-a- continuous-univariate-distribution-f solusi terbaik yang diusulkan adalah sebagai berikut: > library(MASS) > fitdistr(x, …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.