Pertanyaan yang diberi tag «r»

Gunakan tag ini untuk setiap * pada topik * pertanyaan yang (a) melibatkan `R` baik sebagai bagian penting dari pertanyaan atau jawaban yang diharapkan, & (b) bukan * hanya * tentang cara menggunakan` R`.



3
Pas t-distribusi di R: parameter penskalaan
Bagaimana saya menyesuaikan parameter distribusi-t, yaitu parameter yang sesuai dengan 'rata-rata' dan 'standar deviasi' dari distribusi normal. Saya menganggap mereka disebut 'berarti' dan 'scaling / derajat kebebasan' untuk distribusi-t? Kode berikut sering menghasilkan kesalahan 'optimasi gagal'. library(MASS) fitdistr(x, "t") Apakah saya harus mengukur x terlebih dahulu atau mengubahnya menjadi probabilitas? …

5
Bagaimana menentukan distribusi lognormal dalam argumen keluarga GLM di R?
Pertanyaan sederhana: Bagaimana cara menentukan distribusi lognormal dalam argumen keluarga GLM di R? Saya tidak dapat menemukan bagaimana ini dapat dicapai. Mengapa lognormal (atau eksponensial) bukan opsi dalam argumen keluarga? Di suatu tempat di R-Archives saya membaca bahwa seseorang hanya harus menggunakan log-link untuk keluarga yang diatur ke gaussian di …

3
Pas multivariat, spline kubik alami
catatan: tanpa jawaban yang benar setelah sebulan, saya telah memposting ulang ke SO Latar Belakang Saya punya model, fff , di mana Y=f(X)Y=f(X)Y=f(\textbf{X}) XX\textbf{X} adalahmatriksn×mn×mn \times m sampel dariparametermmm danYYY adalahvektorn×1n×1n \times 1 dari output model. fff adalah komputasi yang intensif, jadi saya ingin memperkirakanfff menggunakan spline kubik multivariat melalui(X,Y)(X,Y)(X,Y) …

2
Menghitung persentil ke-95: Membandingkan distribusi normal, R Quantile, dan pendekatan Excel
Saya mencoba menghitung persentil ke-95 pada dataset berikut. Saya menemukan beberapa referensi online untuk melakukannya. Pendekatan 1: Berdasarkan data sampel Yang pertama memberitahu saya untuk mendapatkan TOP 95 Percentdataset dan kemudian memilih MINatau AVGdari set yang dihasilkan. Melakukannya untuk dataset berikut memberi saya: AVG: 29162 MIN: 0 Pendekatan 2: Asumsikan …
17 r  dataset  quantiles  sql 

5
Untuk klasifikasi dengan Random Forests di R, bagaimana seharusnya seseorang menyesuaikan ukuran kelas yang tidak seimbang?
Saya mengeksplorasi berbagai metode klasifikasi untuk proyek yang sedang saya kerjakan, dan saya tertarik untuk mencoba Hutan Acak. Saya mencoba mendidik diri sendiri seiring berjalannya waktu, dan akan menghargai setiap bantuan yang diberikan oleh komunitas CV. Saya telah membagi data saya ke dalam set pelatihan / tes. Dari percobaan dengan …

2
Apakah masuk akal untuk menggunakan variabel tanggal dalam regresi?
Saya tidak terbiasa menggunakan variabel dalam format tanggal dalam R. Saya hanya ingin tahu apakah mungkin untuk menambahkan variabel tanggal sebagai variabel penjelas dalam model regresi linier. Jika memungkinkan, bagaimana kita bisa menafsirkan koefisien? Apakah itu efek satu hari pada variabel hasil? Lihat intisari saya dengan contoh apa yang saya …

2
Memahami uji Kolmogorov-Smirnov dalam R
Saya mencoba untuk memahami output dari fungsi tes Kolmogorov-Smirnov (dua sampel, dua sisi). Ini tes sederhana. x <- c(1,2,2,3,3,3,3,4,5,6) y <- c(2,3,4,5,5,6,6,6,6,7) z <- c(12,13,14,15,15,16,16,16,16,17) ks.test(x,y) # Two-sample Kolmogorov-Smirnov test # #data: x and y #D = 0.5, p-value = 0.1641 #alternative hypothesis: two-sided # #Warning message: #In ks.test(x, y) …

1
Cara menemukan / memperkirakan fungsi kerapatan peluang dari fungsi kerapatan dalam R
Misalkan saya punya variabel suka Xdengan distribusi tidak dikenal. Dalam Mathematica, dengan menggunakan SmoothKernelDensityfungsi kita dapat memiliki fungsi kerapatan yang diperkirakan. Perkiraan fungsi kerapatan ini dapat digunakan bersama dengan PDFfungsi untuk menghitung probabilitas fungsi kerapatan dari suatu nilai seperti Xdalam bentuk PDF[density,X]asumsi bahwa "kerapatan" adalah hasil dari SmoothKernelDensity. Akan lebih …
17 r  pdf  cdf 

2
Apa yang terjadi di sini, ketika saya menggunakan kuadrat kerugian dalam pengaturan regresi logistik?
Saya mencoba menggunakan kuadrat kerugian untuk melakukan klasifikasi biner pada kumpulan data mainan. Saya menggunakan mtcarskumpulan data, menggunakan mil per galon dan berat untuk memprediksi jenis transmisi. Plot di bawah ini menunjukkan dua jenis data tipe transmisi dalam warna berbeda, dan batas keputusan dihasilkan oleh fungsi kerugian yang berbeda. Kerugian …


2
Perbedaan kesalahan standar residual antara optim dan glm
Saya mencoba mereproduksi dengan optimhasil dari regresi linier sederhana yang dilengkapi dengan glmatau bahkan nlsfungsi R. Perkiraan parameter adalah sama tetapi estimasi varians residual dan kesalahan standar dari parameter lain tidak sama terutama ketika ukuran sampel rendah. Saya kira ini disebabkan oleh perbedaan dalam cara kesalahan standar residual dihitung antara …


2
Mengapa log-mentransformasikan data sebelum melakukan analisis komponen utama?
Saya mengikuti tutorial di sini: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/ untuk mendapatkan pemahaman yang lebih baik tentang PCA. Tutorial menggunakan dataset Iris dan menerapkan transformasi log sebelum ke PCA: Perhatikan bahwa dalam kode berikut ini kami menerapkan transformasi log ke variabel kontinu seperti yang disarankan oleh [1] dan mengatur centerdan scalesama dengan TRUEdalam panggilan …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.