Pertanyaan yang diberi tag «fitting»

Proses pencocokan beberapa model statistik ke set data tertentu. Sebagian besar dilakukan pada komputer, dan menggunakan metode numerik yang bervariasi seperti optimasi atau integrasi numerik, atau simulasi.

3
R: Random Forest melemparkan NaN / Inf dalam kesalahan "panggilan fungsi asing" meskipun tidak ada dataset NaN [ditutup]
Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 2 tahun yang lalu . Saya menggunakan tanda sisipan untuk menjalankan hutan acak lintas divalidasi atas dataset. Variabel Y adalah faktor. Tidak ada NaN, Inf, …

6
Sesuaikan istilah sinusoidal dengan data
Meskipun saya membaca posting ini , saya masih tidak tahu bagaimana menerapkan ini pada data saya sendiri dan berharap seseorang dapat membantu saya. Saya memiliki data berikut: y <- c(11.622967, 12.006081, 11.760928, 12.246830, 12.052126, 12.346154, 12.039262, 12.362163, 12.009269, 11.260743, 10.950483, 10.522091, 9.346292, 7.014578, 6.981853, 7.197708, 7.035624, 6.785289, 7.134426, 8.338514, 8.723832, …
26 r  regression  fitting 

1
Mendeteksi pencilan dalam data hitungan
Saya memiliki apa yang saya anggap naif sebagai masalah yang cukup lurus ke depan yang melibatkan deteksi outlier untuk banyak set data penghitungan yang berbeda. Secara khusus, saya ingin menentukan apakah satu atau lebih nilai dalam serangkaian data jumlah lebih tinggi atau lebih rendah dari yang diharapkan relatif terhadap sisa …

1
Ketika Jacobian analitik tersedia, apakah lebih baik untuk memperkirakan Hessian dengan , atau dengan perbedaan terbatas dari Jacobian?
Katakanlah saya menghitung beberapa parameter model, meminimalkan jumlah kuadrat residu, dan saya berasumsi kesalahan saya adalah Gaussian. Model saya menghasilkan turunan analitik, sehingga pengoptimal tidak perlu menggunakan perbedaan hingga. Setelah fit selesai, saya ingin menghitung kesalahan standar dari parameter yang dipasang. Secara umum, dalam situasi ini, Hessian dari fungsi kesalahan …

1
MLE vs kuadrat terkecil dalam distribusi probabilitas pas
Kesan yang saya dapat, berdasarkan beberapa makalah, buku, dan artikel yang saya baca, adalah cara yang disarankan untuk menyesuaikan distribusi probabilitas pada set data adalah dengan menggunakan estimasi kemungkinan maksimum (MLE). Namun, sebagai seorang fisikawan, cara yang lebih intuitif adalah dengan menyesuaikan pdf model dengan pdf empiris data menggunakan kuadrat …

2
Perbedaan antara analisis regresi dan pemasangan kurva
Adakah yang bisa menjelaskan kepada saya perbedaan nyata antara analisis regresi dan pemasangan kurva (linear dan nonlinier), dengan contoh jika mungkin? Tampaknya keduanya mencoba untuk menemukan hubungan antara dua variabel (dependen vs independen) dan kemudian menentukan parameter (atau koefisien) yang terkait dengan model yang diusulkan. Misalnya, jika saya memiliki satu …

3
Pas t-distribusi di R: parameter penskalaan
Bagaimana saya menyesuaikan parameter distribusi-t, yaitu parameter yang sesuai dengan 'rata-rata' dan 'standar deviasi' dari distribusi normal. Saya menganggap mereka disebut 'berarti' dan 'scaling / derajat kebebasan' untuk distribusi-t? Kode berikut sering menghasilkan kesalahan 'optimasi gagal'. library(MASS) fitdistr(x, "t") Apakah saya harus mengukur x terlebih dahulu atau mengubahnya menjadi probabilitas? …

4
Akurasi mesin peningkat gradien menurun karena jumlah iterasi meningkat
Saya bereksperimen dengan algoritma mesin peningkat gradien melalui caretpaket di R. Menggunakan dataset penerimaan perguruan tinggi kecil, saya menjalankan kode berikut: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

5
Mengapa regresi linier menggunakan fungsi biaya berdasarkan jarak vertikal antara hipotesis dan titik input data?
Katakanlah kita memiliki input (prediktor) dan output (respons) titik data A, B, C, D, E dan kami ingin menyesuaikan garis melalui titik-titik tersebut. Ini adalah masalah sederhana untuk menggambarkan pertanyaan, tetapi dapat diperluas ke dimensi yang lebih tinggi juga. Pernyataan masalah Paling cocok saat ini atau hipotesis diwakili oleh garis …

3
Bagaimana saya bisa secara terprogram mendeteksi segmen dari seri data agar sesuai dengan kurva yang berbeda?
Apakah ada algoritma yang didokumentasikan untuk memisahkan bagian-bagian dari dataset yang diberikan ke dalam kurva berbeda yang paling sesuai? Sebagai contoh, kebanyakan manusia yang melihat bagan data ini akan dengan mudah membaginya menjadi 3 bagian: segmen sinusoidal, segmen linier, dan segmen eksponensial terbalik. Sebenarnya, saya membuat ini dengan gelombang sinus, …




1
Mengapa rata-rata aritmatika lebih kecil dari rata-rata distribusi dalam distribusi log-normal?
Jadi, saya memiliki proses menghasilkan random log-terdistribusi normal variabel acak XXX . Berikut adalah fungsi kepadatan probabilitas yang sesuai: Saya ingin memperkirakan distribusi beberapa saat dari distribusi asli itu, katakanlah momen pertama: rata-rata aritmatika. Untuk melakukannya, saya menggambar 100 variabel acak 10.000 kali sehingga saya bisa menghitung 10.000 perkiraan rata-rata …

2
ARIMA vs ARMA pada seri berbeda
Dalam R (2.15.2) saya memasang sekali ARIMA (3,1,3) pada deret waktu dan sekali ARMA (3,3) pada deret waktu yang berbeda. Parameter yang dipasang berbeda, yang saya dikaitkan dengan metode pemasangan di ARIMA. Juga, pemasangan ARIMA (3,0,3) pada data yang sama dengan ARMA (3,3) tidak akan menghasilkan parameter yang identik, tidak …
13 r  time-series  arima  fitting  arma 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.