Pertanyaan yang diberi tag «regression»

Teknik untuk menganalisis hubungan antara satu (atau lebih) variabel "tergantung" dan variabel "independen".

1
Bagaimana tepatnya jumlah (atau rata-rata) batasan keterpusatan untuk splines (juga wrt gam dari mgcv) dilakukan?
Proses menghasilkan data adalah:y=sin(x+I(d=0))+sin(x+4∗I(d=1))+I(d=0)z2+3I(d=1)z2+N(0,1)y=sin(x+I(d=0))+sin(x+4∗I(d=1))+I(d=0)z2+3I(d=1)z2+N(0,1)y = \text{sin}\Big(x+I(d=0)\Big) + \text{sin}\Big(x+4*I(d=1)\Big) + I(d=0)z^2 + 3I(d=1)z^2 + \mathbb{N}\left(0,1\right) Misalkan menjadi urutan dari ke dengan panjang dan menjadi faktor yang sesuai . Ambil semua kemungkinan kombinasi untuk menghitung : x,zx,zx,z−4−4-4444100100100dddd∈{0,1}d∈{0,1}d\in\{0,1\}x,z,dx,z,dx,z,dyyy Menggunakan B-spline-Basis (tidak terpusat) untuk untuk setiap tingkat tidak akan layak oleh properti-of-unity-properti (baris jumlah …

2
Regresi Logistik Ordinal dengan Fungsi Tautan yang Berbeda
Pertimbangkan variabel hasil yang memiliki empat kategori terurut yang jelas untuknya. Ini tampaknya seperti penggunaan regresi logistik ordinal yang baik untuk memperkirakan Odds Ratios untuk efek kovariat pada memindahkan subjek satu "langkah" menaiki tangga. Namun subjeknya tersebar merata di seluruh kategori, sehingga muncul pertanyaan: Apakah "asumsi hasil yang langka" untuk …

1
Komputasi bobot probabilitas terbalik - estimasi kepadatan bersyarat (multivarian)?
Versi umum: Saya perlu memperkirakan f(A|X)f(A|X)f(A | X) dimana AAA dan XXXkontinu dan multivarian. Saya lebih suka melakukannya secara nonparametrik karena saya tidak memiliki bentuk fungsional yang baik dalam pikiran danf^(A|X)f^(A|X)\hat{f}(A | X)perlu sesuatu seperti tidak bias. Saya ingin menggunakan penduga kepadatan kernel bersyarat, tetapi saya sadar saya perlu mengukurXXXpertama. …

1
Menafsirkan plot residual binned dalam regresi logistik
Saya melakukan regresi logistik dengan variabel independen dan pengamatan. Saya mengevaluasi kecocokan model untuk menentukan apakah data memenuhi asumsi model dan telah menghasilkan plot sisa binned berikut menggunakan paket:242424123 , 996123,996123,996arm R Jelas ada beberapa tanda-tanda buruk dalam plot ini: banyak poin berada di luar band kepercayaan dan ada pola …

1
Mensimulasikan data regresi dengan variabel dependen didistribusikan secara tidak normal
Untuk analisis regresi, seringkali berguna untuk mengetahui proses pembuatan data untuk memeriksa bagaimana metode yang digunakan bekerja. Meskipun cukup sederhana untuk melakukan ini untuk regresi linier sederhana, ini bukan kasus ketika variabel dependen harus mengikuti distribusi tertentu. Pertimbangkan regresi linier sederhana: N <- 100 x <- rnorm(N) beta <- 3 …

4
Memilih model regresi
Bagaimana seseorang dapat secara objektif (membaca "algoritmik") memilih model yang tepat untuk melakukan regresi linear kuadrat-sederhana dengan dua variabel? Sebagai contoh, katakanlah data tampaknya menunjukkan tren kuadratik, dan parabola dihasilkan yang cocok dengan data dengan cukup baik. Bagaimana kita membenarkan membuat regresi ini? Atau bagaimana kita menghilangkan kemungkinan ada model …

1
Model keadaan tersembunyi vs model tanpa negara untuk regresi deret waktu
Ini adalah pertanyaan yang cukup umum: anggap saya ingin membangun model untuk memprediksi pengamatan berikutnya berdasarkan sebelumnya NNN pengamatan (NNNdapat menjadi parameter untuk mengoptimalkan secara eksperimental). Jadi pada dasarnya kami memiliki jendela geser fitur input untuk memprediksi pengamatan selanjutnya. Saya dapat menggunakan pendekatan Model Hidden Markov, yaitu Baum-Welch untuk memperkirakan …

2
Regresi linier pada sampel yang mencakup banyak urutan besarnya
Hukum bir dari kimia mengatakan bahwa absorbansi cairan AAA sebanding dengan konsentrasi CCCjadi: A=kCA=kCA = kC Hal standar yang harus dilakukan kemudian adalah menyiapkan serangkaian solusi dengan konsentrasi yang diketahui, mengukur absorbansi untuk membentuk 'kurva standar' (kurva kalibrasi pada dasarnya), dan melakukan regresi linier sederhana pada data tersebut untuk mendapatkan …

2
Mengapa model statistik cocok jika diberi set data yang sangat besar?
Proyek saya saat ini mungkin mengharuskan saya untuk membuat model untuk memprediksi perilaku sekelompok orang tertentu. set data pelatihan hanya berisi 6 variabel (id hanya untuk tujuan identifikasi): id, age, income, gender, job category, monthly spend di mana monthly spendadalah variabel respon. Tetapi dataset pelatihan berisi sekitar 3 juta baris, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 


1
Regresi monotonik yang kuat dalam R
Saya memiliki tabel berikut ini di R df <- structure(list(x = structure(c(12458, 12633, 12692, 12830, 13369, 13455, 13458, 13515), class = "Date"), y = c(6080, 6949, 7076, 7818, 0, 0, 10765, 11153)), .Names = c("x", "y"), row.names = c("1", "2", "3", "4", "5", "6", "8", "9"), class = "data.frame") > …

1
Lasso pada Model Regresi Binomial Negatif
Apakah ada yang bisa saya lakukan LASSO dengan Regresi Binomial Negatif pada R? Saya melakukan regresi binomial negatif pada dataset saya karena data terlalu tersebar untuk memaksakan regresi poisson. Sementara itu, saya juga menghadapi beberapa masalah multikolinieritas. Saya sudah mencoba menggunakan glmnetdengan family = poisson, namun data tersebut tidak pas …

1
Bagaimana dan mengapa MLP untuk klasifikasi berbeda dari MLP untuk regresi? Backpropagation dan fungsi transfer yang berbeda?
Saya menggunakan dua 3-layer feedforward multi-layer perceptrons (MLPs). Dengan data input yang sama (14 neuron input), saya melakukan satu klasifikasi (benar / salah), dan satu regresi (jika benar, "berapa banyak") ¹. Sampai sekarang, saya sudah malas menggunakan Matlabs patternnet dan fitnet , masing-masing. Lazily, karena saya belum meluangkan waktu untuk …

2
Penyebab singularitas dalam matriks untuk regresi kuantil
Saya melakukan regresi kuantil dalam R menggunakan paket quantreg. Dataset saya mencakup 12.328 pengamatan mulai dari 0,12 hingga 330. Titik waktu untuk data saya tidak sepenuhnya berkelanjutan; semua data masuk ke dalam satu dari beberapa lusin tempat sampah mulai dari 73 hingga 397. Ketika saya melakukan regresi linier pada data …
8 r  regression 

1
Deviance vs Pearson, demi kebaikan
Saya mencoba untuk membuat model dengan menggunakan regresi binomial negatif (GLM binomial negatif). Saya memiliki ukuran sampel yang relatif kecil (lebih dari 300), dan data tidak diskalakan. Saya perhatikan bahwa ada dua cara untuk mengukur good of fit - satu penyimpangan dan yang lainnya adalah statistik Pearson. Bagaimana saya bisa …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.