Pertanyaan yang diberi tag «continuous-data»

Variabel acak disebut kontinu jika himpunan nilai yang mungkin tidak terhitung, dan kemungkinan dibutuhkan nilai tertentu adalah nol ( untuk setiap bilangan real ). Variabel acak adalah kontinu jika dan hanya jika fungsi distribusi probabilitas kumulatifnya adalah fungsi kontinu. XP(X=x)=0x

6
Korelasi dengan variabel kategori tidak teratur
Saya memiliki dataframe dengan banyak pengamatan dan banyak variabel. Beberapa dari mereka adalah kategoris (tidak teratur) dan yang lainnya numerik. Saya mencari hubungan antara variabel-variabel ini. Saya sudah bisa menghitung korelasi untuk variabel numerik (korelasi Spearman) tetapi: Saya tidak tahu bagaimana mengukur korelasi antara variabel kategori tidak teratur. Saya tidak …

7
Apa manfaat memecah variabel prediktor kontinu?
Saya bertanya-tanya apa nilainya dalam mengambil variabel prediktor kontinu dan memecahnya (misalnya, menjadi kuintil), sebelum menggunakannya dalam model. Sepertinya saya bahwa dengan binning variabel kita kehilangan informasi. Apakah ini hanya agar kita dapat memodelkan efek non-linear? Jika kita menyimpan variabel kontinu dan itu bukan hubungan linear yang lurus, apakah kita …

3
Contoh: regresi LASSO menggunakan glmnet untuk hasil biner
Saya mulai mencoba-coba penggunaan glmnetdengan LASSO Regression di mana hasil yang saya minati menjadi dikotomis. Saya telah membuat bingkai data mock kecil di bawah ini: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, …
78 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 



8
Apakah masuk akal untuk memperlakukan data kategorikal sebagai berkelanjutan?
Dalam menjawab pertanyaan ini pada data diskrit dan kontinu, saya dengan tegas menyatakan bahwa jarang masuk akal untuk memperlakukan data kategorikal sebagai kontinu. Di muka itu yang tampak jelas, tetapi intuisi sering menjadi panduan yang buruk untuk statistik, atau setidaknya milikku. Jadi sekarang saya bertanya-tanya: apakah itu benar? Atau adakah …


4
Memprediksi dengan fitur berkelanjutan dan kategorikal
Beberapa teknik pemodelan prediktif lebih dirancang untuk menangani prediktor berkelanjutan, sementara yang lain lebih baik untuk menangani variabel kategorikal atau diskrit. Tentu saja ada teknik untuk mengubah satu jenis ke yang lain (diskritisasi, variabel dummy, dll.). Namun, apakah ada teknik pemodelan prediktif yang dirancang untuk menangani kedua jenis input pada …

2
Generalisasi berkelanjutan dari distribusi binomial negatif
Distribusi binomial negatif (NB) didefinisikan pada bilangan bulat non-negatif dan memiliki fungsi massa probabilitas f(k;r,p)=(k+r−1k)pk(1−p)r.f(k;r,p)=(k+r−1k)pk(1−p)r.f(k;r,p)={\binom {k+r-1}{k}}p^{k}(1-p)^{r}.Apakah masuk akal untuk mempertimbangkan distribusi kontinu pada real non-negatif yang didefinisikan oleh rumus yang sama (mengganti k∈N0k∈N0k\in \mathbb N_0 oleh x∈R≥0x∈R≥0x\in\mathbb R_{\ge 0} )? Koefisien binomial dapat ditulis ulang sebagai produk dari (k+1)⋅…⋅(k+r−1)(k+1)⋅…⋅(k+r−1)(k+1)\cdot\ldots\cdot(k+r-1) , …

2
Kapan kita harus discretize / bin variabel independen terus menerus / fitur dan kapan tidak?
Kapan kita harus discretize / bin variabel independen / fitur dan kapan tidak? Upaya saya untuk menjawab pertanyaan: Secara umum, kita tidak boleh bin, karena binning akan kehilangan informasi. Binning sebenarnya meningkatkan derajat kebebasan model, jadi, dimungkinkan untuk menyebabkan over-fitting setelah binning. Jika kita memiliki model "bias tinggi", binning mungkin …





1
Bagaimana cara menilai korelasi antara variabel ordinal dan variabel kontinu dengan benar?
Saya ingin memperkirakan korelasi antara: Variabel ordinal: subjek diminta untuk menilai preferensi mereka untuk 6 jenis buah pada skala 1-5 (mulai dari yang sangat menjijikkan hingga sangat lezat). Rata-rata subjek hanya menggunakan 3 poin skala. Variabel kontinu: subjek yang sama diminta untuk dengan cepat mengidentifikasi buah-buahan ini, yang menghasilkan akurasi …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.