Pertanyaan yang diberi tag «resampling»

Resampling mengambil sampel dari sampel. Penggunaan umum adalah jackknifing (mengambil subsampel, misalnya semua nilai kecuali 1) & bootstrap (pengambilan sampel dengan penggantian). Teknik-teknik ini dapat memberikan perkiraan yang kuat dari distribusi sampling ketika akan sulit atau tidak mungkin untuk diturunkan secara analitis.


1
Apakah bootstrap cocok untuk data kontinu ini?
Saya seorang pemula lengkap :) Saya sedang melakukan penelitian dengan ukuran sampel 10.000 dari populasi sekitar 745.000. Setiap sampel mewakili "persentase kesamaan". Sebagian besar sampel adalah sekitar 97% -98% tetapi beberapa berada di antara 60% dan 90%, yaitu, distribusi sangat condong negatif. Sekitar 0,6% dari hasilnya adalah 0%, tetapi ini …

1
Metodologi bootstrap. Mengapa melakukan resample “dengan penggantian” alih-alih subsampling acak?
Metode bootstrap telah melihat difusi besar dalam beberapa tahun terakhir, saya juga banyak menggunakannya, terutama karena alasan di balik ini cukup intuitif. Tapi itu satu hal yang saya tidak mengerti. Mengapa Efron memilih untuk melakukan resample dengan penggantian alih-alih hanya subsampling dengan secara acak memasukkan atau tidak termasuk pengamatan tunggal? …

1
Koefisien dan batas kesalahan gini
Saya memiliki serangkaian waktu data dengan N = 14 jumlah pada setiap titik waktu, dan saya ingin menghitung koefisien Gini dan kesalahan standar untuk perkiraan ini pada setiap titik waktu. Karena saya hanya memiliki N = 14 hitungan pada setiap titik waktu saya melanjutkan dengan menghitung varians jackknife, yaitu dari …



2
Teks yang bagus untuk resampling?
Dapatkah kelompok merekomendasikan teks pengantar / sumber daya yang baik untuk teknik resampling terapan? Secara khusus, saya tertarik pada alternatif untuk tes parametrik klasik (misalnya tes t, ANOVA, ANCOVA) untuk membandingkan kelompok ketika asumsi seperti normalitas jelas-jelas dilanggar. Contoh jenis masalah yang saya ingin mendidik diri sendiri tentang cara yang …

1
Model pembelajaran dalam mana yang dapat mengklasifikasikan kategori yang tidak eksklusif satu sama lain
Contoh: Saya memiliki kalimat dalam deskripsi pekerjaan: "Java senior engineer in UK". Saya ingin menggunakan model pembelajaran yang mendalam untuk memperkirakannya sebagai 2 kategori: English dan IT jobs. Jika saya menggunakan model klasifikasi tradisional, hanya dapat memprediksi 1 label dengan softmaxfungsi di lapisan terakhir. Dengan demikian, saya dapat menggunakan 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Ukuran sampel bootstrap
Saya belajar tentang bootstrap sebagai cara memperkirakan varians statistik sampel. Saya punya satu keraguan mendasar. Mengutip dari http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Berapa banyak pengamatan yang harus kita sampel ulang? Saran yang baik adalah ukuran sampel asli. Bagaimana kita bisa membuat sampel sebanyak pengamatan seperti pada sampel asli? Jika saya memiliki ukuran …

1
Berlebihan dengan variabel kategori
Saya ingin melakukan kombinasi oversampling dan undersampling untuk menyeimbangkan dataset saya dengan sekitar 4000 pelanggan dibagi menjadi dua kelompok, di mana salah satu grup memiliki proporsi sekitar 15%. Saya telah melihat SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) dan ROSE ( http://cran.r-project.org/web/packages/ROSE/ ROSE.pdf ), tetapi keduanya membuat sampel sintetis baru menggunakan pengamatan yang …

1
Dapatkah bootstrap resampling digunakan untuk menghitung interval kepercayaan untuk varian suatu dataset?
Saya tahu bahwa jika Anda sampel ulang dari kumpulan data berkali-kali dan menghitung rata-rata setiap kali, berarti ini akan mengikuti distribusi normal (oleh CLT). Dengan demikian, Anda dapat menghitung interval kepercayaan pada rata-rata kumpulan data tanpa membuat asumsi pada distribusi probabilitas kumpulan data. Saya bertanya-tanya apakah Anda bisa melakukan sesuatu …


1
Jumlah permutasi yang diperlukan untuk nilai p berbasis permutasi
Jika saya perlu menghitung berbasis permutasi ppp-nilai dengan tingkat signifikansi αα\alpha, berapa banyak permutasi yang saya butuhkan? Dari artikel "Tes Permutasi untuk Mempelajari Kinerja Classifier" , halaman 5: Dalam praktiknya, batas atas 1/(2k−−√)1/(2k)1/(2\sqrt{k}) biasanya digunakan untuk menentukan jumlah sampel yang diperlukan untuk mencapai ketelitian tes yang diinginkan. ... dimana kkk …

1
Metode apa yang mensimulasikan pvalues ​​dari pengambilan sampel ulang dari data
Beberapa waktu yang lalu saya mengajukan pertanyaan tentang menghubungkan waktu antara prangko waktu dan menerima tanggapan dari Peter Ellis yang mengatakan saya bisa menghitung jarak rata-rata antara kode ... Ini sudah memberi Anda perasaan tentang perilaku mana yang dikelompokkan bersama, tetapi Anda juga harus memeriksa bahwa ini tidak masuk akal …

2
Subsampel sampel acak: sampel acak?
Katakanlah Anda memiliki sampel acak besar pemain sepak bola di Eropa tetapi Anda hanya tertarik pada apa yang terjadi di Spanyol. Bisakah Anda mengurangi sampel Anda menjadi pemain di Spanyol dan masih menyebutnya sampel acak (tetapi dari populasi yang berbeda)? Jika tidak, bagaimana Anda menyebut subsampel itu dan tindakan pencegahan …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.