Pertanyaan yang diberi tag «kernel-smoothing»

Teknik pemulusan kernel, seperti estimasi kepadatan kernel (KDE) dan regresi kernel Nadaraya-Watson, memperkirakan fungsi dengan interpolasi lokal dari titik data. Jangan bingung dengan [trik-kernel], untuk kernel yang digunakan misalnya dalam SVM.


4
Metode yang baik untuk plot kerapatan variabel non-negatif dalam R?
plot(density(rexp(100)) Jelas semua kepadatan di sebelah kiri nol merupakan bias. Saya ingin meringkas beberapa data untuk non-statistik, dan saya ingin menghindari pertanyaan tentang mengapa data non-negatif memiliki kepadatan di sebelah kiri nol. Plot-plot tersebut untuk pengecekan pengacakan; Saya ingin menunjukkan distribusi variabel berdasarkan kelompok perlakuan dan kontrol. Distribusi seringkali eksponensial-ish. …

2
Memilih bandwidth untuk penduga kepadatan kernel
Untuk penduga kepadatan kernel (KDE) univariat, saya menggunakan aturan Silverman untuk menghitung :hhh 0.9min(sd,IQR/1.34)×n−0.20.9min(sd,IQR/1.34)×n−0.2\begin{equation} 0.9 \min(sd, IQR/1.34)\times n^{-0.2} \end{equation} Apa aturan standar untuk KDE multivarian (dengan asumsi kernel Normal).

1
"Estimasi kepadatan kernel" adalah konvolusi dari apa?
Saya mencoba untuk mendapatkan pemahaman yang lebih baik tentang estimasi kepadatan kernel. Menggunakan definisi dari Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition fh^(x)=1n∑ni=1Kh(x−xi)=1nh∑ni=1K(x−xih)fh^(x)=1n∑i=1nKh(x−xi)=1nh∑i=1nK(x−xih) \hat{f_h}(x) = \frac{1}{n}\sum_{i=1}^n K_h (x - x_i) \quad = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big) Mari kita ambil K()K()K() menjadi fungsi persegi panjang yang memberikan 111 jika xxx adalah antara −0.5−0.5-0.5 dan 0.50.50.5 dan 000 …

2
Bisakah Anda menjelaskan estimasi kepadatan jendela Parzen (kernel) dalam istilah awam?
Estimasi kepadatan jendela parzen dijelaskan sebagai p(x)=1n∑i=1n1h2ϕ(xi−xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) di mana adalah sejumlah elemen dalam vektor, x adalah vektor, p ( x ) adalah kerapatan probabilitas x , hnnnxxxp(x)p(x)p(x)xxxhhh adalah dimensi Jendela Parzen, dan adalah fungsi jendela.ϕϕ\phi Pertanyaan saya adalah: Apa perbedaan mendasar antara Fungsi …

4
Bagaimana cara memproyeksikan vektor baru ke ruang PCA?
Setelah melakukan analisis komponen utama (PCA), saya ingin memproyeksikan vektor baru ke ruang PCA (yaitu menemukan koordinatnya dalam sistem koordinat PCA). Saya telah menghitung PCA dalam bahasa R menggunakan prcomp. Sekarang saya harus bisa mengalikan vektor saya dengan matriks rotasi PCA. Haruskah komponen utama dalam matriks ini disusun dalam baris …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 


2
Jika lebar kernel variabel sering baik untuk regresi kernel, mengapa mereka umumnya tidak baik untuk estimasi kepadatan kernel?
Pertanyaan ini didorong oleh diskusi di tempat lain . Kernel variabel sering digunakan dalam regresi lokal. Sebagai contoh, loess banyak digunakan dan berfungsi dengan baik sebagai regresi yang lebih lancar, dan didasarkan pada kernel dengan lebar variabel yang beradaptasi dengan data sparsity. Di sisi lain, kernel variabel biasanya dianggap menyebabkan …

1
Apa intuisi di balik sampel yang dapat ditukar di bawah hipotesis nol?
Tes permutasi (juga disebut tes pengacakan, uji pengacakan ulang, atau tes yang tepat) sangat berguna dan berguna ketika asumsi distribusi normal yang diperlukan misalnya, t-testtidak terpenuhi dan ketika transformasi nilai dengan peringkat dari tes non-parametrik seperti Mann-Whitney-U-testakan menyebabkan lebih banyak informasi hilang. Namun, satu dan hanya satu asumsi yang tidak …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 


3
Bagaimana cara menghitung tumpang tindih antara kepadatan probabilitas empiris?
Saya mencari metode untuk menghitung luas tumpang tindih antara dua perkiraan kepadatan kernel di R, sebagai ukuran kesamaan antara dua sampel. Untuk memperjelas, dalam contoh berikut, saya perlu mengukur luas wilayah keunguan yang tumpang tindih: library(ggplot2) set.seed(1234) d <- data.frame(variable=c(rep("a", 50), rep("b", 30)), value=c(rnorm(50), runif(30, 0, 3))) ggplot(d, aes(value, fill=variable)) …


1
Apakah ada bandwidth optimal untuk penduga kerapatan turunan kernel?
Saya perlu memperkirakan fungsi kerapatan berdasarkan serangkaian pengamatan menggunakan penduga kerapatan kernel. Berdasarkan set pengamatan yang sama, saya juga perlu memperkirakan turunan pertama dan kedua dari kepadatan menggunakan turunan dari penduga kepadatan kernel. Bandwidth pasti akan memiliki efek yang besar pada hasil akhir. Pertama, saya tahu ada beberapa fungsi R …

1
Kernel Bandwidth: Aturan Scott vs. Silverman
Adakah yang bisa menjelaskan dalam bahasa Inggris apa perbedaan antara aturan praktis Scott dan Silverman untuk pemilihan bandwidth? Secara khusus, kapan yang satu lebih baik dari yang lain? Apakah ini terkait dengan distribusi yang mendasarinya? Jumlah sampel? PS Saya mengacu pada kode di SciPy .

1
Apa varian jangka panjangnya?
Bagaimana perbedaan jangka panjang dalam bidang analisis deret waktu didefinisikan? Saya mengerti itu digunakan dalam hal ada struktur korelasi dalam data. Jadi proses stokastik kami tidak akan menjadi keluarga X1,X2…X1,X2…X_1, X_2 \dots iid variabel acak tetapi hanya didistribusikan secara identik? Bisakah saya memiliki referensi standar sebagai pengantar konsep dan kesulitan …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.