Pertanyaan yang diberi tag «normalization»

Biasanya "normalisasi" berarti mengekspresikan kembali data untuk membuat nilai berada dalam rentang yang ditentukan.

3
Normalisasi matriks kolom-bijaksana dalam R [ditutup]
Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 6 tahun yang lalu . Saya ingin melakukan normalisasi kolom-bijaksana dari matriks dalam R. Mengingat matriks m, saya ingin menormalkan setiap kolom dengan membagi setiap …

1
Konversi (normalisasi) sangat kecil nilai kemungkinan menjadi probabilitas
Saya menulis sebuah algoritma di mana, diberikan model, saya menghitung kemungkinan untuk daftar dataset dan kemudian perlu menormalkan (untuk probabilitas) masing-masing kemungkinan. Jadi sesuatu seperti [0,00043, 0,00004, 0,00321] mungkin dikonversi menjadi seperti [0,2, 0,03, 0,77]. Masalah saya adalah kemungkinan log, saya bekerja dengan, cukup kecil (misalnya, dalam ruang log, nilainya …



3
Apa arti "normalisasi" dan bagaimana memverifikasi bahwa sampel atau distribusi dinormalisasi?
Saya memiliki pertanyaan di mana ia meminta untuk memverifikasi apakah distribusi Uniform ( ) dinormalisasi.Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) Untuk satu, apa artinya distribusi akan dinormalisasi? Dan kedua, bagaimana kita memverifikasi apakah suatu distribusi dinormalisasi atau tidak? Saya mengerti dengan menghitung kita mendapatkan data yang dinormalisasi , tetapi di sini diminta untuk memverifikasi …

4
Variabel “normalisasi” untuk SVD / PCA
Misalkan kita memiliki NNN variabel terukur, (a1,a2,…,aN)(a1,a2,…,aN)(a_1, a_2, \ldots, a_N) , kita melakukan sejumlah M>NM>NM > N pengukuran, dan kemudian ingin melakukan dekomposisi nilai singular pada hasil untuk menemukan sumbu varians tertinggi untuk poin MMM dalam NNN dimensi ruang. ( Catatan: asumsikan bahwa sarana aiaia_i telah dikurangi, jadi ⟨ai⟩=0⟨ai⟩=0\langle a_i …

4
Normalisasi sebelum validasi silang
Apakah data normalisasi (memiliki nol rata-rata dan standar deviasi kesatuan) sebelum melakukan validasi silang k-fold berulang-ulang memiliki konsekuensi negatif seperti overfitting? Catatan: ini untuk situasi di mana #cases> total #features Saya mengubah beberapa data saya menggunakan transformasi log, kemudian menormalkan semua data seperti di atas. Saya kemudian melakukan pemilihan fitur. …

1
Bagaimana cara kerja normalisasi kuantil?
In gene expression studies using microarrays, intensity data has to be normalized so that intensities can be compared between individuals, between genes. Conceptually, and algorithmically, how does "quantile normalization" work, and how would you explain this to a non-statistician?

3
Pengaturan dan penskalaan fitur dalam pembelajaran online?
Katakanlah saya memiliki penggolong regresi logistik. Dalam pembelajaran batch normal, saya akan memiliki istilah regularizer untuk mencegah overfitting dan menjaga bobot saya kecil. Saya juga akan menormalkan dan memperbesar fitur saya. Dalam pengaturan pembelajaran online, saya mendapatkan aliran data yang berkelanjutan. Saya melakukan pembaruan gradient descent dengan setiap contoh dan …

4
Fitur penskalaan dan normalisasi rata-rata
Saya mengikuti kursus pembelajaran mesin Andrew Ng dan tidak bisa mendapatkan jawaban untuk pertanyaan ini dengan benar setelah beberapa upaya. Mohon bantu selesaikan ini, meskipun saya sudah melewati level. Misalkan siswa telah mengambil beberapa kelas, dan kelas memiliki ujian tengah semester dan ujian akhir. Anda telah mengumpulkan dataset nilai mereka …


3
Cara menormalkan data dari distribusi yang tidak diketahui
Saya mencoba untuk menemukan distribusi karakteristik yang paling tepat dari data pengukuran berulang dari jenis tertentu. Pada dasarnya, di cabang geologi saya, kami sering menggunakan penanggalan radiometrik mineral dari sampel (bongkahan batu) untuk mengetahui berapa lama peristiwa terjadi (batu itu mendingin di bawah suhu ambang batas). Biasanya, beberapa (3-10) pengukuran …

5
Bagaimana cara melakukan imputasi nilai dalam jumlah poin data yang sangat besar?
Saya memiliki dataset yang sangat besar dan sekitar 5% nilai acak hilang. Variabel-variabel ini berkorelasi satu sama lain. Contoh berikut dataset R hanyalah contoh mainan dengan data berkorelasi dummy. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
Algoritma untuk normalisasi data time-series real-time?
Saya sedang mengerjakan suatu algoritma yang mengambil dalam suatu vektor dari titik data terbaru dari sejumlah aliran sensor dan membandingkan jarak euclidean ke vektor sebelumnya. Masalahnya adalah bahwa aliran data yang berbeda berasal dari sensor yang sama sekali berbeda, sehingga mengambil jarak euclidean sederhana akan secara dramatis terlalu menekankan beberapa …

6
Ukuran yang kuat (non-parametrik) seperti Koefisien Variasi - IQR / median, atau alternatif?
Untuk set data yang diberikan, spread sering dihitung baik sebagai standar deviasi atau sebagai IQR (rentang antar-kuartil). Sedangkan a standard deviationdinormalisasi (skor-z, dll.) Dan dapat digunakan untuk membandingkan penyebaran dari dua populasi yang berbeda, ini bukan kasus dengan IQR karena sampel dari dua populasi yang berbeda dapat memiliki nilai pada …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.