Pertanyaan yang diberi tag «data-transformation»

Ekspresi matematis, seringkali nonlinier, dari nilai data. Data sering diubah baik untuk memenuhi asumsi model statistik atau untuk membuat hasil analisis lebih dapat ditafsirkan.


2
Analisis korelasi kanonik dengan korelasi peringkat
Analisis korelasi kanonik (CCA) bertujuan untuk memaksimalkan korelasi product-moment Pearson yang biasa (yaitu koefisien korelasi linier) dari kombinasi linear dari dua set data. Sekarang, pertimbangkan fakta bahwa koefisien korelasi ini hanya mengukur asosiasi linier - ini adalah alasan mengapa kami juga menggunakan, misalnya, koefisien korelasi Spearman- atau Kendall- τ yang …


3
CDF dinaikkan menjadi kekuatan?
Jika FZFZF_Z adalah CDF, sepertinya FZ(z)αFZ(z)αF_Z(z)^\alpha ( α>0α>0\alpha \gt 0 ) adalah CDF juga. T: Apakah ini hasil standar? T: Apakah ada cara yang baik untuk menemukan fungsi ggg dengan X≡g(Z)X≡g(Z)X \equiv g(Z) st FX(x)=FZ(z)αFX(x)=FZ(z)αF_X(x) = F_Z(z)^\alpha , di mana x≡g(z)x≡g(z) x \equiv g(z) Pada dasarnya, saya memiliki CDF lain …


2
Mengubah Data: Semua variabel atau hanya yang tidak normal?
Dalam Statistik Penemuan Andy Field Menggunakan SPSS ia menyatakan bahwa semua variabel harus diubah. Namun dalam publikasi: "Memeriksa hubungan spasial yang bervariasi antara penggunaan lahan dan kualitas air menggunakan regresi tertimbang secara geografis I: Desain model dan evaluasi" mereka secara khusus menyatakan bahwa hanya variabel non-normal yang ditransformasikan. Apakah analisis …

1
Bagaimana cara menangani campuran input biner dan kontinu dalam jaringan saraf?
Saya menggunakan paket nnet dalam R untuk mencoba membangun JST untuk memprediksi harga real estat untuk kondominium (proyek pribadi). Saya baru dalam hal ini dan tidak memiliki latar belakang matematika, jadi tolong beri tahu saya. Saya memiliki variabel input yang bersifat biner dan kontinu. Misalnya beberapa variabel biner yang awalnya …



1
Bagaimana entropi bergantung pada lokasi dan skala?
The entropi dari suatu distribusi kontinu dengan fungsi densitas fff didefinisikan sebagai negatif dari harapan catatan( f) ,log⁡(f),\log(f), dan karena itu sama Hf= - ∫∞- ∞catatan( f( x ) ) f( x ) d x .Hf=−∫−∞∞log⁡(f(x))f(x)dx.H_f = -\int_{-\infty}^{\infty} \log(f(x)) f(x)\mathrm{d}x. Kami juga mengatakan bahwa setiap variabel acak XXX yang distribusinya …

3
variabel dummy pemusatan dan penskalaan
Saya memiliki kumpulan data yang berisi variabel kategorikal dan variabel kontinu. Saya disarankan untuk mengubah variabel kategori sebagai variabel biner untuk setiap level (yaitu, A_level1: {0,1}, A_level2: {0,1}) - Saya pikir beberapa orang menyebutnya "variabel dummy". Dengan itu, apakah akan menyesatkan untuk kemudian memusatkan dan skala seluruh set data dengan …

3
Mengubah distribusi yang sangat miring
Asumsikan bahwa saya memiliki variabel yang distribusinya condong positif ke tingkat yang sangat tinggi, sehingga mengambil log tidak akan cukup untuk membawanya dalam kisaran skewness untuk distribusi normal. Apa opsi saya saat ini? Apa yang bisa saya lakukan untuk mengubah variabel menjadi distribusi normal?




Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.