Pertanyaan yang diberi tag «data-transformation»

Ekspresi matematis, seringkali nonlinier, dari nilai data. Data sering diubah baik untuk memenuhi asumsi model statistik atau untuk membuat hasil analisis lebih dapat ditafsirkan.

1
Saya log mentransformasikan variabel dependen saya, dapatkah saya menggunakan distribusi normal GLM dengan fungsi tautan LOG?
Saya punya pertanyaan tentang Generalized Linear Models (GLM). Variabel dependen saya (DV) kontinu dan tidak normal. Jadi saya log mengubahnya (masih tidak normal tetapi memperbaikinya). Saya ingin menghubungkan DV dengan dua variabel kategori dan satu kovariabel kontinu. Untuk ini saya ingin melakukan GLM (saya menggunakan SPSS) tetapi saya tidak yakin …

2
Bagaimana memilih transformasi terbaik untuk mencapai linearitas?
Saya ingin melakukan regresi linier berganda dan kemudian memprediksi nilai-nilai baru dengan sedikit ekstrapolasi. Saya memiliki variabel respons di kisaran -2 hingga +7, dan tiga prediktor (kisaran sekitar +10 - +200). Distribusi hampir normal. Tetapi hubungan antara respons dan prediktornya tidak linier, saya melihat kurva pada plot. Misalnya seperti ini: …

3
Model linier Heteroscedasticity
Saya memiliki model linier berikut: Untuk mengatasi heteroscedasticity residual, saya telah mencoba menerapkan transformasi log pada variabel dependen sebagai tetapi saya masih melihat efek fan out yang sama pada residual. Nilai-nilai DV relatif kecil sehingga penambahan konstan +1 sebelum mengambil log mungkin tidak sesuai dalam kasus ini.log(Y+1)log⁡(Y+1)\log(Y + 1) > …

4
Bagaimana menafsirkan koefisien yang ditransformasikan secara logaritma dalam regresi linier?
Situasi saya adalah: Saya memiliki 1 variabel dependen kontinu dan 1 kontinu yang telah saya ubah secara logaritma untuk menormalkan residu mereka untuk regresi linier sederhana. Saya akan menghargai bantuan apa pun tentang bagaimana saya bisa menghubungkan variabel-variabel yang diubah ini dengan konteks aslinya. Saya ingin menggunakan regresi linier untuk …


5
Apa transformasi normalisasi yang biasa digunakan di luar yang umum seperti akar kuadrat, log, dll?
Dalam analisis skor tes (misalnya, dalam Pendidikan atau Psikologi), teknik analisis umum sering mengasumsikan bahwa data terdistribusi secara normal. Namun, mungkin lebih sering daripada tidak, skor cenderung menyimpang kadang-kadang liar dari normal. Saya akrab dengan beberapa transformasi normalisasi dasar, seperti: akar kuadrat, logaritma, transformasi timbal balik untuk mengurangi kemiringan positif, …


1
Mengapa kita tidak bisa menggunakan
Bayangkan kita memiliki model regresi linier dengan variabel dependen . Kami menemukan . Sekarang, kami melakukan regresi lain, tetapi kali ini di , dan juga menemukan . Saya telah diberitahu bahwa saya tidak dapat membandingkan kedua untuk melihat model mana yang lebih cocok. Mengapa demikian? Alasan yang diberikan kepada saya …



2
Mengubah Statistik Pesanan
X1,...,XnX1,...,XnX_1, ... , X_nY1,...,YnY1,...,YnY_1, ..., Y_nU(0,a)U(0,a)U(0,a)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))Zn=nlog⁡max(Y(n),X(n))min(Y(n),X(n))Z_n= n\log\frac{\max(Y_{(n)},X_{(n)})}{\min(Y_{(n)},X_{(n)})}Exp(1)Exp(1)\text{Exp}(1) Saya telah memulai masalah ini dengan mengatur Kemudian akan didistribusikan sebagai dan akan didistribusikan sebagai Kepadatan dapat ditemukan dengan mudah seperti dan{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}\{X_1,...,X_n,Y_1,...Y_n\} = \{Z_1,...,Z_n\}max(Yn,Xn)=Z(2n)max(Yn,Xn)=Z(2n)\max(Y_n,X_n)= Z_{(2n)}(za)2n(za)2n(\frac{z}{a})^{2n}min(Yn,Xn)=Z(1)min(Yn,Xn)=Z(1)\min(Y_n,X_n)= Z_{(1)}1−(1−za)2n1−(1−za)2n1 - (1 - \frac{z}{a})^{2n}fZ1(z)=(2n)(1−za)2n−11afZ1(z)=(2n)(1−za)2n−11af_{Z_{1}}(z) = (2n)(1-\frac{z}{a})^{2n-1}\frac{1}{a}fZ(2n)(z)=(2n)(za)2n−11afZ(2n)(z)=(2n)(za)2n−11af_{Z_{(2n)}}(z) = (2n)(\frac{z}{a})^{2n-1} \frac{1}{a} Di sinilah saya mengalami kesulitan mengetahui ke mana …


1
Membakukan fitur saat menggunakan LDA sebagai langkah pra-pemrosesan
Jika Analisis Diskriminan Linier multi-kelas (atau saya juga membaca Analisis Diskriminan Berganda kadang-kadang) digunakan untuk pengurangan dimensi (atau transformasi setelah pengurangan dimensi melalui PCA), saya memahami bahwa secara umum "normalisasi Z-score" (atau standardisasi) dari fitur tidak akan diperlukan, bahkan jika diukur pada skala yang sama sekali berbeda, benar? Karena LDA …

2
Bantu saya menyesuaikan regresi berganda non-linier ini yang telah menentang semua upaya sebelumnya
EDIT: Sejak membuat posting ini, saya telah menindaklanjuti dengan posting tambahan di sini . Ringkasan teks di bawah ini: Saya sedang mengerjakan model dan telah mencoba regresi linier, transformasi Box Cox dan GAM tetapi belum membuat banyak kemajuan Dengan menggunakan R, saya saat ini sedang mengerjakan model untuk memprediksi keberhasilan …

1
Menemukan distribusi statistik
Belajar untuk ujian. Tidak dapat menjawab yang ini. Misalkan menjadi iid N ( 0 , 1 ) variabel acak. MenetapkanX1 , saya, X2 , saya, X3 , saya, i = 1 , … , nX1,i,X2,i,X3,i,i=1,…,nX_{1,i},X_{2,i},X_{3,i}, i=1,\ldots,nN( 0 , 1 )N(0,1)\mathcal{N}(0,1) ,Wsaya= ( X1 , saya+ X2 , sayaX3 , saya) …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.