Pertanyaan yang diberi tag «data-transformation»

Ekspresi matematis, seringkali nonlinier, dari nilai data. Data sering diubah baik untuk memenuhi asumsi model statistik atau untuk membuat hasil analisis lebih dapat ditafsirkan.

4
Bagaimana cara meringkas data kategori?
Saya telah berjuang dengan masalah berikut dengan mudah-mudahan mudah untuk para ahli statistik (saya seorang programmer dengan beberapa paparan statistik). Saya perlu meringkas tanggapan terhadap survei (untuk manajemen). Survei ini memiliki 100+ pertanyaan, dikelompokkan dalam berbagai area (dengan sekitar 5 hingga 10 pertanyaan per area). Semua jawaban bersifat kategoris (dalam …

3
Mengungkapkan jawaban dalam hal unit asli, dalam data transformasi Box-Cox
Untuk beberapa pengukuran, hasil analisis disajikan dengan tepat pada skala transformasi. Namun, dalam sebagian besar kasus, diinginkan untuk menyajikan hasil pada skala pengukuran asli (jika tidak, pekerjaan Anda kurang lebih tidak berharga). Sebagai contoh, dalam kasus data yang ditransformasi log, masalah dengan interpretasi pada skala asli muncul karena rata-rata nilai …

5
Pengurangan dimensi SVD untuk deret waktu dengan panjang berbeda
Saya menggunakan Dekomposisi Nilai Singular sebagai teknik reduksi dimensi. Mengingat Nvektor dimensiD , idenya adalah untuk mewakili fitur-fitur dalam ruang yang ditransformasi dari dimensi yang tidak berkorelasi, yang memadatkan sebagian besar informasi data dalam vektor eigen ruang ini dalam urutan kepentingan yang menurun. Sekarang saya mencoba menerapkan prosedur ini ke …

4
Model regresi yang variabel responsnya adalah hari tahun di mana peristiwa tahunan (biasanya) terjadi
Dalam kasus khusus ini saya mengacu pada hari di mana sebuah danau membeku. Tanggal "es" ini hanya terjadi setahun sekali, tetapi kadang-kadang tidak terjadi sama sekali (jika musim dingin hangat). Jadi pada satu tahun danau itu mungkin membeku pada hari 20 (20 Januari), dan satu tahun lagi mungkin tidak membeku …


1
Apakah
Kolega saya ingin menganalisis beberapa data setelah mengubah variabel respons dengan menaikkannya menjadi kekuatan (yaitu,y0,125).1818\frac18y0.125y0.125y^{0.125} Saya tidak nyaman dengan ini, tetapi berjuang untuk mengartikulasikan mengapa. Saya tidak dapat memikirkan alasan mekanistik untuk transformasi ini. Saya juga belum pernah melihatnya sebelumnya, dan saya khawatir mungkin itu mengembang tingkat kesalahan Tipe I …


4
Petunjuk bahwa suatu masalah cocok untuk regresi linier
Saya belajar regresi linier menggunakan Pengantar Analisis Regresi Linier oleh Montgomery, Peck, dan Vining . Saya ingin memilih proyek analisis data. Saya memiliki pemikiran naif bahwa regresi linier hanya cocok ketika seseorang menduga ada hubungan fungsional linier antara variabel penjelas dan variabel respons. Tetapi tidak banyak aplikasi dunia nyata yang …

2
Apakah X dan Y terdistribusi normal lebih mungkin menghasilkan residu terdistribusi normal?
Di sini salah tafsir dari asumsi normalitas dalam regresi linier dibahas (bahwa 'normalitas' merujuk X dan / atau Y daripada residual), dan poster bertanya apakah mungkin untuk memiliki X dan Y yang terdistribusi secara tidak normal. dan masih memiliki residu terdistribusi normal. Pertanyaan saya adalah: apakah X yang didistribusikan secara …


1
Kriteria untuk memilih model "terbaik" dalam Model Markov Tersembunyi
Saya memiliki kumpulan data deret waktu yang saya coba paskan dengan Hidden Markov Model (HMM) untuk memperkirakan jumlah status laten dalam data. Kode pseudo saya untuk melakukan ini adalah sebagai berikut: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest …


1
Mengapa menggunakan variabel yang dicatat?
Mungkin, ini adalah pertanyaan yang sangat mendasar tetapi saya sepertinya tidak dapat menemukan jawaban yang kuat untuk itu. Saya harap di sini, saya bisa. Saat ini saya membaca makalah sebagai persiapan untuk tesis master saya sendiri. Saat ini, saya sedang membaca sebuah makalah yang meneliti hubungan antara tweet dan fitur …

2
Apa yang harus dilakukan ketika beberapa titik waktu memiliki tanggapan yang sangat miring dan beberapa tidak dalam studi tindakan berulang?
Biasanya, ketika seseorang menjumpai ukuran hasil yang kontinu tetapi condong dalam desain longitudinal (katakanlah, dengan satu efek antar-subjek) pendekatan yang umum adalah mengubah hasilnya menjadi normal. Jika situasinya ekstrem, seperti dengan pengamatan terpotong, orang mungkin menyukai dan menggunakan model kurva pertumbuhan Tobit, atau semacamnya. Tetapi saya bingung ketika saya melihat …

2
Apakah model seri waktu perbedaan log lebih baik daripada tingkat pertumbuhan?
Seringkali saya melihat penulis memperkirakan model "perbedaan log", misalnya catatan( yt) - log( yt - 1) = log( yt/ yt - 1) = α + βxtcatatan⁡(yt)-catatan⁡(yt-1)=catatan⁡(yt/yt-1)=α+βxt\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t Saya setuju ini sesuai untuk menghubungkan dengan perubahan persentase dalam sementara adalah .y t log ( …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.