Bisakah saya menggunakan skor-Z dengan data yang miring dan tidak normal? [Tutup]


12

Saya telah bekerja dengan beberapa data waktu siklus proses dan penskalaan menggunakan skor-z standar untuk membandingkan antara bagian-bagian dari waktu siklus penuh.

Haruskah saya menggunakan beberapa transformasi lain karena datanya sangat miring / tidak normal? ('pencilan' tidak pernah dapat mengambil waktu negatif dan seringkali membutuhkan waktu lebih lama dari 'rata-rata')

Menggunakan z-score sepertinya masih "berfungsi" ...

###############
# R code    
###############
mydata <- rweibull(1000,1,1.5)
hist(mydata)
hist(scale(mydata))

5
zz

Jawaban:


5

Jika X sangat miring maka statistik Z tidak akan terdistribusi secara normal (atau t jika standar deviasi harus diestimasi. Jadi persentil Z tidak akan menjadi standar normal. Jadi dalam arti itu tidak berfungsi.


Untuk pemahaman saya, X yang sangat condong berarti ukuran sampel tidak cukup besar (teorema batas pusat). Namun saya tidak yakin, apakah populasi itu sendiri harus normal, agar statistik Z berfungsi. Melakukannya?
Andrzej Gis

1
OP berbicara tentang distribusi populasi dan bukan distribusi mean. Jadi ukuran sampel dan teorema batas pusat tidak berlaku.
Michael R. Chernick

2

Kode R akan berfungsi, tetapi skor-z akan sama bermakna dengan kalimat "Anggur menelpon pulpen ringan." Ini adalah kalimat yang valid, tetapi tidak menyampaikan sesuatu yang berarti.

Dilihat oleh kode R Anda, sepertinya Anda berpikir data Anda didistribusikan Weibull. Dalam hal ini, saya hanya akan menggunakan statistik Weibull dan tidak skala apa pun kecuali Anda benar-benar harus. Meskipun skor-z diajarkan di setiap kelas statistik intro, itu tidak berarti Anda harus menggunakannya setiap saat, dan terutama tidak jika Anda tidak memiliki data simetris.


1

Jika populasi tidak terdistribusi secara normal. Dalam hal itu, distribusi batang (X) {mean sampel} mendekati distribusi normal sesuai teorema batas pusat; untuk ukuran sampel besar. Meskipun secara teoritis kami katakan kami menggunakan Student's-t tetapi untuk nilai n yang lebih tinggi (ukuran sampel atau tingkat kebebasan), distribusi t & distribusi Z hampir sama.


-4

DATA ANDA TIDAK HARUS NORMAL UNTUK Z-TEST. (TOWNEND, 2002) NAMUN, VARIASI HARUS TEPAT. UNTUK MEMERIKSA YANG MELAKUKAN F-TEST PADA DATASET DUA ANDA, DAN JIKA VARIASI ANDA SESUNGGUHNYA SESUAI, HASIL UJI Z HASIL BERMANFAAT. JIKA TIDAK, TRANSFORMASI DATA.


9
Pertanyaannya adalah tentang transformasi variabel bukan tes, jadi saya tidak berpikir jawaban Anda berlaku. Juga, mungkin lebih informatif jika Anda memberikan referensi lengkap, bukan hanya referensi nama-tahun dan beberapa orang keberatan terhadap SHOUTING.
Maarten Buis

Saya setuju dengan @MaartenBuis tetapi tidak seperti dia saya akan menurunkan ini.
Erik
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.