Apa arti "normalisasi" dan bagaimana memverifikasi bahwa sampel atau distribusi dinormalisasi?


18

Saya memiliki pertanyaan di mana ia meminta untuk memverifikasi apakah distribusi Uniform ( ) dinormalisasi.Uniform(a,b)

  1. Untuk satu, apa artinya distribusi akan dinormalisasi?
  2. Dan kedua, bagaimana kita memverifikasi apakah suatu distribusi dinormalisasi atau tidak?

Saya mengerti dengan menghitung kita mendapatkan data yang dinormalisasi , tetapi di sini diminta untuk memverifikasi apakah suatu distribusi dinormalisasi atau tidak.

Xmeansd

3
Apa artinya distribusi dinormalisasi tidak begitu sederhana (dan biasanya distribusi itu sendiri tidak dinormalisasi, tetapi variabel acak). Sebagai contoh, dalam kasus seragam, beberapa orang mungkin berarti "dinaikkan secara linear sehingga mendapatkan seragam standar" (yaitu untuk mendapatkan dan ) ... sedangkan orang lain mungkin berarti "dinaikkan secara linear sehingga untuk mendapatkan mean 0 dan sd 1 ". Untuk seragam, saya biasanya menganggap yang pertama, tetapi seperti yang Anda lihat dari jawaban di bawah, orang lain mungkin menganggapnya sesuatu yang lain. Pilihan terbaik adalah meminta orang yang menggunakan istilah tersebut menjadi kurang ambigu. a=0b=1
Glen_b -Reinstate Monica

1
Istilah yang lebih konvensional distandarisasi (untuk mencapai rata-rata nol dan SD dari satu) dan dinormalisasi (untuk membawa kisaran ke interval atau untuk mengubah skala norma vektor ke ). Jadi ekspresi ulang adalah standarisasi sedangkan mengalikan kepadatan dengan konstanta untuk membuat adalah normalisasi , karena adalah norma dari . 1 X ( X - rata ) / S D f C - C f ( x ) d x = 1 f ( x ) d x L 1 f[0,1]1X(Xmean)/SDfCCf(x)dx=1f(x)dxL1f
whuber

Juga ditanya tentang matematika.SE.
Dilip Sarwate

1
Tolong jangan lintas pos , @Ada. Itu bertentangan dengan kebijakan SE. Jika Anda memposting Q di 1 situs & kemudian berpikir Anda harus mempostingnya di yang lain, tandai Q Anda & minta moderator untuk memigrasikannya untuk Anda.
gung - Reinstate Monica

Jawaban:


33

Sayangnya, istilah digunakan secara berbeda di bidang yang berbeda, oleh orang yang berbeda di bidang yang sama, dll. Jadi saya tidak yakin seberapa baik jawaban ini untuk Anda di sini. Anda harus memastikan Anda tahu definisi yang digunakan instruktur / buku teks Anda untuk "dinormalisasi". Namun, berikut adalah beberapa definisi umum:

Centered:

Xmean
Standar:
Xmeansd
Xmin(X)max(X)min(X)
Normalisasi dalam hal ini mengubah data Anda ke interval unit. Standarisasi mengubah data Anda menjadi skor- , sebagai catatan @Jeff. Dan pemusatan membuat rata-rata data Anda sama dengan . z0

Perlu diakui di sini bahwa ketiganya adalah transformasi linear ; dengan demikian, mereka tidak mengubah bentuk distribusi Anda . Yaitu, kadang-kadang orang menyebut transformasi skor "normalisasi" dan percaya, karena hubungan skor dengan distribusi normal, bahwa ini telah membuat data mereka terdistribusi secara normal. Ini tidak begitu (seperti @Jeff juga mencatat, dan seperti yang Anda tahu dengan memplot data Anda sebelum dan sesudah). Jika Anda tertarik, Anda bisa mengubah bentuk data Anda menggunakan keluarga transformasi Box-Cox , misalnya. zz

Sehubungan dengan bagaimana Anda dapat memverifikasi transformasi ini, itu tergantung pada apa yang dimaksud dengan itu. Jika maksudnya hanya untuk memeriksa apakah kode tersebut berjalan dengan benar, Anda dapat memeriksa nilai rata-rata, SD, minimum, dan maksimum.


1
Saya telah melihat dinormalisasi digunakan untuk menyarankan standar atau menyarankan dipasang ke distribusi normal standar yaitu , jadi dari tiga yang dinormalisasi kemungkinan besar akan disalahpahami. Komentar Ada tentang penerapan konstanta normalisasi ke fungsi kemungkinan adalah interpretasi lain yang mungkin. Φ1(F(X))
Henry

4

Dengan menggunakan rumus yang Anda berikan pada setiap skor dalam sampel Anda, Anda mengonversikan semuanya menjadi skor-z .

Untuk memverifikasi bahwa Anda menghitung semua skor-z dengan benar, temukan mean dan standar deviasi baru dari sampel Anda. Jika rata-rata adalah dan standar deviasi adalah 1 , Anda telah melakukan semuanya dengan benar.01

Tujuan melakukan ini adalah untuk meletakkan semuanya dalam satuan relatif terhadap standar deviasi sampel Anda. Ini mungkin berguna untuk berbagai keperluan, seperti membandingkan dua set data yang berbeda yang dinilai menggunakan unit yang berbeda (sentimeter dan inci, mungkin).

Penting untuk tidak bingung dengan menanyakan apakah suatu distribusi normal , yaitu apakah ia mendekati distribusi Gauss .


jadi untuk memeriksa apakah distribusi Uniform dinormalisasi atau tidak itu akan setara dengan mengatakan E (X) = 0 dan Var (X) = 1 di mana X ~ Uniform (a, b)?

2
data bahkan tidak harus dari distribusi yang seragam, mereka bisa dari distribusi apa pun. juga, ini hanya berlaku menggunakan rumus yang Anda berikan; data dapat dinormalisasi dengan cara selain menggunakan skor-z. misalnya, skor IQ dikatakan dinormalisasi dengan skor 100 dan standar deviasi 15.
Jeff

1

Setelah berkonsultasi dengan TA, pertanyaan yang diajukan adalah apakah jika

f(x)dx=1

di mana dalam hal ini adalah densitas seragam (a, b).f(x)


2
Terminologi yang digunakan di sini adalah fungsi kepadatan probabilitas distribusi dinormalisasi. Karena ini mencerminkan fakta aksiomatis bahwa probabilitas total harus sama dengan , menanyakan apakah setiap distribusi itu sendiri dinormalisasi (dalam pengertian ini) selalu memiliki jawaban sepele yang sama: tentu saja. 1
whuber

Inilah yang kami diminta untuk memverifikasi. f (x) tidak benar-benar harus berupa pdf, dan dapat berupa fungsi non-negatif. Untuk fungsi non-negatif mana yang di atas tidak memuaskan, kita selalu dapat berkembang biak dengan konstanta normalisasi
Ada

1
Tidak selalu. Sebagai contoh, misalkan , fungsi non-negatif yang didefinisikan pada semua bilangan real: tidak ada konstanta normalisasi. Tetapi ketika Anda diberitahu, seperti dalam pernyataan pertanyaan Anda, bahwa "ini-dan-itu adalah PDF untuk distribusi ini-dan-itu" maka tidak ada apa pun untuk memverifikasi: menurut definisi itu terintegrasi ke persatuan. f(x)=ex
Whuber

Memang benar tidak ada fungsi non-negatif di mana kita dapat membuatnya memenuhi kondisi di atas bahkan jika kita mengalikannya dengan konstanta normalisasi.
Ada
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.