Pertanyaan yang diberi tag «standardization»

Biasanya mengacu pada "z-standardisasi" yang menggeser dan mengubah ukuran data untuk memastikan mereka memiliki nol rata-rata dan varian unit. "Standarisasi" lainnya juga dimungkinkan.

7
Saat melakukan beberapa regresi, kapan Anda harus memusatkan variabel prediktor Anda & kapan Anda harus membakukannya?
Dalam beberapa literatur, saya telah membaca bahwa regresi dengan berbagai variabel penjelas, jika dalam unit yang berbeda, perlu distandarisasi. (Standarisasi terdiri dari pengurangan mean dan pembagian dengan deviasi standar.) Dalam kasus lain apa saya perlu melakukan standarisasi data? Apakah ada kasus di mana saya hanya harus memusatkan data saya (yaitu, …



3
Lakukan normalisasi fitur sebelum atau di dalam validasi model?
Praktek umum yang baik dalam Pembelajaran Mesin adalah melakukan normalisasi fitur atau standardisasi data dari variabel prediktor, hanya itu, pusatkan data dengan mengurangkan rata-rata dan menormalkannya dengan varian (atau standar deviasi juga). Untuk pengendalian diri dan pemahaman saya, kami melakukan ini untuk mencapai dua hal utama: Hindari bobot model ekstra …

1
Bagaimana menerapkan standardisasi / normalisasi ke train- and testset jika prediksi adalah tujuannya?
Apakah saya mengubah semua data atau lipatan saya (jika CV diterapkan) secara bersamaan? misalnya (allData - mean(allData)) / sd(allData) Apakah saya mengubah trainset dan testset secara terpisah? misalnya (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Atau apakah saya mengubah trainset dan menggunakan perhitungan pada testset? misalnya (trainData …

3
Apakah standardisasi diperlukan sebelum menyesuaikan regresi logistik?
Pertanyaan saya adalah apakah kita perlu menstandarkan set data untuk memastikan semua variabel memiliki skala yang sama, antara [0,1], sebelum menyesuaikan regresi logistik. Rumusnya adalah: xsaya- mnt ( xsaya)maks ( xsaya) - min ( xsaya)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} Kumpulan data saya memiliki 2 variabel, mereka menggambarkan hal yang sama untuk dua saluran, tetapi …

2
Kapan dan bagaimana menggunakan variabel penjelas terstandarisasi dalam regresi linier
Saya punya 2 pertanyaan sederhana tentang regresi linier: Kapan disarankan untuk membakukan variabel penjelas? Setelah estimasi dilakukan dengan nilai-nilai terstandarisasi, bagaimana seseorang dapat memprediksi dengan nilai-nilai baru (bagaimana seseorang harus membuat standar nilai-nilai baru)? Beberapa referensi akan sangat membantu.

3
apakah akan mengubah indikator / biner / prediktor tiruan untuk LASSO
Untuk LASSO (dan prosedur pemilihan model lainnya), sangat penting untuk mengubah skala prediktor. The umum Rekomendasi saya tindak hanya menggunakan 0 berarti, 1 standar deviasi normalisasi untuk variabel kontinyu. Tapi apa yang harus dilakukan dengan boneka? Misalnya beberapa contoh terapan dari sekolah musim panas yang sama (luar biasa) yang saya …

2
Apakah standardisasi sebelum Lasso benar-benar diperlukan?
Saya telah membaca tiga alasan utama untuk menstandarkan variabel sebelum sesuatu seperti Lassoregresi: 1) Interpretabilitas koefisien. 2) Kemampuan untuk menentukan peringkat kepentingan koefisien dengan besarnya relatif estimasi koefisien pasca penyusutan. 3) Tidak perlu mencegat. Tetapi saya bertanya-tanya tentang hal yang paling penting. Apakah kita memiliki alasan untuk berpikir bahwa standardisasi …


3
Apa arti "normalisasi" dan bagaimana memverifikasi bahwa sampel atau distribusi dinormalisasi?
Saya memiliki pertanyaan di mana ia meminta untuk memverifikasi apakah distribusi Uniform ( ) dinormalisasi.Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) Untuk satu, apa artinya distribusi akan dinormalisasi? Dan kedua, bagaimana kita memverifikasi apakah suatu distribusi dinormalisasi atau tidak? Saya mengerti dengan menghitung kita mendapatkan data yang dinormalisasi , tetapi di sini diminta untuk memverifikasi …

2
Pertanyaan tentang standardisasi dalam regresi ridge
Hai teman-teman, saya menemukan satu atau dua makalah yang menggunakan regresi ridge (untuk data bola basket). Saya selalu diminta untuk menstandardisasi variabel saya jika saya menjalankan regresi punggungan, tetapi saya hanya diminta untuk melakukan ini karena punggungan adalah varian skala (regresi punggungan tidak benar-benar bagian dari kursus kami, jadi dosen …

2
Apakah praktik yang baik untuk membakukan data Anda dalam regresi dengan data panel / longitudinal?
Secara umum, saya membakukan variabel independen saya dalam regresi, untuk membandingkan dengan benar koefisien (dengan cara ini mereka memiliki unit yang sama: standar deviasi). Namun, dengan data panel / longitudinal, saya tidak yakin bagaimana saya harus membakukan data saya, terutama jika saya memperkirakan model hierarkis. Untuk melihat mengapa itu bisa …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.