Saya memiliki empat variabel numerik. Semuanya adalah ukuran kualitas tanah. Semakin tinggi variabel, semakin tinggi kualitasnya. Kisaran untuk semuanya berbeda:
Var1 dari 1 hingga 10
Var2 dari 1000 hingga 2000
Var3 dari 150 hingga 300
Var4 dari 0 hingga 5
Saya perlu menggabungkan empat variabel menjadi skor kualitas tanah tunggal yang akan berhasil menentukan urutan.
Ide saya sangat sederhana. Standarisasi keempat variabel, jumlahkan semuanya dan apa pun yang Anda dapatkan adalah skor yang seharusnya peringkat-urutan. Apakah Anda melihat masalah dengan menerapkan pendekatan ini. Apakah ada pendekatan lain (lebih baik) yang akan Anda rekomendasikan?
Terima kasih
Edit:
Terima kasih kawan Banyak diskusi masuk ke "keahlian domain" ... hal pertanian ... Padahal saya mengharapkan lebih banyak statistik-bicara. Dalam hal teknik yang akan saya gunakan ... Mungkin penjumlahan z-score + regresi logistik sederhana sebagai percobaan. Karena sebagian besar sampel memiliki kualitas buruk 90% saya akan menggabungkan 3 kategori kualitas menjadi satu dan pada dasarnya memiliki masalah biner (kualitas vs tidak ada kualitas). Saya membunuh dua burung dengan satu batu. Saya meningkatkan sampel saya dalam hal tingkat kejadian dan saya menggunakan pakar dengan meminta mereka untuk mengklasifikasikan sampel saya. Sampel yang dikelompokkan oleh para ahli kemudian akan digunakan agar sesuai dengan model log-reg untuk memaksimalkan tingkat kesesuaian / ketidaksesuaian dengan para ahli .... Bagaimana itu terdengar bagi Anda?