Ini mengingatkan saya pada diagnosa kanker, di mana tanda-tanda ekspresi gen lama digantikan oleh yang baru, yang tentu saja seharusnya lebih baik. Tetapi bagaimana cara menunjukkan bahwa mereka lebih baik?
Berikut adalah beberapa saran untuk membandingkan pengulangan metode.
1. Gunakan analisis co-inersia (CIA).
CIA harus lebih diiklankan, sayangnya itu tidak banyak digunakan (tidak ada halaman Wikipedia misalnya). CIA adalah metode dua tabel yang bekerja pada prinsip yang sama dengan analisis kanonik (CA), yaitu mencari pasangan skor linier dengan korelasi maksimum antara dua set pengukuran multi-dimensi. Keuntungannya dibandingkan CA adalah Anda dapat melakukannya bahkan jika Anda memiliki dimensi lebih dari pengamatan. Anda bisa mengukur kedua metode pada sampel yang sama untuk mendapatkan dua tabel digabungkan dari 30 kolom dannpengamatan. Pasangan pertama komponen utama harus sangat berkorelasi (jika metode benar-benar mengukur hal yang sama). Jika metode B lebih baik, varians residual harus lebih kecil daripada varians residual metode A. Dengan pendekatan ini Anda mengatasi kedua kesepakatan metode, dan ketidaksetujuannya, yang Anda artikan sebagai noise.
2. Gunakan jarak .
Anda bisa menggunakan jarak Euclidean dalam 30 dimensi antara tes dan tes ulang untuk mengukur pengulangan suatu metode. Anda menghasilkan sampel skor itu untuk setiap metode dan Anda dapat membandingkan sampel dengan tes Wilcoxon.
3. Gunakan aplikasi hilir.
Anda mungkin mendapatkan sidik jari ini untuk mengambil keputusan, atau mengklasifikasikan pasien atau bahan biologis. Anda dapat menghitung perjanjian vs ketidaksepakatan antara tes dan pengujian ulang untuk kedua metode dan membandingkannya dengan tes Wilcoxon.
Metode 3 adalah yang paling sederhana, tetapi juga yang paling sederhana. Bahkan untuk input dimensi tinggi, keputusan biasanya cukup sederhana. Dan betapapun rumitnya masalah kita, ingatlah bahwa statistik adalah ilmu keputusan.
Mengenai pertanyaan di komentar Anda.
Bagaimana dengan menggunakan metode reduksi dimensi kuat untuk mengurangi data multivariat ke dimensi tunggal dan menganalisisnya?
Pengurangan dimensi, bagaimanapun kuatnya, akan dikaitkan dengan hilangnya varian. Jika ada cara untuk mengubah sidik jari multivarian Anda menjadi skor tunggal yang menangkap hampir semua variansnya, maka tentu saja, inilah yang terbaik untuk dilakukan. Tapi mengapa multivarian sidik jari di tempat pertama?
Saya berasumsi dari konteks OP yang sidik jari adalah multivariat justru karena sulit untuk mengurangi dimensi yang lebih jauh tanpa kehilangan informasi. Dalam hal itu, pengulangan mereka pada skor tunggal tidak harus menjadi proksi yang baik untuk pengulangan keseluruhan, karena Anda dapat mengabaikan mayoritas varian (hampir 29/30 dalam kasus terburuk).