Tukey Median Polish, algoritma ini digunakan dalam normalisasi RMA microarrays. Seperti yang Anda ketahui, data microarray cukup berisik, oleh karena itu mereka membutuhkan cara yang lebih kuat untuk memperkirakan intensitas probe dengan mempertimbangkan pengamatan untuk semua probe dan microarray. Ini adalah model khas yang digunakan untuk menormalisasi intensitas probe di seluruh array.
i = 1 , … , I
Yij=μi+αj+ϵij
i=1,…,Ij=1,…,J
Dimana adalah berubah intensitas PM untuk penyelidikan di Array. adalah noise latar belakang dan dapat diasumsikan sesuai dengan noise dalam regresi linear normal. Namun, asumsi distributif pada mungkin membatasi, oleh karena itu kami menggunakan Tukey Median Polish untuk mendapatkan estimasi untuk dan . Ini adalah cara yang kuat untuk menormalkan seluruh array, karena kami ingin memisahkan sinyal, intensitas akibat probe, dari efek array, . Kita dapat memperoleh sinyal dengan menormalkan efek array l o g i t h j t hYijlogithjth ϵ ^ μ i ^ α j α ^ α jϵijϵμi^αj^ααj^untuk semua array. Jadi, kita hanya dibiarkan dengan efek probe ditambah beberapa noise acak.
Tautan yang saya kutip sebelumnya menggunakan poles median Tukey untuk memperkirakan gen yang diekspresikan secara berbeda atau gen "menarik" dengan memberi peringkat berdasarkan efek penyelidikan. Namun, makalah ini cukup tua, dan mungkin pada saat itu orang masih mencoba mencari cara untuk menganalisis data microarray. Makalah metode Bayesian empiris non-parametrik datang pada tahun 2001, tetapi mungkin belum banyak digunakan.
Namun, sekarang kami mengerti banyak tentang microarray (secara statistik) dan cukup yakin tentang analisis statistik mereka.
Data microarray cukup berisik dan RMA (yang menggunakan Median Polish) adalah salah satu metode normalisasi yang paling populer, mungkin karena kesederhanaannya. Metode populer dan canggih lainnya adalah: GCRMA, VSN. Penting untuk dinormalisasi karena bunganya adalah efek probe dan bukan efek array.
Seperti yang Anda harapkan, analisis tersebut dapat diuntungkan oleh beberapa metode yang memanfaatkan peminjaman informasi lintas gen. Ini mungkin termasuk, Bayesian atau metode Bayesian empiris. Mungkin kertas yang Anda baca sudah tua dan teknik-teknik ini tidak keluar sampai saat itu.
Mengenai poin kedua Anda, ya mereka mungkin memodifikasi data eksperimental. Tapi, saya pikir, modifikasi ini adalah untuk tujuan yang lebih baik, karenanya dapat dibenarkan. Alasannya adalah
a) Data microarray cukup berisik. Ketika minatnya adalah efek penyelidikan, normalisasi data dengan RMA, GCRMA, VSN, dll. Diperlukan dan mungkin memanfaatkan struktur khusus apa pun dalam data yang baik. Tetapi saya akan menghindari melakukan bagian kedua. Ini terutama karena jika kita tidak tahu strukturnya lebih awal, lebih baik jangan memaksakan banyak asumsi.
b) Sebagian besar eksperimen microarray bersifat eksploratif, yaitu, para peneliti mencoba mempersempit beberapa set gen yang "menarik" untuk analisis atau eksperimen lebih lanjut. Jika gen-gen ini memiliki sinyal yang kuat, modifikasi seperti normalisasi seharusnya tidak (secara substansial) mempengaruhi hasil akhir.
Oleh karena itu, modifikasi dapat dibenarkan. Tetapi saya harus berkomentar, jika berlebihan, normalisasi dapat menyebabkan hasil yang salah.