Saya hanya mencoba untuk mereplikasi klaim yang dibuat dalam makalah berikut, Finding Bicerust Correlated dari Gene Expression Data , yaitu:
Proposisi 4. Jika . maka kita memiliki:
saya. Jika adalah bicluster sempurna dengan model aditif, maka adalah bicluster sempurna dengan korelasi pada kolom; ii. Jika adalah sempurna dengan model aditif, maka adalah bicluster sempurna dengan korelasi pada baris; aku aku aku. Jika kedua dan adalah sempurna dengan model aditif, maka adalah bicluster berkorelasi sempurna. X I J C J X I J R I C J X I J
Proposisi ini dapat dengan mudah dibuktikan ...
... tapi tentu saja, mereka tidak membuktikannya.
Saya menggunakan beberapa contoh sederhana di koran plus basis + kode R kustom untuk melihat apakah saya dapat menunjukkan Proposisi ini.
corbic <- matrix(c(0,4,-4,2,2,-2,6,0,4,-8,16,-2,-2,10,-14,4), ncol=4)
(dari Tabel 1F)
beberapa kode kustom untuk mengonversi bentuk X = svd standar ke seperti yang dijelaskan dalam makalah: X = R C T
svdToRC <- function(x, ignoreRank = FALSE, r = length(x$d), zerothresh=1e-9) {
#convert standard SVD decomposed matrices UEV' to RC' form
#x -> output of svd(M)
#r -> rank of matrix (defaults to length of singular values vector)
# but really is the number of non-zero singular values
#ignoreRank -> return the full decomposition (ignore zero singular values)
#zerothresh -> how small is zero?
R <- with(x, t(t(u) * sqrt(d)))
C <- with(x, t(t(v) * sqrt(d)))
if (!ignoreRank) {
ind <- which(x$d >= zerothresh)
} else {
ind <- 1:r
}
return(list(R=as.matrix(R[,ind]), C=as.matrix(C[,ind])))
}
terapkan fungsi ini ke dataset:
> svdToRC(svd(corbic))
$R
[,1] [,2]
[1,] 0.8727254 -0.9497284
[2,] -2.5789775 -1.1784221
[3,] 4.3244283 -0.7210346
[4,] -0.8531261 -1.0640752
$C
[,1] [,2]
[1,] -1.092343 -1.0037767
[2,] 1.223860 -0.9812343
[3,] 3.540063 -0.9586919
[4,] -3.408546 -1.0263191
Kecuali saya berhalusinasi, matriks ini bukan aditif, meskipun corbic menunjukkan korelasi sempurna antara baris dan kolom. Tampaknya aneh bahwa contoh yang mereka berikan tidak memperlihatkan properti yang mereka katakan seharusnya ... kecuali jika saya melewatkan semacam langkah transformasi sebelum atau sesudah DVD?
4iii
mengatakan itu P(R), P(C), additivity => P(X)
? (Saya menyingkat " Y
adalah bicluster sempurna" sebagai P(Y)
). Tampaknya Anda pergi ke arah lain, mengharapkan aditivitas dari kondisi lain. Tolong jelaskan lebih lanjut.
4iii
tidak mengatakan bahwa jika X
adalah berkorelasi sempurna bicluster kemudian R
dan C
akan aditif. Implikasinya mengarah ke arah lain. Sekarang, saya setuju bahwa aneh bahwa contoh yang mereka berikan tampaknya tidak cocok dengan teorema yang ada di sebelahnya. Mungkin ada beberapa informasi lain yang bisa Anda berikan? Apakah ada teorema lain yang mengarah ke arah lain?