Saya mencoba untuk memvisualisasikan aliran data saya dengan Diagram Sankey di R.
Saya menemukan posting blog ini tertaut ke skrip R yang menghasilkan Diagram Sankey, sayangnya ini cukup mentah dan agak terbatas (lihat di bawah untuk contoh kode dan data).
Adakah yang tahu tentang skrip lain — atau mungkin bahkan sebuah paket — yang lebih berkembang? Tujuan akhir saya adalah untuk memvisualisasikan aliran data dan persentase dengan ukuran relatif komponen diagram, seperti dalam contoh Diagram Sankey ini .
Saya memposting pertanyaan yang agak mirip di daftar r-help , tetapi setelah dua minggu tanpa tanggapan, saya mencoba keberuntungan saya di sini di stackoverflow.
Terima kasih, Eric
PS. Saya mengetahui tentang Parallel Sets Plot , tapi bukan itu yang saya cari.
# thanks to, https://tonybreyal.wordpress.com/2011/11/24/source_https-sourcing-an-r-script-from-github/
sourc.https <- function(url, ...) {
# install and load the RCurl package
if (match('RCurl', nomatch=0, installed.packages()[,1])==0) {
install.packages(c("RCurl"), dependencies = TRUE)
require(RCurl)
} else require(RCurl)
# parse and evaluate each .R script
sapply(c(url, ...), function(u) {
eval(parse(text = getURL(u, followlocation = TRUE,
cainfo = system.file("CurlSSL", "cacert.pem",
package = "RCurl"))), envir = .GlobalEnv)
} )
}
# from https://gist.github.com/1423501
sourc.https("https://raw.github.com/gist/1423501/55b3c6f11e4918cb6264492528b1ad01c429e581/Sankey.R")
# My example (there is another example inside Sankey.R):
inputs = c(6, 144)
losses = c(6,47,14,7, 7, 35, 34)
unit = "n ="
labels = c("Transfers",
"Referrals\n",
"Unable to Engage",
"Consultation only",
"Did not complete the intake",
"Did not engage in Treatment",
"Discontinued Mid-Treatment",
"Completed Treatment",
"Active in \nTreatment")
SankeyR(inputs,losses,unit,labels)
# Clean up my mess
rm("inputs", "labels", "losses", "SankeyR", "sourc.https", "unit")
Diagram Sankey diproduksi dengan kode di atas,