Pertanyaan yang diberi tag «data-visualization»

Membangun representasi data yang bermakna dan bermanfaat. (Jika pertanyaan Anda hanya tentang cara mendapatkan perangkat lunak tertentu untuk menghasilkan efek tertentu, kemungkinan besar tidak pada topik di sini.)


6
Bagaimana cara mengurangi jumlah titik data dalam satu seri?
Saya belum belajar statistik selama lebih dari 10 tahun (dan kemudian hanya kursus dasar), jadi mungkin pertanyaan saya agak sulit untuk dipahami. Bagaimanapun, apa yang ingin saya lakukan adalah mengurangi jumlah titik data dalam suatu seri. Sumbu x adalah jumlah milidetik sejak dimulainya pengukuran dan sumbu y adalah bacaan untuk …

2
Apakah Paradox Simpson mencakup semua contoh pembalikan dari variabel tersembunyi?
Berikut ini adalah pertanyaan tentang banyak visualisasi yang ditawarkan sebagai 'bukti oleh gambar' tentang keberadaan paradoks Simpson, dan mungkin pertanyaan tentang terminologi. Paradox Simpson adalah fenomena yang cukup sederhana untuk menggambarkan dan memberikan contoh numerik (alasan mengapa ini bisa terjadi adalah dalam dan menarik). Paradoksnya adalah bahwa terdapat tabel kontingensi …

1
Takik plot kotak vs. Interval Tukey-Kramer
Dokumen bantuan "takik" ( atau teks asli ) dari boxplot di 'R' memberikan yang berikut: Jika takik dua plot tidak tumpang tindih ini adalah 'bukti kuat' bahwa kedua median berbeda (Chambers et al, 1983, hal. 62). Lihat boxplot.stats untuk perhitungan yang digunakan. dan ' boxplot.stats ' memberikan yang berikut: Takik …

1
Merencanakan nilai prediksi dalam deret waktu ARIMA di R
Kemungkinan ada lebih dari satu kesalahpahaman serius dalam pertanyaan ini, tetapi ini tidak dimaksudkan untuk membuat perhitungannya benar, tetapi lebih untuk memotivasi pembelajaran deret waktu dengan beberapa fokus dalam pikiran. Dalam mencoba memahami penerapan deret waktu, tampaknya seolah-olah tren data membuat prediksi nilai masa depan menjadi tidak masuk akal. Misalnya, …


1
Apa yang dimaksud dengan PCA hanya mempertahankan jarak berpasangan yang besar?
Saat ini saya membaca tentang teknik visualisasi t-SNE dan disebutkan bahwa salah satu kelemahan menggunakan analisis komponen utama (PCA) untuk memvisualisasikan data dimensi tinggi adalah bahwa ia hanya mempertahankan jarak berpasangan yang besar antara titik-titik. Makna titik-titik yang berjauhan dalam ruang dimensi tinggi juga akan tampak berjauhan dalam subruang dimensi …


3
Pendekatan dan contoh pengelompokan grafik di "R"
Saya mencari untuk mengelompokkan / menggabungkan node dalam grafik menggunakan pengelompokan grafik di 'r'. Ini adalah variasi mainan yang menakjubkan dari masalah saya. Ada dua "cluster" Ada "jembatan" yang menghubungkan cluster Berikut ini adalah jaringan kandidat: Ketika saya melihat jarak koneksi, "hopcount", jika Anda mau, maka saya bisa mendapatkan matriks …

2
Cara memvisualisasikan persentase dibandingkan dengan jumlah entri.
Saya mencoba mencari cara terbaik untuk memvisualisasikan bagan di bawah ini dan menekankan kemanjuran pengobatan sebagaimana diterapkan pada sejumlah pasien yang mencoba pengobatan. Berikut tautan ke halaman yang sebenarnya: http://curetogether.com/cluster-headaches/treatments/ Apa cara terbaik untuk menekankan efektivitas sambil tetap membuatnya mudah untuk membandingkan perawatan dan melihat berapa banyak pasien yang menilai …

3
Bagaimana cara mengekstrak informasi dari matriks sebar ketika Anda memiliki N besar, data diskrit, & banyak variabel?
Saya bermain-main dengan dataset kanker payudara dan membuat sebar semua atribut untuk mendapatkan ide yang paling berpengaruh dalam memprediksi kelas malignant(biru) dari benign(merah). Saya mengerti bahwa baris mewakili sumbu x dan kolom mewakili sumbu y tetapi saya tidak dapat melihat pengamatan apa yang dapat saya lakukan tentang data atau atribut …

1
Memvisualisasikan banyak distribusi miring ke kiri
Saya memiliki serangkaian distribusi miring kiri / berat yang ingin saya perlihatkan. Ada 42 distribusi di tiga faktor (diberi label A, Bdan di Cbawah). Juga, variasi menyusut antar faktor B. Masalah yang saya miliki adalah bahwa distribusinya sulit dibedakan berdasarkan skala hasil (rasio atau lipat-perubahan): Loging data tampaknya terlalu menekankan …

2
Merencanakan statistik ringkasan dengan mean, sd, min, dan maks?
Saya dari latar belakang ekonomi dan biasanya dalam disiplin statistik ringkasan variabel dilaporkan dalam tabel. Namun, saya ingin merencanakannya. Saya bisa memodifikasi plot kotak untuk memungkinkannya menampilkan mean, standar deviasi, minimum dan maksimum tetapi saya tidak ingin melakukannya karena plot kotak secara tradisional digunakan untuk menampilkan median dan Q1 dan …

2
Menjelajahi matriks sebar-plot untuk banyak variabel
Saya menganalisis dataset dengan banyak parameter (katakanlah, 50-200) dan saya tertarik melihat hubungan antara variabel (misalnya dalam hal plot sebar 2-variabel atau histogram 2d). Namun, untuk jumlah parameter ini tampaknya tidak layak untuk menggambar array 200x200 plot (kecuali saya mencetaknya dan menggantung di dinding). Di sisi lain, hanya melakukan matriks …

3
Bagaimana memvisualisasikan kebaikan Bayesian of fit untuk regresi logistik
Untuk masalah regresi logistik Bayesian, saya telah membuat distribusi prediksi posterior. Saya sampel dari distribusi prediktif dan menerima ribuan sampel (0,1) untuk setiap pengamatan yang saya miliki. Memvisualisasikan kebaikan tidak terlalu menarik, misalnya: Plot ini menunjukkan 10 000 sampel + titik datum yang diamati (cara di sebelah kiri dapat melihat …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.