Pertanyaan yang diberi tag «eda»

EDA adalah singkatan dari "Exploratory data analysis". Dikembangkan oleh Tukey untuk kontras dengan Analisis Data Konfirmatori atau CDA (pengujian formal hipotesis). EDA biasanya berkaitan dengan menggambarkan data secara numerik dan grafis untuk membuat data lebih mudah dipahami dan menghasilkan wawasan baru.

24
Aturan praktis untuk statistik "modern"
Saya suka buku G van Belle tentang Aturan Statistik Thumb , dan pada tingkat lebih rendah Kesalahan Umum dalam Statistik (dan Cara Menghindari Mereka) dari Phillip I Good dan James W. Hardin. Mereka mengatasi perangkap umum ketika menafsirkan hasil dari studi eksperimental dan pengamatan dan memberikan rekomendasi praktis untuk inferensi …

6
Apakah ada alasan bagus untuk menggunakan PCA dan bukannya EFA? Juga, dapatkah PCA menjadi pengganti untuk analisis faktor?
Dalam beberapa disiplin ilmu, PCA (analisis komponen utama) secara sistematis digunakan tanpa justifikasi, dan PCA dan EFA (analisis faktor eksplorasi) dianggap sebagai sinonim. Karena itu saya baru-baru ini menggunakan PCA untuk menganalisis hasil studi validasi skala (21 item pada skala Likert 7 poin, diasumsikan menyusun 3 faktor masing-masing 7 item) …


8
Fungsi gambaran umum data (ringkasan) di R
Saya yakin saya telah menemukan fungsi seperti ini dalam paket R sebelumnya, tetapi setelah Googling yang luas, saya tidak dapat menemukannya di mana pun. Fungsi yang saya pikirkan menghasilkan ringkasan grafis untuk variabel yang diberikan padanya, menghasilkan keluaran dengan beberapa grafik (histogram dan mungkin kotak dan kumis plot) dan beberapa …

5
Data "eksplorasi" vs data "mengintai" / "menyiksa"?
Sering kali saya menemukan peringatan informal terhadap "pengintaian data" (inilah salah satu contoh yang lucu ), dan saya pikir saya memiliki ide intuitif tentang kira-kira apa artinya itu, dan mengapa itu mungkin menjadi masalah. Di sisi lain, "analisis data eksplorasi" tampaknya menjadi prosedur yang sangat terhormat dalam statistik, setidaknya dinilai …

4
Sudahkah jurnal Science mendukung Analisis Garden of Forking Pathes?
Gagasan analisis data adaptif adalah Anda mengubah rencana Anda untuk menganalisis data saat Anda belajar lebih banyak tentangnya. Dalam kasus analisis data eksplorasi (EDA), ini umumnya merupakan ide yang baik (Anda sering mencari pola yang tidak terduga dalam data), tetapi untuk studi konfirmasi, ini diterima secara luas sebagai metode analisis …

2
Bagaimana cara mengatasi analisis data eksplorasi dan pengerukan data dalam studi sampel kecil?
Analisis data eksplorasi (EDA) sering mengarah untuk mengeksplorasi "trek" lain yang tidak harus milik set hipotesis awal. Saya menghadapi situasi seperti itu dalam studi dengan ukuran sampel terbatas dan banyak data yang dikumpulkan melalui kuesioner yang berbeda (data sosio-demografi, skala neuropsikologis atau medis - misalnya, fungsi mental atau fisik, tingkat …


6
Kekeliruan penembak jitu Texas dalam analisis data eksplorasi
Saya sedang membaca artikel ini di Nature di mana beberapa fallacy dijelaskan dalam konteks analisis data. Saya perhatikan bahwa kesalahan penembak jitu Texas sangat sulit untuk dihindari: Perangkap kognitif yang menunggu selama analisis data diilustrasikan oleh dongeng penembak jitu Texas: penembak jitu tidak kompeten yang menembakkan pola acak peluru di …
23 eda  fallacy 

5
Apa yang harus dipelajari setelah Casella & Berger?
Saya seorang siswa lulusan matematika murni dengan sedikit latar belakang dalam matematika terapan. Sejak musim gugur yang lalu saya telah mengambil kelas di buku Casella & Berger, dan saya telah menyelesaikan ratusan (230+) halaman masalah latihan dalam buku ini. Saat ini saya di Bab 10. Namun, karena saya belum mengambil …

5
Bagaimana cara menjaga analisis eksplorasi dataset besar?
Ketika saya memulai analisis eksplorasi pada set data besar (banyak sampel, banyak variabel), saya sering menemukan diri saya dengan ratusan variabel turunan, dan ton plot yang berbeda, dan tidak ada cara nyata untuk melacak apa yang terjadi di mana. Kode berakhir seperti spaghetti, karena tidak ada arah sejak awal ... …

1
Apa "efek tapal kuda" dan / atau "efek lengkungan" dalam analisis PCA / korespondensi?
Ada banyak teknik dalam statistik ekologi untuk analisis data eksplorasi data multidimensi. Ini disebut teknik 'penahbisan'. Banyak yang sama atau terkait erat dengan teknik umum di tempat lain dalam statistik. Mungkin contoh prototipikal akan menjadi analisis komponen utama (PCA). Ahli ekologi mungkin menggunakan PCA, dan teknik terkait, untuk mengeksplorasi 'gradien' …

8
Gagasan untuk perangkat lunak "lab notebook"?
Jadi ini cocok aneh, meskipun sebenarnya saya pikir ini cocok aneh untuk situs mana pun, jadi saya pikir saya akan mencobanya di sini, di antara saudara-saudara saya yang data-crunching-nya. Saya datang ke epidemiologi dan biostatistik dari biologi, dan masih memiliki kebiasaan dari bidang itu. Salah satunya adalah menyimpan buku catatan …

2
Bagaimana melakukan analisis data eksplorasi untuk memilih algoritma pembelajaran mesin yang sesuai
Kami sedang mempelajari pembelajaran mesin melalui Machine Learning: A Probabilistic Perspective (Kevin Murphy). Sementara teks menjelaskan landasan teoretis dari masing-masing algoritma, ia jarang mengatakan dalam kasus apa algoritma yang lebih baik, dan ketika itu, tidak mengatakan bagaimana mengatakan dalam kasus apa saya masuk. Sebagai contoh, untuk pilihan kernel, saya telah …

5
Cara yang baik untuk menampilkan banyak data secara grafis
Saya sedang mengerjakan proyek yang melibatkan 14 variabel dan 345.000 pengamatan untuk data perumahan (hal-hal seperti tahun dibangun, rekaman persegi, harga jual, wilayah tempat tinggal, dll). Saya prihatin dengan mencoba menemukan teknik grafis yang baik dan perpustakaan R yang berisi teknik merencanakan yang bagus. Saya sudah melihat apa yang di …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.