Pertanyaan yang diberi tag «eda»

EDA adalah singkatan dari "Exploratory data analysis". Dikembangkan oleh Tukey untuk kontras dengan Analisis Data Konfirmatori atau CDA (pengujian formal hipotesis). EDA biasanya berkaitan dengan menggambarkan data secara numerik dan grafis untuk membuat data lebih mudah dipahami dan menghasilkan wawasan baru.

5
Apakah lebih baik melakukan analisis data eksplorasi hanya pada set data pelatihan?
Saya sedang melakukan analisis data eksplorasi (EDA) pada dataset. Kemudian saya akan memilih beberapa fitur untuk memprediksi variabel dependen. Pertanyaannya adalah: Apakah saya harus melakukan EDA hanya pada dataset pelatihan saya? Atau haruskah saya bergabung dengan pelatihan dan menguji kumpulan data kemudian melakukan EDA pada keduanya dan memilih fitur berdasarkan …

2
Apakah ada perbedaan dalam pendekatan Bayesian dan sering untuk EDA?
Sederhananya: Apakah ada perbedaan dalam pendekatan Bayesian dan Frequentist untuk Analisis Data Eksplorasi? Saya tahu tidak ada bias yang melekat dalam metode EDA sebagai histogram adalah histogram, sebar sebar adalah sebar sebar, dll, juga tidak saya menemukan contoh perbedaan dalam bagaimana EDA diajarkan atau disajikan (mengabaikan makalah teoretis khusus oleh …



4
Cara terbaik untuk mengumpulkan dan menganalisis data
Baru-baru ini mulai mengajar diri saya sendiri Pembelajaran Mesin dan Analisis Data, saya mendapati diri saya membentur dinding bata pada kebutuhan untuk membuat dan menanyakan set data yang besar. Saya ingin mengambil data yang telah saya kumpulkan dalam kehidupan profesional dan pribadi saya dan menganalisisnya tetapi saya tidak yakin cara …

2
Perbedaan antara analisis faktor eksploratori dan konfirmasi dalam menentukan independensi konstruk
Para peneliti sering menggunakan dua ukuran yang memiliki item yang sangat mirip dan berpendapat bahwa mereka mengukur hal-hal yang berbeda (misalnya, "Saya selalu khawatir ketika saya berada di sekitar mobil"; "Saya takut mobil"). Mari kita memanggil langkah-langkah hipotetis Ketakutan Mobil Mengukur dan Kecemasan dari Skala Mobil. Saya tertarik untuk menguji …

2
Jika histogram saya menunjukkan kurva berbentuk lonceng, dapatkah saya mengatakan bahwa data saya terdistribusi secara normal?
Saya membuat histogram untuk Usia Responden dan berhasil mendapatkan kurva berbentuk lonceng yang sangat bagus, dari mana saya menyimpulkan bahwa distribusinya normal. Kemudian saya menjalankan tes normalitas di SPSS, dengan n = 169. Nilai p (Sig.) Dari tes Kolmogorov-Smirnov kurang dari 0,05 sehingga data telah melanggar asumsi normalitas. Mengapa tes …

1
Bagaimana menafsirkan plot kotak berlekuk
Sambil melakukan beberapa EDA saya memutuskan untuk menggunakan plot kotak untuk menggambarkan perbedaan antara dua tingkat faktor. Cara ggplot membuat plot kotak cukup memuaskan, tetapi sedikit sederhana (plot pertama di bawah). Sementara meneliti karakteristik plot kotak saya mulai bereksperimen dengan takik. Saya mengerti takik menampilkan CI di sekitar median, dan …

2
Apa yang dimaksud dengan “Biarkan data berbicara sendiri”?
Saat membaca makalah berikut , saya menemukan pernyataan berikut: Seperti yang disebutkan, sering disajikan tanpa referensi ke model probabilistik, sejalan dengan ide Benzecri [1973] untuk "membiarkan data berbicara sendiri." (kutipan dari JP Benzécri. L'analyse des données. Tome II: L'analyse des korespondensi. Dunod, 1973.) Dari cara saya membaca makalah ini, kedengarannya …
10 eda  quotation 

3
Sekilas sekilas pada dataset
Maafkan ketidaktahuan saya, tapi ... Saya terus menemukan diri saya dalam situasi, di mana saya dihadapkan dengan sekelompok data baru yang berhasil saya temukan. Data ini biasanya terlihat seperti ini: Date Number1 Number2 Category1 Category2 20120125 11 101 Dog Brown 20120126 21 90 Cat Black 20120126 31 134 Cat Brown …

4
Kiat dan trik untuk memulai dengan pemodelan statistik?
Saya bekerja di bidang penambangan data dan memiliki sekolah formal yang sangat sedikit dalam statistik. Akhir-akhir ini saya telah membaca banyak pekerjaan yang berfokus pada paradigma Bayes untuk pembelajaran dan penambangan, yang menurut saya sangat menarik. Pertanyaan saya adalah (di beberapa bagian), diberikan masalah apakah ada kerangka umum yang memungkinkan …

4
Mengapa fakta bahwa 1 median lebih rendah dari median lain, berarti bahwa sebagian besar di grup 1 kurang dari kebanyakan di grup 2?
Saya percaya bahwa plot kotak di bawah ini dapat diartikan sebagai "kebanyakan pria lebih cepat daripada kebanyakan wanita" (dalam dataset ini), terutama karena waktu rata-rata pria lebih rendah daripada waktu rata-rata wanita. Tapi tentu saja EDX pada R dan statistik kuis mengatakan kepada saya bahwa tidak benar. Tolong bantu saya …

2
Bootstrap parametrik, semiparametrik, dan nonparametrik untuk model campuran
Cangkok berikut diambil dari artikel ini . Saya pemula untuk bootstrap dan mencoba mengimplementasikan bootstrap parametrik, semiparametrik, dan nonparametrik untuk model campuran linier dengan R bootpaket. Kode R Ini Rkode saya : library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

3
Pedoman untuk menemukan pengetahuan baru dalam data
Saya merencanakan sesuatu untuk menunjukkan pada diri sendiri atau orang lain. Biasanya, sebuah pertanyaan memulai proses ini, dan seringkali orang tersebut menanyakan harapan untuk jawaban tertentu. Bagaimana saya bisa belajar hal-hal menarik tentang data dengan cara yang kurang bias? Saat ini saya kira-kira mengikuti metode ini: Statistik ringkasan. Stripchart. Plot …

2
Apakah transformasi data pada data non-normal diperlukan untuk analisis faktor eksplorasi ketika menggunakan metode ekstraksi anjak sumbu utama?
Saya mengembangkan kuesioner untuk mengukur empat faktor yang merupakan spiritualitas, dan saya ingin mengajukan pertanyaan berikut: Apakah transformasi data pada data non-normal diperlukan untuk analisis faktor eksplorasi ketika menggunakan metode ekstraksi anjak sumbu utama? Saya selesai menyaring data saya kemarin, dan saya menemukan bahwa 3 dari 20 pertanyaan condong positif …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.