Pertanyaan yang diberi tag «dataset»

Permintaan kumpulan data di luar topik di situs ini. Gunakan tag ini untuk pertanyaan tentang membuat, memproses, atau memelihara set data.


25
Menemukan sampel data yang tersedia secara bebas
Saya telah bekerja pada metode baru untuk menganalisis dan mengurai dataset untuk mengidentifikasi dan mengisolasi subkelompok populasi tanpa mengetahui karakteristik subkelompok mana pun. Sementara metode ini bekerja cukup baik dengan sampel data buatan (yaitu kumpulan data yang dibuat khusus untuk tujuan mengidentifikasi dan memisahkan subset populasi), saya ingin mencoba mengujinya …

6
Tes pemeriksaan data penting
Dalam peran pekerjaan saya, saya sering bekerja dengan kumpulan data orang lain, non-pakar membawakan saya data klinis dan saya membantu mereka untuk meringkasnya dan melakukan tes statistik. Masalah yang saya miliki adalah bahwa dataset yang saya bawa hampir selalu penuh dengan kesalahan ketik, inkonsistensi, dan segala macam masalah lainnya. Saya …

8
Bagaimana cara mensimulasikan data yang memenuhi kendala spesifik seperti memiliki rata-rata spesifik dan standar deviasi?
Pertanyaan ini dimotivasi oleh pertanyaan saya tentang meta-analisis . Tapi saya membayangkan bahwa itu juga akan berguna dalam konteks pengajaran di mana Anda ingin membuat dataset yang persis mencerminkan dataset yang sudah ada diterbitkan. Saya tahu cara menghasilkan data acak dari distribusi yang diberikan. Jadi misalnya, jika saya membaca tentang …

3
API data / umpan tersedia sebagai paket di R
EDIT: Tampilan tugas Teknologi dan Layanan Web CRAN berisi daftar sumber data dan API yang jauh lebih komprehensif yang tersedia di R. Anda dapat mengirimkan permintaan tarik di github jika Anda ingin menambahkan paket ke tampilan tugas. Saya membuat daftar berbagai umpan data yang sudah terhubung ke R atau yang …
53 r  references  dataset 

3
Interpretasi dari prediktor dan / atau respons yang diubah log
Saya bertanya-tanya apakah itu membuat perbedaan dalam interpretasi apakah hanya dependen, baik dependen dan independen, atau hanya variabel independen yang ditransformasikan log. Pertimbangkan kasus log(DV) = Intercept + B1*IV + Error Saya bisa menafsirkan IV sebagai peningkatan persen tetapi bagaimana ini berubah ketika saya punya log(DV) = Intercept + B1*log(IV) …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

9
Dataset kecil (nyata) untuk memberikan contoh di kelas?
Ketika mengajar kelas tingkat pengantar, para guru yang saya kenal cenderung untuk menciptakan sejumlah angka dan sebuah cerita untuk memberikan contoh metode yang mereka ajarkan. Yang saya inginkan adalah menceritakan kisah nyata dengan angka nyata. Namun, kisah-kisah ini perlu dihubungkan dengan dataset yang sangat kecil, yang memungkinkan perhitungan manual. Setiap …





5
Bagaimana jika data regresi linier saya mengandung beberapa hubungan linier co-mingled?
Katakanlah saya sedang mempelajari bagaimana bunga bakung merespons berbagai kondisi tanah. Saya telah mengumpulkan data tentang pH tanah versus ketinggian matang bakung. Saya mengharapkan hubungan linier, jadi saya menjalankan regresi linier. Namun, saya tidak menyadari ketika saya memulai penelitian saya bahwa populasi sebenarnya mengandung dua varietas bakung, yang masing-masing merespon …


2
Melakukan tes statistik setelah memvisualisasikan data - pengerukan data?
Saya akan mengajukan pertanyaan ini melalui contoh. Misalkan saya memiliki satu set data, seperti set data harga perumahan boston, di mana saya memiliki variabel kontinu dan kategori. Di sini, kami memiliki variabel "kualitas", dari 1 hingga 10, dan harga jual. Saya dapat memisahkan data menjadi rumah-rumah berkualitas "rendah", "sedang" dan …

3
Memvisualisasikan persimpangan banyak set
Apakah ada model visualisasi yang bagus untuk menunjukkan persimpangan tumpang tindih banyak set? Saya sedang memikirkan sesuatu seperti diagram Venn, tetapi entah bagaimana itu dapat memberikan lebih banyak jumlah set yang lebih besar seperti 10 atau lebih. Wikipedia memang menunjukkan beberapa diagram Venn set yang lebih tinggi tetapi bahkan 4 …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.