Pertanyaan yang diberi tag «genetics»

Studi ilmiah tentang prinsip hereditas dan variasi sifat yang diwariskan di antara organisme terkait.

6
Pemilihan fitur untuk model "final" saat melakukan validasi silang dalam pembelajaran mesin
Saya agak bingung tentang pemilihan fitur dan pembelajaran mesin dan saya bertanya-tanya apakah Anda dapat membantu saya. Saya memiliki dataset microarray yang diklasifikasikan ke dalam dua kelompok dan memiliki ribuan fitur. Tujuan saya adalah mendapatkan sejumlah kecil gen (fitur saya) (10-20) dalam tanda tangan yang secara teori saya akan dapat …

6
Seberapa besar kemungkinan saya akan diturunkan dari orang yang lahir pada tahun 1300?
Dengan kata lain, berdasarkan hal berikut, apa itu p? Untuk menjadikan ini masalah matematika daripada antropologi atau ilmu sosial, dan untuk menyederhanakan masalah, asumsikan bahwa pasangan dipilih dengan probabilitas yang sama di seluruh populasi, kecuali bahwa saudara kandung dan sepupu pertama tidak pernah kawin, dan pasangan selalu dipilih dari yang …

4
Mengoreksi nilai p untuk beberapa tes di mana tes berkorelasi (genetika)
Saya memiliki nilai p dari banyak tes dan ingin tahu apakah sebenarnya ada sesuatu yang signifikan setelah mengoreksi beberapa pengujian. Komplikasinya: tes saya tidak independen. Metode yang saya pikirkan (varian dari Fisher's Product Method, Zaykin et al., Genet Epidemiol , 2002) membutuhkan korelasi antara nilai-nilai p. Untuk memperkirakan korelasi ini, …

4
Apa nilai yang benar untuk presisi dan mengingat dalam kasus tepi?
Presisi didefinisikan sebagai: p = true positives / (true positives + false positives) Apakah benar bahwa, sebagai true positivesdan false positivespendekatan 0, presisi mendekati 1? Pertanyaan yang sama untuk diingat: r = true positives / (true positives + false negatives) Saat ini saya sedang menerapkan tes statistik di mana saya …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 


1
Bagaimana cara kerja normalisasi kuantil?
In gene expression studies using microarrays, intensity data has to be normalized so that intensities can be compared between individuals, between genes. Conceptually, and algorithmically, how does "quantile normalization" work, and how would you explain this to a non-statistician?

2
Menghitung probabilitas daftar gen tumpang tindih antara seq RNA dan satu set data chip-CHIP
Semoga seseorang di forum ini dapat membantu saya mengatasi masalah mendasar ini dalam studi ekspresi gen. Saya melakukan sekuensing dalam jaringan eksperimental dan kontrol. Saya kemudian memperoleh nilai pengayaan lipat gen dalam sampel eksperimental alih kontrol. Genom referensi memiliki ~ 15.000 gen. 3.000 dari 15.000 gen diperkaya di atas batas …

2
Analisis pengayaan berdasarkan tingkat duplikasi gen
Latar Belakang Biologis Seiring waktu, beberapa spesies tanaman cenderung menggandakan seluruh genomnya, mendapatkan salinan tambahan dari setiap gen. Karena ketidakstabilan pengaturan ini, banyak dari gen-gen ini kemudian dihapus, dan genom menata ulang dirinya sendiri dan menjadi stabil, siap untuk digandakan lagi. Peristiwa duplikasi ini dikaitkan dengan peristiwa spesiasi dan invasi, …

1
Analisis kekuatan untuk analisis kelangsungan hidup
Jika saya berhipotesis bahwa tanda tangan gen akan mengidentifikasi subjek dengan risiko kekambuhan yang lebih rendah, yaitu berkurang 0,5 (rasio bahaya 0,5) tingkat kejadian pada 20% populasi dan saya bermaksud menggunakan sampel dari studi kohort retrospektif. ukuran sampel perlu disesuaikan dengan angka yang tidak sama dalam dua kelompok yang dihipotesiskan? …


2
Soft-thresholding vs. Lasso adu penalti
Saya mencoba untuk meringkas apa yang saya mengerti sejauh ini dalam analisis multivariat yang dihukum dengan set data dimensi tinggi, dan saya masih berjuang melalui mendapatkan definisi yang tepat dari hukuman lunak thresholding vs Lasso (atau ).L1L1L_1 Lebih tepatnya, saya menggunakan regresi PLS jarang untuk menganalisis struktur data 2-blok termasuk …


1
Bagaimana anak-anak mengatur untuk mengumpulkan orang tua mereka dalam proyeksi PCA dari kumpulan data GWAS?
Ambil 20 titik acak dalam ruang 10.000 dimensi dengan setiap koordinat iid dari . Bagi mereka menjadi 10 pasangan ("pasangan") dan tambahkan rata-rata setiap pasangan ("anak") ke dataset. Kemudian lakukan PCA pada 30 poin yang dihasilkan dan plot PC1 vs PC2.N(0,1)N(0,1)\mathcal N(0,1) Suatu hal yang luar biasa terjadi: setiap "keluarga" …

1
Bagaimana cara menghitung Rasio Kesalahan Standar?
Saya memiliki dua set data dari studi asosiasi genome. Satu-satunya informasi yang tersedia adalah rasio odds dan nilai p untuk set data pertama. Untuk set data kedua saya memiliki Odds Ratio, nilai-p dan frekuensi alel (AFD = penyakit, AFC = kontrol) (mis: 0,321). Saya mencoba melakukan meta-analisis data ini tetapi …

4
Bagaimana cara menghitung interval kepercayaan untuk gabungan rasio ganjil dalam meta-analisis?
Saya memiliki dua set data dari studi asosiasi genome. Satu-satunya informasi yang tersedia adalah rasio ganjil dan interval kepercayaan mereka (95%) untuk setiap SNP genotipe. Saya ingin membuat plot hutan yang membandingkan dua rasio odds ini, tetapi saya tidak dapat menemukan cara untuk menghitung interval kepercayaan gabungan untuk memvisualisasikan efek …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.