Pertanyaan yang diberi tag «discrete-data»

Mengacu pada data yang dihasilkan dari distribusi yang memiliki ruang sampel yang dapat dihitung. Tag data diskrit dapat mencakup data kategorikal, baik nominal (misalnya distribusi ras dalam sampel individu) atau ordinal (misalnya status sosial ekonomi), atau varian acak diskrit aktual, seperti seperangkat jumlah peristiwa (misalnya, jumlah jumlah kesalahan pada halaman teks). Data diskrit tidak harus berupa bilangan bulat.

2
Apa nama distribusi diskrit ini (persamaan perbedaan rekursif) yang saya peroleh?
Saya menemukan distribusi ini dalam permainan komputer dan ingin belajar lebih banyak tentang perilakunya. Itu datang dari keputusan, apakah suatu peristiwa tertentu harus terjadi setelah sejumlah tindakan pemain. Detail di luar ini tidak relevan. Tampaknya berlaku untuk situasi lain, dan saya merasa menarik karena mudah untuk menghitung dan membuat ekor …

1
Menentukan diskritisasi data yang optimal dari distribusi kontinu
Misalkan Anda memiliki kumpulan data dari distribusi kontinu dengan kepadatan didukung pada yang tidak dikenal, tetapi cukup besar sehingga kepadatan kernel (misalnya) estimasi, , cukup akurat. Untuk aplikasi tertentu saya perlu mengubah data yang diamati ke sejumlah kategori terbatas untuk menghasilkan set data baru dengan fungsi massa tersirat .Y1,...,YnY1,...,YnY_{1}, ..., …


2
Distribusi lebih dari daftar yang diurutkan
Katakanlah kita memiliki daftar barang yang dipesan [a, b, c, ... x, y, z, ...] Saya mencari keluarga distribusi dengan dukungan pada daftar di atas yang diatur oleh beberapa parameter alpha sehingga: Untuk alpha = 0, ia menetapkan probabilitas 1 ke item pertama, a di atas, dan 0 ke yang …


1
Bagaimana cara mencari dan mengevaluasi diskritisasi optimal untuk variabel kontinu dengan kriteria ?
Saya memiliki kumpulan data dengan variabel kontinu dan variabel target biner (0 dan 1). Saya perlu menentukan variabel kontinu (untuk regresi logistik) sehubungan dengan variabel target dan dengan batasan bahwa frekuensi pengamatan dalam setiap interval harus seimbang. Saya mencoba algoritma pembelajaran mesin seperti Chi Merge, pohon keputusan. Chi merge memberi …

1
Data diskrit & alternatif untuk PCA
Saya memiliki dataset variabel diskrit (ordinal, meristik, dan nominal) yang menggambarkan karakter sayap morfologis pada beberapa spesies serangga yang terkait erat. Yang ingin saya lakukan adalah melakukan semacam analisis yang akan memberi saya representasi visual tentang kesamaan spesies yang berbeda berdasarkan karakteristik morfologis. Hal pertama yang muncul di kepala saya …

2
Distribusi pada himpunan bagian dari
Saya ingin tahu apakah ada jenis distribusi standar pada himpunan bilangan bulat . Secara ekuivalen, kita dapat menyatakan ini sebagai distribusi pada vektor panjang dari hasil biner, misalnya jika maka sesuai dengan vektor .{1,2,...,J}{1,2,...,J}\{1, 2, ..., J\}JJJJ=5J=5J = 5{1,3,5}{1,3,5}\{1, 3, 5\}(1,0,1,0,1)(1,0,1,0,1)(1, 0, 1, 0, 1) Idealnya yang saya cari adalah …

1
Fungsi diskrit: Cakupan interval kepercayaan?
Bagaimana cara menghitung cakupan interval diskrit? Apa yang saya tahu bagaimana melakukannya: Jika saya memiliki model kontinu, saya bisa menentukan interval kepercayaan 95% untuk masing-masing nilai prediksi saya, dan kemudian melihat seberapa sering nilai aktual berada dalam interval kepercayaan. Saya mungkin menemukan bahwa hanya 88% dari waktu interval kepercayaan 95% …

1
Lengkapi statistik yang cukup
Saya baru-baru ini mulai mempelajari kesimpulan statistik. Saya telah mengatasi berbagai masalah dan ini membuat saya benar-benar bingung. Misalkan menjadi sampel acak dari distribusi diskrit yang ditetapkan dengan probabilitas nilai , di mana adalah bilangan bulat. Tunjukkan bahwa tidak ada statistik yang cukup lengkap.X1,…,XnX1,…,XnX_1,\dots,X_n1313\frac{1}{3}θ−1, θ, or θ+1θ−1, θ, or θ+1\theta-1,\space\theta,\space\text{or}\space\theta+1θθ\theta …

3
Bagaimana melakukan SVD untuk memasukkan nilai yang hilang, contoh konkret
Saya telah membaca komentar yang bagus mengenai bagaimana menangani nilai yang hilang sebelum menerapkan SVD, tetapi saya ingin tahu cara kerjanya dengan contoh sederhana: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Mengingat matriks di atas, jika saya …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 



2
Kelayakan tes berdasarkan pada variabel acak diskrit
Untuk statistik uji diskrit, distribusi yang sesuai ppp-nilai terpisah dan stokastik lebih besar dari distribusi seragam. Oleh karena itu uji hipotesis yang sesuai berdasarkan nilai-p (menolak jika nilai-p kurang dari 0,05, misalnya) selalu konservatif dalam arti bahwa kemungkinan membuat kesalahan Tipe I akan lebih kecil dari 0,05. Saya tahu kadang-kadang …

1
Interval kepercayaan saat menggunakan teorema Bayes
Saya menghitung beberapa probabilitas bersyarat, dan interval kepercayaan 95% yang terkait. Untuk banyak kasus saya, saya memiliki jumlah xkeberhasilan langsung dari npercobaan (dari tabel kontingensi), sehingga saya dapat menggunakan interval kepercayaan Binomial, seperti yang disediakan oleh binom.confint(x, n, method='exact')in R. Namun dalam kasus lain, saya tidak memiliki data seperti itu, …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.