Pertanyaan yang diberi tag «python»

Python adalah bahasa pemrograman yang biasa digunakan untuk pembelajaran mesin. Gunakan tag ini untuk setiap * pada topik * pertanyaan yang (a) melibatkan `Python` baik sebagai bagian penting dari pertanyaan atau jawaban yang diharapkan, & (b) bukan * hanya * tentang cara menggunakan` Python`.

2
Mengapa kumpulan data ini tidak memiliki kovarian?
Pemahaman saya tentang cara kerja kovarians adalah bahwa data yang berkorelasi harus memiliki kovarians yang agak tinggi. Saya telah menemukan situasi di mana data saya terlihat berkorelasi (seperti yang ditunjukkan dalam plot pencar) tetapi kovariansnya mendekati nol. Bagaimana kovarians data menjadi nol jika dikorelasikan? import numpy as np x1 = …


1
Mereproduksi sosok "Statistik Usia Komputer" dari Efron dan Hastie
Versi ringkas pertanyaan saya (26 Desember 2018) Saya mencoba mereproduksi Gambar 2.2 dari Computer Statistics Statistics Inference oleh Efron dan Hastie, tetapi untuk beberapa alasan yang saya tidak bisa mengerti, jumlahnya tidak sesuai dengan yang ada di buku. Asumsikan kita mencoba untuk memutuskan antara dua kemungkinan fungsi kepadatan probabilitas untuk …


2
Deteksi anomali pada deret waktu
Saya seorang pemula yang menggunakan pembelajaran mesin (saya menyelesaikan kursus Ng), saya menggunakan scikit-learn in python. Saya ingin menemukan cara terbaik untuk mendeteksi anomali di sistem kami. Kami memiliki peristiwa yang sedang berlangsung yang terjadi sesuai jadwal (setiap beberapa menit / jam), dan saya ingin mendeteksi ketika sesuatu yang abnormal …


1
Mesin inferensi variabel
Setelah melakukan beberapa penelitian pada topik, saya telah melihat defisit mengejutkan paket inferensi dan perpustakaan yang bergantung pada pesan-lewat atau metode optimasi untuk Python dan R. Sejauh pengetahuan saya, metode ini sangat berguna. Misalnya, untuk propagasi keyakinan Bayes Network (terarah, asiklik) saja harus mampu memberikan jawaban yang tepat. Namun, sebagian …

2
Mengapa model statistik cocok jika diberi set data yang sangat besar?
Proyek saya saat ini mungkin mengharuskan saya untuk membuat model untuk memprediksi perilaku sekelompok orang tertentu. set data pelatihan hanya berisi 6 variabel (id hanya untuk tujuan identifikasi): id, age, income, gender, job category, monthly spend di mana monthly spendadalah variabel respon. Tetapi dataset pelatihan berisi sekitar 3 juta baris, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 


1
Pas model campuran gaussian menggunakan keturunan gradien stokastik
Saya sedang mengerjakan model pembelajaran kategori online yang menggunakan penurunan gradien stokastik agar sesuai dengan model campuran Gauss. Model ini didasarkan pada model pembelajaran online yang digunakan dalam Toscano & McMurray (2010). Sementara gradient descent kelihatannya bekerja cukup baik untuk memperkirakan rata-rata dan frekuensi / kemungkinan pencampuran kategori, saya mengalami …


4
Menemukan pencilan tanpa mengasumsikan distribusi normal
Saya memiliki kumpulan data berukuran 40-50 poin. Tanpa berasumsi bahwa data terdistribusi normal, saya ingin mencari tahu outlier dengan kepercayaan setidaknya 90%. Saya pikir boxplot bisa menjadi cara yang baik untuk melakukan itu tetapi saya tidak yakin. Setiap bantuan dihargai. Juga dengan implementasi boxplot saya tidak dapat menemukan implementasi yang …

1
Melacak asumsi yang dibuat oleh fungsi ttest_ind () SciPy
Saya mencoba untuk menulis kode Python saya sendiri untuk menghitung t-statistik dan nilai-p untuk satu dan dua uji t independen. Saya dapat menggunakan perkiraan normal, tetapi untuk saat ini saya hanya mencoba menggunakan distribusi-t. Saya tidak berhasil dalam mencocokkan hasil perpustakaan statistik SciPy pada data pengujian saya. Saya bisa menggunakan …

2
Pengujian A / B dengan Python atau R [ditutup]
Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 8 bulan lalu . Pengujian A / B: http://20bits.com/articles/statistic-analysis-and-ab-testing/ http://elem.com/~btilly/effective-ab-testing/ Saya tidak terlalu terbiasa dengan pengujian A / B, tapi saya bertanya-tanya apakah ada paket …
8 r  python  ab-test 

1
Menghitung Wilayah Keyakinan 2D dari Sampel MCMC
Saya ingin memplot wilayah kepercayaan 2D (pada 1-sigma, 2-sigma) untuk model yang sesuai dengan data. Saya telah menggunakan PyMC untuk menghasilkan 50k MCMC sampel posterior untuk model saya dengan 6 parameter. Saya tahu proses untuk membuat wilayah kepercayaan adalah sesuatu yang mirip dengan: 1.) membuat histogram sampel dalam ruang 2D …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.