Pertanyaan yang diberi tag «python»

Python adalah bahasa pemrograman yang biasa digunakan untuk pembelajaran mesin. Gunakan tag ini untuk setiap * pada topik * pertanyaan yang (a) melibatkan `Python` baik sebagai bagian penting dari pertanyaan atau jawaban yang diharapkan, & (b) bukan * hanya * tentang cara menggunakan` Python`.

2
Implementasi validasi silang bersarang
Saya mencoba mencari tahu apakah pemahaman saya tentang validasi silang bersarang benar, oleh karena itu saya menulis contoh mainan ini untuk melihat apakah saya benar: import operator import numpy as np from sklearn import cross_validation from sklearn import ensemble from sklearn.datasets import load_boston # set random state state = 1 …


1
Nilai variabel tersembunyi regresi linear R "bernilai"
Ini hanya contoh yang saya temui beberapa kali, jadi saya tidak punya data sampel. Menjalankan model regresi linier di R: a.lm = lm(Y ~ x1 + x2) x1adalah variabel kontinu. x2bersifat kategorikal dan memiliki tiga nilai, mis. "Rendah", "Sedang" dan "Tinggi". Namun output yang diberikan oleh R akan menjadi seperti: …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 



1
Bagaimana anak-anak mengatur untuk mengumpulkan orang tua mereka dalam proyeksi PCA dari kumpulan data GWAS?
Ambil 20 titik acak dalam ruang 10.000 dimensi dengan setiap koordinat iid dari . Bagi mereka menjadi 10 pasangan ("pasangan") dan tambahkan rata-rata setiap pasangan ("anak") ke dataset. Kemudian lakukan PCA pada 30 poin yang dihasilkan dan plot PC1 vs PC2.N(0,1)N(0,1)\mathcal N(0,1) Suatu hal yang luar biasa terjadi: setiap "keluarga" …

1
Menghasilkan angka acak dari "distribusi seragam miring" dari teori matematika
Untuk beberapa tujuan, saya perlu menghasilkan angka acak (data) dari distribusi "seragam miring". "Kemiringan" dari distribusi ini dapat bervariasi dalam beberapa interval yang masuk akal, dan kemudian distribusi saya harus berubah dari seragam menjadi segitiga berdasarkan pada kemiringan. Inilah derivasi saya: Mari kita membuatnya sederhana dan menghasilkan data dari hingga …

2
Bagaimana Anda memvisualisasikan corong yang disegmentasi? (dan bisakah Anda melakukannya dengan Python?)
Saya melihat pos ini di Moz yang menyajikan saluran pemasaran tersegmentasi: Hal semacam ini akan memiliki nilai yang cukup besar dalam pekerjaan saya. Apa yang saya tidak tahu adalah bagaimana memvisualisasikan data mentah untuk menampilkan saluran tersegmentasi seperti ini. Idenya adalah bahwa arahan penjualan berasal dari sumber yang berbeda (yang …


2
Bagaimana agar sesuai dengan regresi seperti di R?
Saya punya beberapa data deret waktu di mana variabel yang diukur adalah bilangan bulat positif (jumlah). Saya ingin menguji apakah ada tren naik dari waktu ke waktu (atau tidak). Variabel independen (x) berada dalam kisaran 0-500 dan variabel dependen (y) berada dalam kisaran 0-8. Saya pikir saya menjawab ini dengan …
9 r  regression  python 

2
Menilai puncak dalam rangkaian waktu data sinyal sel
Saya mengukur keberadaan respons dalam pengukuran sinyal sel. Apa yang saya lakukan adalah pertama-tama menerapkan algoritma perataan (Hanning) ke deret waktu data, lalu mendeteksi puncak. Yang saya dapatkan adalah ini: Jika saya ingin membuat deteksi respon sedikit lebih objektif daripada "ya Anda melihat kenaikan dalam penurunan terus menerus", apa yang …

5
Menghitung persentil dari distribusi normal
Lihat halaman Wikipedia ini: http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Agresti-Coull_Interval Untuk mendapatkan Interval Agresti-Coull, kita perlu menghitung persentil dari distribusi normal, yang disebut . Bagaimana cara menghitung persentil itu? Apakah ada fungsi siap pakai yang melakukan ini di Wolfram Mathematica dan / atau Python / NumPy / SciPy?zzz

2
Optimalkan SVM untuk menghindari false-negative dalam klasifikasi biner
Saya melatih classifier biner SVM menggunakan Scikit belajar. Karena sifat masalah saya, saya perlu menghindari negatif palsu. Karena tidak ada yang gratis, saya oke mendapatkan tingkat positif palsu yang lebih tinggi untuk mengurangi jumlah negatif palsu. Bagaimana kita bisa melakukan itu (idealnya dengan Scikit belajar)? Dengan kata lain, bagaimana kita …

2
Bagaimana menyiapkan interaksi variabel kategorikal dalam scikit-learning?
Apa cara terbaik untuk mempersiapkan interaksi fitur-fitur kategorikal sebelum disesuaikan dengan scikit-learn? Dengan statsmodelssaya bisa dengan mudah mengatakan dalam gaya R smf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()(sama di Stata dengan regress depvar i.var1##i.var2). Bisakah sklearn.preprocessing.PolynomialFeatures(dalam v0.15, saat ini dev) digunakan dengan variabel kategori?


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.