Pertanyaan yang diberi tag «python»

Python adalah bahasa pemrograman yang biasa digunakan untuk pembelajaran mesin. Gunakan tag ini untuk setiap * pada topik * pertanyaan yang (a) melibatkan `Python` baik sebagai bagian penting dari pertanyaan atau jawaban yang diharapkan, & (b) bukan * hanya * tentang cara menggunakan` Python`.

25
Python sebagai meja kerja statistik
Banyak orang menggunakan alat utama seperti Excel atau spreadsheet lain, SPSS, Stata, atau R untuk kebutuhan statistik mereka. Mereka mungkin beralih ke beberapa paket khusus untuk kebutuhan yang sangat khusus, tetapi banyak hal dapat dilakukan dengan spreadsheet sederhana atau paket statistik umum atau lingkungan pemrograman statistik. Saya selalu menyukai Python …
355 r  spss  stata  python 

4
Berapa ukuran batch dalam jaringan saraf?
Saya menggunakan Python Keras packageuntuk jaringan saraf. Ini tautannya . Apakah batch_sizesama dengan jumlah sampel uji? Dari Wikipedia, kami memiliki informasi ini : Namun, dalam kasus lain, mengevaluasi jumlah-gradien mungkin memerlukan evaluasi mahal dari gradien dari semua fungsi puncak. Ketika set pelatihan sangat besar dan tidak ada rumus sederhana, mengevaluasi …

2
Apa yang dimaksud dengan lapisan embedding dalam jaringan saraf?
Di banyak perpustakaan jaringan saraf, ada 'lapisan embedding', seperti di Keras atau Lasagne . Saya tidak yakin saya mengerti fungsinya, meskipun membaca dokumentasi. Misalnya, dalam dokumentasi Keras tertulis: Ubah bilangan bulat positif (indeks) menjadi vektor padat ukuran tetap, misalnya. [[4], [20]] -> [[0,25, 0,1], [0,6, -0,2]] Bisakah orang yang berpengetahuan …

3
Contoh: regresi LASSO menggunakan glmnet untuk hasil biner
Saya mulai mencoba-coba penggunaan glmnetdengan LASSO Regression di mana hasil yang saya minati menjadi dikotomis. Saya telah membuat bingkai data mock kecil di bawah ini: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, …
78 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

1
Bagaimana cara membagi dataset untuk validasi silang, kurva pembelajaran, dan evaluasi akhir?
Apa strategi yang tepat untuk memisahkan dataset? Saya meminta umpan balik pada pendekatan berikut (tidak pada parameter individu seperti test_sizeatau n_iter, tetapi jika saya menggunakan X, y, X_train, y_train, X_test, dan y_testtepat dan jika urutan masuk akal): (memperluas contoh ini dari dokumentasi scikit-learn) 1. Muat dataset from sklearn.datasets import load_digits …

9
Algoritma apa yang harus saya gunakan untuk mendeteksi anomali pada deret waktu?
Latar Belakang Saya bekerja di Pusat Operasi Jaringan, kami memantau sistem komputer dan kinerjanya. Salah satu metrik utama untuk dipantau adalah sejumlah pengunjung \ pelanggan yang saat ini terhubung ke server kami. Untuk membuatnya terlihat, kami (tim Ops) mengumpulkan metrik seperti data deret waktu dan menggambar grafik. Graphite memungkinkan kita …

5
Apa fungsi kerugian untuk tugas klasifikasi multi-kelas, multi-label dalam jaringan saraf?
Saya melatih jaringan saraf untuk mengklasifikasikan satu set objek menjadi n-kelas. Setiap objek dapat menjadi milik beberapa kelas sekaligus (multi-class, multi-label). Saya membaca bahwa untuk masalah multi-kelas umumnya direkomendasikan untuk menggunakan softmax dan entropi lintas kategorikal sebagai fungsi kerugian alih-alih mse dan saya kurang lebih mengerti mengapa. Untuk masalah saya …

9
Bagaimana R dan Python saling melengkapi dalam ilmu data?
Dalam banyak tutorial atau manual, narasi tampaknya menyiratkan bahwa R dan python hidup berdampingan sebagai komponen pelengkap dari proses analisis. Tetapi bagi saya yang tidak terlatih, tampaknya kedua bahasa itu melakukan hal yang sama. Jadi pertanyaan saya adalah apakah ada ceruk khusus untuk dua bahasa atau apakah itu hanya preferensi …
54 r  python  software 

10
Pembelajaran Mesin menggunakan Python
Saya mempertimbangkan untuk menggunakan pustaka Python untuk melakukan eksperimen Machine Learning saya. Sejauh ini, saya mengandalkan WEKA, tetapi secara keseluruhan tidak puas. Ini terutama karena saya menemukan WEKA tidak begitu didukung (sangat sedikit contoh, dokumentasi jarang dan dukungan masyarakat kurang dari yang diinginkan dalam pengalaman saya), dan telah menemukan diri …


5
Bagaimana cara menafsirkan bobot fitur SVM?
Saya mencoba menafsirkan bobot variabel yang diberikan dengan memasang SVM linear. (Saya menggunakan scikit-learn ): from sklearn import svm svm = svm.SVC(kernel='linear') svm.fit(features, labels) svm.coef_ Saya tidak dapat menemukan apa pun dalam dokumentasi yang secara khusus menyatakan bagaimana bobot ini dihitung atau ditafsirkan. Apakah tanda bobot itu ada hubungannya dengan …

2
Panda / Statsmodel / Scikit-belajar
Apakah Pandas, Statsmodels, dan Scikit-mempelajari berbagai implementasi pembelajaran mesin / statistik yang berbeda, atau apakah ini saling melengkapi satu sama lain? Manakah dari ini yang memiliki fungsi paling komprehensif? Yang mana yang dikembangkan dan / atau didukung secara aktif? Saya harus menerapkan regresi logistik. Adakah saran untuk yang mana yang …

6
Mengapa saya mendapatkan pohon keputusan akurasi 100%?
Saya mendapatkan akurasi 100% untuk pohon keputusan saya. Apa yang saya lakukan salah? Ini kode saya: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import train_test_split x_train = x[0:2635] x_test …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.