Pertanyaan yang diberi tag «scikit-learn»

Scikit-belajar adalah modul Python yang terdiri dari alat sederhana dan efisien untuk pembelajaran mesin, penambangan data dan analisis data. Itu dibangun di atas NumPy, SciPy, dan matplotlib. Ini didistribusikan di bawah lisensi 3-Clause BSD.

3
Hubungan antara belit dalam matematika dan CNN
Saya sudah membaca penjelasan konvolusi dan memahaminya sampai batas tertentu. Adakah yang bisa membantu saya memahami bagaimana operasi ini berhubungan dengan konvolusi dalam Jaring Saraf Konvolusional? Apakah fungsi seperti filter gyang menerapkan bobot?
10 machine-learning  neural-network  deep-learning  cnn  convolution  machine-learning  ensemble-modeling  machine-learning  classification  data-mining  clustering  machine-learning  feature-selection  convnet  pandas  graphs  ipython  machine-learning  apache-spark  multiclass-classification  naive-bayes-classifier  multilabel-classification  machine-learning  data-mining  dataset  data-cleaning  data  machine-learning  data-mining  statistics  correlation  machine-learning  data-mining  dataset  data-cleaning  data  beginner  career  python  r  visualization  machine-learning  data-mining  nlp  stanford-nlp  dataset  linear-regression  time-series  correlation  anomaly-detection  ensemble-modeling  data-mining  machine-learning  python  data-mining  recommender-system  machine-learning  cross-validation  model-selection  scoring  prediction  sequential-pattern-mining  categorical-data  python  tensorflow  image-recognition  statistics  machine-learning  data-mining  predictive-modeling  data-cleaning  preprocessing  classification  deep-learning  tensorflow  machine-learning  algorithms  data  keras  categorical-data  reference-request  loss-function  classification  logistic-regression  apache-spark  prediction  naive-bayes-classifier  beginner  nlp  word2vec  vector-space-models  scikit-learn  decision-trees  data  programming 

3


1
Data yang tidak seimbang menyebabkan kesalahan klasifikasi pada dataset multiclass
Saya sedang mengerjakan klasifikasi teks di mana saya memiliki 39 kategori / kelas dan 8,5 juta catatan. (Dalam data dan kategori masa depan akan meningkat). Struktur atau format data saya adalah sebagai berikut. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | …

4
Menafsirkan Pohon Keputusan dalam konteks kepentingan fitur
Saya mencoba memahami bagaimana memahami sepenuhnya proses pengambilan keputusan dari model klasifikasi pohon keputusan yang dibangun dengan sklearn. 2 aspek utama yang saya lihat adalah representasi graphviz dari pohon dan daftar fitur penting. Yang tidak saya mengerti adalah bagaimana pentingnya fitur ditentukan dalam konteks pohon. Sebagai contoh, berikut adalah daftar …

3
Ekspor bobot (formula) dari Regulator Hutan Acak di Scikit-Learn
Saya melatih model prediksi dengan Scikit Learn in Python (Random Forest Regressor) dan saya ingin mengekstraksi bobot setiap fitur untuk membuat alat excel untuk prediksi manual. Satu-satunya hal yang saya temukan adalah model.feature_importances_tetapi tidak membantu. Apakah ada cara untuk mencapainya? def performRandomForest(X_train, y_train, X_test, y_test): '''Perform Random Forest Regression''' from …

1
Pilihan fitur untuk Support Vector Machines
Pertanyaan saya tiga kali lipat Dalam konteks mesin dukungan vektor "Kernel" Apakah pemilihan variabel / fitur diinginkan - terutama karena kita mengatur parameter C untuk mencegah overfitting dan motif utama di balik memperkenalkan kernel ke SVM adalah untuk meningkatkan dimensi masalah, dalam kasus seperti itu mengurangi dimensi dengan pengurangan parameter …

2
Apakah ada metode yang berlawanan dengan reduksi dimensi?
Saya baru dalam bidang pembelajaran mesin, tetapi telah melakukan bagian saya dalam pemrosesan sinyal. Harap beri tahu saya jika pertanyaan ini salah diberi label. Saya memiliki data dua dimensi yang didefinisikan oleh setidaknya tiga variabel, dengan model yang sangat non-linier terlalu rumit untuk disimulasikan. Saya memiliki berbagai tingkat keberhasilan dalam …

1
Bisakah pelatihan label kepercayaan diri digunakan untuk meningkatkan akurasi prediksi?
Saya memiliki data pelatihan yang diberi label dengan nilai biner. Saya juga telah mengumpulkan kepercayaan dari masing-masing label ini yaitu 0,8 keyakinan akan berarti bahwa 80% dari pekerja manusia setuju pada label itu. Apakah mungkin untuk menggunakan data kepercayaan ini untuk meningkatkan akurasi classifier saya? Akankah cara berikut ini berhasil? …

2
Cara melatih model untuk memprediksi acara 30 menit sebelumnya, dari jadwal waktu multi-dimensi
Para ahli di bidang saya mampu memprediksi kemungkinan kejadian (binary spike yellow) 30 menit sebelum itu terjadi . Frekuensi di sini adalah 1 detik, tampilan ini mewakili beberapa jam nilai data, saya telah dilingkari hitam di mana pola "jahat" seharusnya . Interaksi antara dimensi ada, oleh karena itu dimensi tidak …

2
Mengapa regresi Gradient Boosting memprediksi nilai negatif ketika tidak ada nilai y negatif di set pelatihan saya?
Seperti yang saya meningkatkan jumlah pohon di scikit belajar 's GradientBoostingRegressor, saya mendapatkan prediksi yang lebih negatif, meskipun tidak ada nilai negatif dalam pelatihan saya atau pengujian set. Saya memiliki sekitar 10 fitur, yang sebagian besar adalah biner. Beberapa parameter yang saya tuning adalah: jumlah pohon / iterasi; kedalaman belajar; …

3
Validasi silang bersarang dan memilih model regresi terbaik - apakah ini proses SKLearn yang tepat?
Jika saya mengerti dengan benar, nested-CV dapat membantu saya mengevaluasi model dan proses penyetelan hyperparameter apa yang terbaik. Loop dalam ( GridSearchCV) menemukan hyperparameter terbaik, dan loop outter ( cross_val_score) mengevaluasi algoritma tuning hyperparameter. Saya kemudian memilih yang tuning / model combo dari loop luar yang meminimalkan mse(Saya sedang melihat …

1
sklearn - masalah overfitting
Saya mencari rekomendasi untuk cara terbaik ke depan untuk masalah pembelajaran mesin saya saat ini Garis besar masalah dan apa yang telah saya lakukan adalah sebagai berikut: Saya memiliki 900+ uji coba data EEG, di mana setiap uji coba berdurasi 1 detik. Kebenaran dasar diketahui untuk masing-masing dan mengklasifikasikan status …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.