Pertanyaan yang diberi tag «predictive-modeling»

Teknik statistik yang digunakan untuk memprediksi hasil.

1
Melatih Akurasi vs Akurasi Tes vs Matriks kebingungan
Setelah saya mengembangkan model prediktif saya menggunakan Random Forest saya mendapatkan metrik berikut: Train Accuracy :: 0.9764634601043997 Test Accuracy :: 0.7933284397683713 Confusion matrix [[28292 1474] [ 6128 889]] Ini adalah hasil dari kode ini: training_features, test_features, training_target, test_target, = train_test_split(df.drop(['bad_loans'], axis=1), df['target'], test_size = .3, random_state=12) clf = RandomForestClassifier() trained_model …


1
Analisis log server menggunakan pembelajaran mesin
Saya ditugaskan tugas ini untuk menganalisis log server dari aplikasi kami yang berisi log pengecualian, log basis data, log peristiwa, dll. Saya baru mempelajari mesin, kami menggunakan Spark dengan pencarian elastis dan Sparks MLlib (atau PredictionIO). Contoh yang diinginkan hasilnya akan dapat diprediksi berdasarkan log pengecualian yang dikumpulkan untuk dapat …

2
Bagaimana cara melakukan Regresi Logistik dengan sejumlah besar fitur?
Saya memiliki dataset dengan 330 sampel dan 27 fitur untuk setiap sampel, dengan masalah kelas biner untuk Regresi Logistik. Menurut "aturan jika sepuluh" saya membutuhkan setidaknya 10 peristiwa untuk setiap fitur untuk dimasukkan. Padahal, saya memiliki dataset yang tidak seimbang, dengan 20% kelas positif dan 80% kelas negatif. Itu memberi …

3
Hubungan antara belit dalam matematika dan CNN
Saya sudah membaca penjelasan konvolusi dan memahaminya sampai batas tertentu. Adakah yang bisa membantu saya memahami bagaimana operasi ini berhubungan dengan konvolusi dalam Jaring Saraf Konvolusional? Apakah fungsi seperti filter gyang menerapkan bobot?
10 machine-learning  neural-network  deep-learning  cnn  convolution  machine-learning  ensemble-modeling  machine-learning  classification  data-mining  clustering  machine-learning  feature-selection  convnet  pandas  graphs  ipython  machine-learning  apache-spark  multiclass-classification  naive-bayes-classifier  multilabel-classification  machine-learning  data-mining  dataset  data-cleaning  data  machine-learning  data-mining  statistics  correlation  machine-learning  data-mining  dataset  data-cleaning  data  beginner  career  python  r  visualization  machine-learning  data-mining  nlp  stanford-nlp  dataset  linear-regression  time-series  correlation  anomaly-detection  ensemble-modeling  data-mining  machine-learning  python  data-mining  recommender-system  machine-learning  cross-validation  model-selection  scoring  prediction  sequential-pattern-mining  categorical-data  python  tensorflow  image-recognition  statistics  machine-learning  data-mining  predictive-modeling  data-cleaning  preprocessing  classification  deep-learning  tensorflow  machine-learning  algorithms  data  keras  categorical-data  reference-request  loss-function  classification  logistic-regression  apache-spark  prediction  naive-bayes-classifier  beginner  nlp  word2vec  vector-space-models  scikit-learn  decision-trees  data  programming 

3

2
Kapan harus memilih regresi linier atau Pohon Keputusan atau regresi Hutan Acak? [Tutup]
Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 4 tahun yang lalu . Saya sedang mengerjakan suatu proyek dan saya mengalami kesulitan dalam menentukan algoritma mana yang …
10 machine-learning  algorithms  random-forest  linear-regression  decision-trees  machine-learning  predictive-modeling  forecast  r  clustering  similarity  data-mining  dataset  statistics  text-mining  text-mining  data-cleaning  data-wrangling  machine-learning  classification  algorithms  xgboost  data-mining  dataset  dataset  regression  graphs  svm  unbalanced-classes  cross-validation  optimization  hyperparameter  genetic-algorithms  visualization  predictive-modeling  correlation  machine-learning  predictive-modeling  apache-spark  statistics  normalization  apache-spark  map-reduce  r  correlation  confusion-matrix  r  data-cleaning  classification  terminology  dataset  image-classification  machine-learning  regression  apache-spark  machine-learning  data-mining  nlp  parsing  machine-learning  dimensionality-reduction  visualization  clustering  multiclass-classification  evaluation  unsupervised-learning  machine-learning  machine-learning  data-mining  supervised-learning  unsupervised-learning  machine-learning  data-mining  classification  statistics  predictive-modeling  data-mining  clustering  python  pandas  machine-learning  dataset  data-cleaning  data  bigdata  software-recommendation 

3
Algoritma pembelajaran mesin manakah yang diterima sebagai pertukaran yang baik antara kemampuan menjelaskan dan prediksi?
Teks pembelajaran mesin yang menggambarkan algoritma seperti mesin peningkat gradien atau jaringan saraf sering berkomentar bahwa model-model ini bagus dalam prediksi, tetapi ini harus dibayar dengan hilangnya penjelasan atau interpretabilitas. Sebaliknya, pohon keputusan tunggal dan model regresi klasik diberi label baik dalam penjelasan, tetapi memberikan akurasi prediksi (relatif) buruk dibandingkan …

3
Ekspor bobot (formula) dari Regulator Hutan Acak di Scikit-Learn
Saya melatih model prediksi dengan Scikit Learn in Python (Random Forest Regressor) dan saya ingin mengekstraksi bobot setiap fitur untuk membuat alat excel untuk prediksi manual. Satu-satunya hal yang saya temukan adalah model.feature_importances_tetapi tidak membantu. Apakah ada cara untuk mencapainya? def performRandomForest(X_train, y_train, X_test, y_test): '''Perform Random Forest Regression''' from …

2
Cara melatih model untuk memprediksi acara 30 menit sebelumnya, dari jadwal waktu multi-dimensi
Para ahli di bidang saya mampu memprediksi kemungkinan kejadian (binary spike yellow) 30 menit sebelum itu terjadi . Frekuensi di sini adalah 1 detik, tampilan ini mewakili beberapa jam nilai data, saya telah dilingkari hitam di mana pola "jahat" seharusnya . Interaksi antara dimensi ada, oleh karena itu dimensi tidak …

2
Pembelajaran Mesin Praktik Terbaik untuk Big Dataset
Saya akan lulus dari Master saya dan telah belajar tentang pembelajaran mesin serta melakukan proyek penelitian dengannya. Saya bertanya-tanya tentang praktik terbaik di industri saat melakukan tugas pembelajaran mesin dengan Kumpulan Data Besar (seperti 100-an GB atau TB). Menghargai jika sesama ilmuwan data dapat berbagi pengalaman mereka. Ini pertanyaan saya: …

2
Langkah Pembelajaran Mesin
Manakah dari set pilihan langkah di bawah ini yang benar ketika membuat model prediksi? Pilihan 1: Pertama, hilangkan prediktor yang paling buruk, dan siapkan yang tersisa jika perlu, kemudian latih berbagai model dengan validasi silang, pilih beberapa yang terbaik, identifikasi prediktor teratas yang digunakan masing-masing, kemudian latih kembali model-model tersebut …

1
R - Menafsirkan plot jaringan saraf
Saya tahu ada pertanyaan serupa di stats.SE, tetapi saya tidak menemukan satu yang memenuhi permintaan saya; tolong, sebelum menandai pertanyaan sebagai duplikat, ping saya di komentar. Saya menjalankan jaringan saraf berdasarkan neuralnetperkiraan seri waktu indeks SP500 dan saya ingin memahami bagaimana saya bisa menafsirkan plot yang diposting di bawah ini: …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.