Statistik dan Big Data classification

2

Berarti (skor) vs Skor (gabungan) dalam validasi silang

TLDR: Dataset saya cukup kecil (120) sampel. Saat melakukan validasi silang 10 kali lipat, haruskah saya: Kumpulkan output dari setiap lipatan tes, gabungkan menjadi vektor, dan kemudian hitung kesalahan pada vektor prediksi penuh ini (120 sampel)? Atau saya harus bukannya menghitung kesalahan pada output saya mendapatkan pada setiap kali lipat …

15 classification cross-validation small-sample

2

Menggabungkan classifier dengan membalik koin

Saya sedang mempelajari kursus pembelajaran mesin dan slide kuliah berisi informasi apa yang saya temukan bertentangan dengan buku yang direkomendasikan. Masalahnya adalah sebagai berikut: ada tiga pengklasifikasi: classifier A memberikan kinerja yang lebih baik di kisaran ambang yang lebih rendah, classifier B memberikan kinerja yang lebih baik dalam rentang ambang …

15 machine-learning probability data-visualization classification roc

4

Klasifikasi dengan data tinggi lemak

Saya perlu melatih classifier linier pada laptop saya dengan ratusan ribu titik data dan sekitar sepuluh ribu fitur. Apa saja pilihan saya? Bagaimana keadaan seni untuk jenis masalah ini? Sepertinya penurunan gradien stokastik adalah arah yang menjanjikan, dan menurut saya ini adalah yang terbaik: "Pegasos: Perkiraan awal Sub-GrAdient SOlver untuk …

15 classification

2

Meningkatnya jumlah fitur menghasilkan penurunan akurasi tetapi peningkatan sebelum / penarikan

Saya baru belajar Mesin. Saat ini saya menggunakan classifier Naive Bayes (NB) untuk mengklasifikasikan teks kecil dalam 3 kelas sebagai positif, negatif atau netral, menggunakan NLTK dan python. Setelah melakukan beberapa tes, dengan dataset yang terdiri dari 300.000 instance (16.924 positif, 7.477 negatif, dan 275.599 netral), saya menemukan bahwa ketika …

15 machine-learning classification naive-bayes precision-recall

5

Apa sumber daya yang baik yang mencakup perbandingan pro dan kontra dari pengklasifikasi yang berbeda?

Apa classifier 2-kelas out-of-the-box terbaik? Ya, saya kira itu adalah pertanyaan jutaan dolar, dan ya, saya menyadari teorema makan siang gratis , dan saya juga membaca pertanyaan sebelumnya: Apa klasifikasi 2-out-of-the-box terbaik untuk aplikasi Anda? dan pengklasifikasi terburuk Tetap saja, saya tertarik membaca lebih banyak tentang masalah ini. Apa sumber …

15 machine-learning classification references

4

Kesamaan statistik dari deret waktu

Seandainya seseorang memiliki deret waktu dari mana seseorang dapat mengambil berbagai pengukuran seperti periode, maksimum, minimum, rata-rata dll. Dan kemudian menggunakannya untuk membuat model gelombang sinus dengan atribut yang sama, adakah pendekatan statistik yang dapat digunakan untuk mengukur seberapa dekat data aktual sesuai dengan model yang diasumsikan? Jumlah titik data …

15 time-series classification

10

Apa klasifikasi 2-out-of-the-box terbaik untuk aplikasi Anda? [Tutup]

Ditutup . Pertanyaan ini didasarkan pada pendapat . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga dapat dijawab dengan fakta dan kutipan dengan mengedit posting ini . Ditutup 3 tahun yang lalu . Aturan: satu classifier per jawaban pilih jika Anda setuju downvote / hapus duplikat. …

15 machine-learning classification application

2

Jaringan saraf vs yang lainnya

Saya belum menemukan jawaban yang memuaskan untuk ini dari google . Tentu saja jika data yang saya miliki adalah urutan jutaan maka pembelajaran mendalam adalah caranya. Dan saya telah membaca bahwa ketika saya tidak memiliki data besar maka mungkin lebih baik menggunakan metode lain dalam pembelajaran mesin. Alasan yang diberikan …

15 regression machine-learning classification neural-networks deep-learning

3

Untuk pengklasifikasi linier, apakah koefisien yang lebih besar menyiratkan fitur yang lebih penting?

Saya seorang insinyur perangkat lunak yang sedang mengerjakan pembelajaran mesin. Dari pemahaman saya, regresi linier (seperti OLS) dan klasifikasi linier (seperti regresi logistik dan SVM) membuat prediksi berdasarkan produk dalam antara koefisien terlatih dan variabel fitur → x :w⃗ w→\vec{w}x⃗ x→\vec{x} y^= f( b⃗ ⋅ x⃗ ) = f( ∑sayawsayaxsaya)y^=f(w→⋅x→)=f(∑sayawsayaxsaya) …

15 regression machine-learning classification feature-selection linear-model

2

Apa ukuran kesalahan pelatihan untuk dilaporkan untuk Hutan Acak?

Saat ini saya memasang hutan acak untuk masalah klasifikasi menggunakan randomForestpaket dalam R, dan saya tidak yakin tentang cara melaporkan kesalahan pelatihan untuk model ini. Kesalahan pelatihan saya mendekati 0% ketika saya menghitungnya menggunakan prediksi yang saya dapatkan dengan perintah: predict(model, data=X_train) di mana X_traindata pelatihan. Dalam jawaban untuk pertanyaan …

15 r machine-learning classification random-forest overfitting

3

Bagaimana cara memilih metrik kesalahan saat mengevaluasi suatu pengklasifikasi?

Saya telah melihat berbagai metrik kesalahan yang digunakan dalam kompetisi Kaggle: RMS, mean-square, AUC, dan lainnya. Apa aturan umum praktis dalam memilih metrik kesalahan, yaitu bagaimana Anda tahu metrik kesalahan mana yang digunakan untuk masalah yang diberikan? Apakah ada pedoman?

15 machine-learning classification error

2

Apa itu "baseline" dalam kurva recall presisi

Saya mencoba memahami kurva recall presisi, saya mengerti apa itu precision dan recall tapi yang saya tidak mengerti adalah nilai "baseline". Saya sedang membaca tautan ini https://classeval.wordpress.com/introduction/introduction-to-the-precision-recall-plot/ dan saya tidak mengerti bagian dasar seperti yang ditunjukkan dalam "Kurva Precision-Recall dari pengklasifikasi sempurna" apa fungsinya? dan bagaimana kita menghitungnya? Apakah ini …

15 r machine-learning classification precision-recall

1

Kedalaman pohon keputusan

Karena algoritma pohon keputusan terpecah pada suatu atribut pada setiap langkah, kedalaman maksimum pohon keputusan sama dengan jumlah atribut data. Apakah ini benar?

14 classification cart

3

Intuisi untuk Mendukung Mesin Vektor dan hyperplane

Dalam proyek saya, saya ingin membuat model regresi logistik untuk memprediksi klasifikasi biner (1 atau 0). Saya memiliki 15 variabel, 2 di antaranya bersifat kategorikal, sedangkan sisanya adalah campuran variabel kontinu dan diskrit. Agar sesuai dengan model regresi logistik saya telah disarankan untuk memeriksa pemisahan linear menggunakan SVM, perceptron atau …

14 machine-learning logistic classification svm separation

3

Bagaimana cara melakukan augmentasi data dan memvalidasi train?

Saya melakukan klasifikasi gambar menggunakan pembelajaran mesin. Misalkan saya memiliki beberapa data pelatihan (gambar) dan akan membagi data menjadi set pelatihan dan validasi. Dan saya juga ingin menambah data (menghasilkan gambar baru dari yang asli) dengan rotasi acak dan injeksi noise. Augmentaion dilakukan secara offline. Mana cara yang benar untuk …

14 machine-learning classification cross-validation dataset data-augmentation

Pertanyaan yang diberi tag «classification»