Ilmu Data evaluation

6

Micro Average vs Macro Performa rata-rata dalam pengaturan klasifikasi Multi Kelas

Saya mencoba pengaturan klasifikasi multi kelas dengan 3 kelas. Distribusi kelas miring dengan sebagian besar data termasuk dalam 1 dari 3 kelas. (label kelas menjadi 1,2,3, dengan 67,28% dari data termasuk dalam label kelas 1, data 11,99% di kelas 2, dan sisanya di kelas 3) Saya melatih classifier multiclass pada …

103 multiclass-classification evaluation

4

Apa perbedaan antara bootstrap dan validasi silang?

Saya dulu menerapkan validasi silang K-fold untuk evaluasi yang kuat dari model pembelajaran mesin saya. Tapi saya sadar akan keberadaan metode bootstrap untuk tujuan ini juga. Namun, saya tidak dapat melihat perbedaan utama di antara mereka dalam hal estimasi kinerja. Sejauh yang saya lihat, bootstrap juga menghasilkan sejumlah himpunan bagian …

21 cross-validation evaluation

7

Kapan presisi lebih penting daripada penarikan?

Adakah yang bisa memberi saya beberapa contoh di mana presisi itu penting dan beberapa contoh di mana penarikan itu penting?

16 machine-learning evaluation

1

Berapa banyak fitur untuk sampel menggunakan Hutan Acak

The Wikipedia halaman yang kutipan "The Elements of statistik Learning" kata: Biasanya, untuk masalah klasifikasi dengan fitur , ⌊ √halhalp fitur p ⌋digunakan di setiap pemisahan.⌊ hlm-√⌋⌊hal⌋\lfloor \sqrt{p}\rfloor Saya mengerti bahwa ini adalah tebakan berpendidikan yang cukup baik dan mungkin dikonfirmasi oleh bukti empiris, tetapi apakah ada alasan lain mengapa …

13 statistics random-forest optimization evaluation sampling

1

Bagaimana cara mendefinisikan metrik kinerja khusus di Keras?

Saya mencoba mendefinisikan fungsi metrik khusus (Skor-F1) di Keras (backend Tensorflow) menurut yang berikut: def f1_score(tags, predicted): tags = set(tags) predicted = set(predicted) tp = len(tags & predicted) fp = len(predicted) - tp fn = len(tags) - tp if tp>0: precision=float(tp)/(tp+fp) recall=float(tp)/(tp+fn) return 2*((precision*recall)/(precision+recall)) else: return 0 Sejauh ini, sangat …

11 tensorflow keras evaluation

3

Jaringan Saraf Tiruan - Korelasi Kehilangan dan Akurasi

Saya agak bingung dengan koeksistensi metrik Rugi dan Akurasi di Neural Networks. Keduanya seharusnya untuk membuat "ketepatan" dari perbandingan yyy dan y , bukan? Jadi bukankah aplikasi dari dua berlebihan dalam masa pelatihan? Selain itu, mengapa mereka tidak berkorelasi?y^y^\hat{y}

11 neural-network evaluation

3

Bahasa terbaik untuk komputasi ilmiah [ditutup]

Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 5 tahun yang lalu . Sepertinya sebagian besar bahasa memiliki sejumlah perpustakaan komputasi ilmiah yang tersedia. Python memiliki Scipy …

10 efficiency statistics tools knowledge-base machine-learning neural-network deep-learning optimization hyperparameter machine-learning time-series categorical-data logistic-regression python visualization bigdata efficiency classification binary svm random-forest logistic-regression data-mining sql experiments bigdata efficiency performance scalability distributed bigdata nlp statistics education knowledge-base definitions machine-learning recommender-system evaluation efficiency algorithms parameter efficiency scalability sql statistics visualization knowledge-base education machine-learning r python r text-mining sentiment-analysis machine-learning machine-learning python neural-network statistics reference-request machine-learning data-mining python classification data-mining bigdata usecase apache-hadoop map-reduce aws education feature-selection machine-learning machine-learning sports data-formats hierarchical-data-format bigdata apache-hadoop bigdata apache-hadoop python visualization knowledge-base classification confusion-matrix accuracy bigdata apache-hadoop bigdata efficiency apache-hadoop distributed machine-translation nlp metadata data-cleaning text-mining python pandas machine-learning python pandas scikit-learn bigdata machine-learning databases clustering data-mining recommender-system

2

Kapan harus memilih regresi linier atau Pohon Keputusan atau regresi Hutan Acak? [Tutup]

Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 4 tahun yang lalu . Saya sedang mengerjakan suatu proyek dan saya mengalami kesulitan dalam menentukan algoritma mana yang …

10 machine-learning algorithms random-forest linear-regression decision-trees machine-learning predictive-modeling forecast r clustering similarity data-mining dataset statistics text-mining text-mining data-cleaning data-wrangling machine-learning classification algorithms xgboost data-mining dataset dataset regression graphs svm unbalanced-classes cross-validation optimization hyperparameter genetic-algorithms visualization predictive-modeling correlation machine-learning predictive-modeling apache-spark statistics normalization apache-spark map-reduce r correlation confusion-matrix r data-cleaning classification terminology dataset image-classification machine-learning regression apache-spark machine-learning data-mining nlp parsing machine-learning dimensionality-reduction visualization clustering multiclass-classification evaluation unsupervised-learning machine-learning machine-learning data-mining supervised-learning unsupervised-learning machine-learning data-mining classification statistics predictive-modeling data-mining clustering python pandas machine-learning dataset data-cleaning data bigdata software-recommendation

2

Mengapa ukuran-F lebih disukai untuk tugas klasifikasi?

Mengapa ukuran-F biasanya digunakan untuk tugas-tugas klasifikasi (diawasi), sedangkan indeks-G (atau indeks Fowlkes-Mallows) umumnya digunakan untuk tugas-tugas pengelompokan (tanpa pengawasan)? Ukuran-F adalah rata-rata harmonik dari presisi dan daya ingat . G-ukur (atau indeks Fowlkes-Mallows) adalah rata-rata geometris dari presisi dan daya ingat . Di bawah ini adalah plot dari berbagai …

8 machine-learning evaluation scoring metric nlg

Pertanyaan yang diberi tag «evaluation»