Pertanyaan yang diberi tag «classification»

Sebuah instance dari pembelajaran yang diawasi yang mengidentifikasi kategori atau kategori yang dimiliki oleh instance dataset baru.


6
Kesamaan cosinus versus produk titik sebagai metrik jarak
Sepertinya kesamaan cosinus dari dua fitur hanyalah produk titik mereka diskalakan oleh produk besarnya mereka. Kapan kesamaan cosinus membuat metrik jarak yang lebih baik daripada produk titik? Apakah produk titik dan persamaan cosinus memiliki kekuatan atau kelemahan yang berbeda dalam situasi yang berbeda?



1
Mengapa xgboost jauh lebih cepat daripada sklearn GradientBoostingClassifier?
Saya mencoba untuk melatih model peningkatan gradien lebih dari 50k contoh dengan 100 fitur numerik. XGBClassifiermenangani 500 pohon dalam waktu 43 detik pada mesin saya, sementara GradientBoostingClassifierhanya menangani 10 pohon (!) dalam 1 menit dan 2 detik :( Saya tidak repot-repot mencoba menumbuhkan 500 pohon karena akan memakan waktu berjam-jam. …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 


4
Kapan menggunakan Hutan Acak di atas SVM dan sebaliknya?
Ketika salah satu akan menggunakan Random Forestlebih SVMdan sebaliknya? Saya memahami itu cross-validationdan perbandingan model merupakan aspek penting dalam memilih model, tetapi di sini saya ingin belajar lebih banyak tentang aturan praktis dan heuristik dari dua metode. Dapatkah seseorang tolong jelaskan seluk-beluk, kekuatan, dan kelemahan pengklasifikasi serta masalah, yang paling …

4
Algoritma apa yang harus saya gunakan untuk melakukan klasifikasi pekerjaan berdasarkan data resume?
Perhatikan bahwa saya melakukan semuanya dalam R. Masalahnya sebagai berikut: Pada dasarnya, saya memiliki daftar riwayat hidup (CV). Beberapa kandidat akan memiliki pengalaman kerja sebelumnya dan beberapa tidak. Tujuannya di sini adalah untuk: berdasarkan teks pada CV mereka, saya ingin mengklasifikasikan mereka ke dalam sektor pekerjaan yang berbeda. Saya khususnya …

5
Apakah algoritma pohon keputusan linear atau nonlinier
Baru-baru ini seorang teman saya ditanya apakah algoritma pohon keputusan adalah algoritma linear atau nonlinier dalam sebuah wawancara. Saya mencoba mencari jawaban untuk pertanyaan ini tetapi tidak dapat menemukan penjelasan yang memuaskan. Adakah yang bisa menjawab dan menjelaskan solusi untuk pertanyaan ini? Juga, apa saja contoh lain dari algoritma pembelajaran …

3
apa perbedaan antara klasifikasi teks dan model topik?
Saya tahu perbedaan antara pengelompokan dan klasifikasi dalam pembelajaran mesin, tapi saya tidak mengerti perbedaan antara klasifikasi teks dan pemodelan topik untuk dokumen. Dapatkah saya menggunakan pemodelan topik di atas dokumen untuk mengidentifikasi suatu topik? Bisakah saya menggunakan metode klasifikasi untuk mengklasifikasikan teks di dalam dokumen-dokumen ini?


4
Bagaimana cara mendapatkan akurasi, F1, presisi dan daya ingat, untuk model yang keras?
Saya ingin menghitung ketepatan, daya ingat dan skor-F1 untuk model KerasClassifier biner saya, tetapi tidak menemukan solusi. Ini kode saya yang sebenarnya: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() model.add(Dense(23, input_dim=45, kernel_initializer='normal', activation='relu')) …

2
Kategorisasi teks: menggabungkan berbagai fitur
Masalah yang saya tangani adalah mengelompokkan teks-teks pendek menjadi beberapa kelas. Pendekatan saya saat ini adalah menggunakan frekuensi istilah bobot tf-idf dan mempelajari classifier linier sederhana (regresi logistik). Ini bekerja cukup baik (sekitar 90% makro F-1 pada set tes, hampir 100% pada set pelatihan). Masalah besar adalah kata-kata yang tidak …


5
Menggabungkan data yang jarang dan padat dalam pembelajaran mesin untuk meningkatkan kinerja
Saya memiliki fitur jarang yang bersifat prediksi, juga saya memiliki beberapa fitur padat yang juga dapat memprediksi. Saya perlu menggabungkan fitur-fitur ini bersama-sama untuk meningkatkan kinerja keseluruhan classifier. Sekarang, masalahnya adalah ketika saya mencoba untuk menggabungkan ini bersama-sama, fitur padat cenderung lebih mendominasi fitur jarang, maka hanya memberikan peningkatan 1% …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.