Pertanyaan yang diberi tag «machine-learning»

Metode dan prinsip membangun "sistem komputer yang secara otomatis meningkatkan dengan pengalaman."

3
Apakah TensorFlow perpustakaan Machine Learning yang lengkap?
Saya baru mengenal TensorFlow dan saya perlu memahami kemampuan dan kekurangan TensorFlow sebelum saya dapat menggunakannya. Saya tahu bahwa ini adalah kerangka kerja pembelajaran yang mendalam, tetapi terlepas dari itu algoritma pembelajaran mesin lainnya dapat kita gunakan dengan aliran tensor. Sebagai contoh, bisakah kita menggunakan SVM atau hutan acak menggunakan …

2
Konsekuensi dari Penskalaan Fitur
Saat ini saya menggunakan SVM dan meningkatkan fitur pelatihan saya ke kisaran [0,1]. Saya pertama kali cocok / mengubah set pelatihan saya dan kemudian menerapkan transformasi yang sama untuk set pengujian saya. Sebagai contoh: ### Configure transformation and apply to training set min_max_scaler = MinMaxScaler(feature_range=(0, 1)) X_train = min_max_scaler.fit_transform(X_train) ### …

1
t-SNE Implementasi Python: Kullback-Leibler divergence
t-SNE, seperti pada [1], bekerja dengan secara progresif mengurangi divergensi Kullback-Leibler (KL), sampai kondisi tertentu terpenuhi. Pembuat t-SNE menyarankan untuk menggunakan KL divergence sebagai kriteria kinerja untuk visualisasi: Anda dapat membandingkan divergensi Kullback-Leibler yang dilaporkan oleh t-SNE. Sangat baik untuk menjalankan t-SNE sepuluh kali, dan pilih solusi dengan divergensi KL …



4
Pembelajaran Mesin vs Pembelajaran Jauh
Saya agak bingung dengan perbedaan antara istilah "Machine Learning" dan "Deep Learning". Saya telah mencarinya di Google dan membaca banyak artikel, tetapi masih belum terlalu jelas bagi saya. Definisi yang dikenal tentang Pembelajaran Mesin oleh Tom Mitchell adalah: Sebuah program komputer dikatakan belajar dari pengalaman E sehubungan dengan beberapa kelas …

4
Overfitting / Underfitting dengan ukuran data set
Dalam grafik di bawah ini, x-axis => Ukuran set data y-axis => Skor validasi silang Garis merah untuk Data Pelatihan Garis hijau untuk Pengujian Data Dalam tutorial yang saya maksudkan, penulis mengatakan bahwa titik di mana garis merah dan garis hijau tumpang tindih, Mengumpulkan lebih banyak data tidak mungkin meningkatkan …


2
Perbedaan antara SVM dan Regresi Logistik
Saya membaca tentang SVMdan saya menghadapi titik bahwa non-kernelized SVMstidak lebih dari pemisah linier. Oleh karena itu, apakah satu-satunya perbedaan antara SVMregresi logistik dan satu kriteria untuk memilih batas? Tampaknya, SVMmemilih batas maksimum margin dan regresi logistik adalah salah satu yang meminimalkan cross-entropykerugian. Adakah situasi di mana SVM kinerjanya lebih …

2
Opsi Penanganan Fitur Catboost (pengaturan CTR)?
Saya bekerja dengan dataset dengan sejumlah besar fitur kategorikal (> 80%) memprediksi variabel target kontinu (yaitu Regresi). Saya telah membaca sedikit tentang cara menangani fitur-fitur kategorikal. Dan belajar bahwa pengkodean satu-panas yang telah saya gunakan di masa lalu adalah ide yang sangat buruk terutama ketika datang ke banyak fitur kategorikal …



3
Bahasa terbaik untuk komputasi ilmiah [ditutup]
Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 5 tahun yang lalu . Sepertinya sebagian besar bahasa memiliki sejumlah perpustakaan komputasi ilmiah yang tersedia. Python memiliki Scipy …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

3
Bagaimana saya bisa melakukan klasifikasi dengan data kategorikal yang tidak diperbaiki?
Saya memiliki masalah klasifikasi dengan data kategorikal dan numerik. Masalah yang saya hadapi adalah bahwa data kategorikal saya tidak diperbaiki, itu berarti bahwa kandidat baru yang labelnya ingin saya prediksi mungkin memiliki kategori baru yang tidak diamati sebelumnya. Misalnya, jika data kategorikal saya adalah sex, satu-satunya label yang mungkin adalah …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.