Ilmu Data machine-learning

4

Bisakah kita mengambil manfaat dari menggunakan pembelajaran transfer sambil melatih model word2vec?

Saya mencari bobot pra-terlatih dari model yang sudah dilatih seperti data Google News dll. Saya merasa sulit untuk melatih model baru dengan jumlah data (10 GB dll) yang cukup untuk saya sendiri. Jadi, saya ingin mengambil manfaat dari pembelajaran transfer di mana saya akan bisa mendapatkan bobot lapisan pra-dilatih dan …

13 machine-learning bigdata word2vec

3

Cara terbaik untuk mengklasifikasikan dataset dengan tipe atribut campuran

Saya ingin tahu apa cara terbaik untuk mengklasifikasikan kumpulan data yang terdiri dari berbagai jenis atribut, misalnya, tekstual dan numerik. Saya tahu saya bisa mengonversi teks menjadi boolean, tetapi perbendaharaan katanya beragam dan datanya terlalu jarang. Saya juga mencoba untuk mengklasifikasikan jenis atribut secara terpisah dan menggabungkan hasilnya melalui teknik …

13 machine-learning classification

2

Apakah ada API untuk merayapi abstrak kertas?

Jika saya memiliki daftar nama kertas yang sangat panjang, bagaimana saya bisa mendapatkan abstrak dari makalah ini dari internet atau database apa pun? Nama-nama kertas seperti "Penilaian Utilitas dalam Penambangan Web untuk Domain Kesehatan Masyarakat". Adakah yang tahu API apa pun yang bisa memberi saya solusi? Saya mencoba menjelajah google …

13 data-mining machine-learning

4

Interval prediksi sekitar perkiraan seri waktu LSTM

Apakah ada metode untuk menghitung interval prediksi (distribusi probabilitas) di sekitar perkiraan deret waktu dari jaringan saraf LSTM (atau berulang lainnya)? Katakanlah, misalnya, saya memprediksi 10 sampel ke masa depan (t + 1 hingga t + 10), berdasarkan pada 10 sampel terakhir yang diamati (t-9 hingga t), saya berharap prediksi …

13 machine-learning deep-learning time-series prediction lstm

3

Apa artinya ketika kita mengatakan sebagian besar poin dalam hypercube berada di perbatasan?

Jika saya memiliki hypercube 50 dimensi. Dan saya mendefinisikan batasnya dengan atau 0,95 < x j < 1 di mana x j adalah dimensi dari hypercube. Kemudian menghitung proporsi poin pada batas hypercube akan menjadi 0,995 . Apa artinya? Apakah itu berarti bahwa sisa ruang kosong? Jika 99 % titik …

13 machine-learning math

2

Apakah ada cara lain untuk mengubah metrik yang digunakan oleh panggilan balik Penghentian Awal di Keras?

Saat menggunakan panggilan balik Penghentian Awal dalam pelatihan Keras berhenti saat beberapa metrik (biasanya kehilangan validasi) tidak meningkat. Apakah ada cara untuk menggunakan metrik lain (seperti ketepatan, penarikan, ukuran-f) alih-alih kehilangan validasi? Semua contoh yang saya lihat sejauh ini mirip dengan yang ini: callbacks.EarlyStopping (monitor = 'val_loss', sabar = 5, …

13 machine-learning neural-network deep-learning keras

4

Dalam Algoritma SVM, mengapa vektor w ortogonal dengan hyperplane pemisah?

Saya seorang pemula dalam Pembelajaran Mesin. Dalam SVM, hyperplane pemisah didefinisikan sebagai . Mengapa kita katakan vektor w ortogonal ke hyperplane yang memisahkan?y= wTx + by=wTx+by = w^T x + bwww

13 machine-learning svm

4

Satu alternatif penyandian panas untuk nilai kategori besar?

Hai punya dataframe dengan nilai kategori besar lebih dari 1600 kategori apakah ada cara saya bisa menemukan alternatif sehingga saya tidak memiliki lebih dari 1.600 kolom. Saya menemukan ini di bawah ini tautan menarik http://amunategui.github.io/feature-hashing/#sourcecode Tetapi mereka mengkonversi ke kelas / objek yang tidak saya inginkan. Saya ingin hasil akhir …

13 machine-learning dataset dimensionality-reduction encoding

2

Memperbarui bobot filter dalam CNN

Saat ini saya mencoba memahami arsitektur CNN. Saya mengerti konvolusi, layer ReLU, pooling layer, dan layer yang sepenuhnya terhubung. Namun, saya masih bingung dengan bobotnya. Dalam jaringan saraf normal, masing-masing neuron memiliki beratnya sendiri. Pada lapisan yang terhubung penuh, masing-masing neuron juga akan memiliki beratnya sendiri. Tapi yang saya tidak …

13 machine-learning neural-network deep-learning image-classification cnn

4

Dimensi dan Beragam

Kalimat yang sering terdengar dalam Pembelajaran Mesin tanpa pengawasan adalah Input dimensi tinggi biasanya hidup di atau dekat manifold dimensi rendah Apa itu dimensi? Apa itu bermacam-macam? Apa bedanya? Bisakah Anda memberi contoh untuk menggambarkan keduanya? Berjenis dari Wikipedia: Dalam matematika, berjenis adalah ruang topologis yang menyerupai ruang Euclidean di …

13 machine-learning dimensionality-reduction

1

Belajar multi tugas dalam Keras

Saya mencoba menerapkan lapisan bersama di Keras. Saya memang melihat bahwa Keras memiliki keras.layers.concatenate, tetapi saya tidak yakin dari dokumentasi tentang penggunaannya. Bisakah saya menggunakannya untuk membuat beberapa lapisan bersama? Apa cara terbaik untuk mengimplementasikan jaringan saraf berbagi sederhana seperti yang ditunjukkan di bawah ini menggunakan Keras? Perhatikan bahwa semua …

12 machine-learning neural-network deep-learning keras multitask-learning

5

Perpustakaan Julia terbaik untuk jaringan saraf

Saya telah menggunakan perpustakaan ini untuk konstruksi dan analisis jaringan saraf dasar. Namun, itu tidak memiliki dukungan untuk membangun jaringan saraf berlapis-lapis, dll. Jadi, saya ingin tahu ada perpustakaan yang bagus untuk melakukan jaringan saraf canggih dan Deep Learning di Julia.

12 machine-learning neural-network julia

1

Hashing Trick - apa yang sebenarnya terjadi

Ketika algoritme ML, misalnya Vowpal Wabbit atau beberapa mesin faktorisasi memenangkan persaingan tingkat klik ( Kaggle ), menyebutkan bahwa fitur 'hash', apa artinya sebenarnya bagi model? Katakanlah ada variabel yang mewakili ID dari internet add, yang mengambil nilai seperti '236BG231'. Kemudian saya mengerti bahwa fitur ini di-hash ke integer acak. …

12 machine-learning predictive-modeling kaggle

3

Klasifikasi teks tidak terstruktur

Saya akan mengklasifikasikan dokumen teks tidak terstruktur, yaitu situs web dengan struktur yang tidak diketahui. Jumlah kelas yang saya klasifikasikan terbatas (pada titik ini, saya yakin tidak ada lebih dari tiga). Adakah yang menyarankan agar saya bisa mulai? Apakah pendekatan "kantong kata" layak dilakukan di sini? Kemudian, saya bisa menambahkan …

12 machine-learning classification text-mining beginner

2

Data sentimen untuk Emoji

Untuk bereksperimen, kami ingin menggunakan Emoji yang tertanam di banyak Tweet sebagai data dasar / pelatihan untuk analisis senitmen kuantitatif sederhana. Tweet biasanya terlalu tidak terstruktur untuk NLP untuk bekerja dengan baik. Bagaimanapun, ada 722 Emoji di Unicode 6.0, dan mungkin 250 Emoji lain akan ditambahkan di Unicode 7.0. Apakah …

12 machine-learning classification parsing

Pertanyaan yang diberi tag «machine-learning»