Pertanyaan yang diberi tag «machine-learning»

Metode dan prinsip membangun "sistem komputer yang secara otomatis meningkatkan dengan pengalaman."


3
Cara terbaik untuk mengklasifikasikan dataset dengan tipe atribut campuran
Saya ingin tahu apa cara terbaik untuk mengklasifikasikan kumpulan data yang terdiri dari berbagai jenis atribut, misalnya, tekstual dan numerik. Saya tahu saya bisa mengonversi teks menjadi boolean, tetapi perbendaharaan katanya beragam dan datanya terlalu jarang. Saya juga mencoba untuk mengklasifikasikan jenis atribut secara terpisah dan menggabungkan hasilnya melalui teknik …

2
Apakah ada API untuk merayapi abstrak kertas?
Jika saya memiliki daftar nama kertas yang sangat panjang, bagaimana saya bisa mendapatkan abstrak dari makalah ini dari internet atau database apa pun? Nama-nama kertas seperti "Penilaian Utilitas dalam Penambangan Web untuk Domain Kesehatan Masyarakat". Adakah yang tahu API apa pun yang bisa memberi saya solusi? Saya mencoba menjelajah google …



2
Apakah ada cara lain untuk mengubah metrik yang digunakan oleh panggilan balik Penghentian Awal di Keras?
Saat menggunakan panggilan balik Penghentian Awal dalam pelatihan Keras berhenti saat beberapa metrik (biasanya kehilangan validasi) tidak meningkat. Apakah ada cara untuk menggunakan metrik lain (seperti ketepatan, penarikan, ukuran-f) alih-alih kehilangan validasi? Semua contoh yang saya lihat sejauh ini mirip dengan yang ini: callbacks.EarlyStopping (monitor = 'val_loss', sabar = 5, …


4
Satu alternatif penyandian panas untuk nilai kategori besar?
Hai punya dataframe dengan nilai kategori besar lebih dari 1600 kategori apakah ada cara saya bisa menemukan alternatif sehingga saya tidak memiliki lebih dari 1.600 kolom. Saya menemukan ini di bawah ini tautan menarik http://amunategui.github.io/feature-hashing/#sourcecode Tetapi mereka mengkonversi ke kelas / objek yang tidak saya inginkan. Saya ingin hasil akhir …


4
Dimensi dan Beragam
Kalimat yang sering terdengar dalam Pembelajaran Mesin tanpa pengawasan adalah Input dimensi tinggi biasanya hidup di atau dekat manifold dimensi rendah Apa itu dimensi? Apa itu bermacam-macam? Apa bedanya? Bisakah Anda memberi contoh untuk menggambarkan keduanya? Berjenis dari Wikipedia: Dalam matematika, berjenis adalah ruang topologis yang menyerupai ruang Euclidean di …

1
Belajar multi tugas dalam Keras
Saya mencoba menerapkan lapisan bersama di Keras. Saya memang melihat bahwa Keras memiliki keras.layers.concatenate, tetapi saya tidak yakin dari dokumentasi tentang penggunaannya. Bisakah saya menggunakannya untuk membuat beberapa lapisan bersama? Apa cara terbaik untuk mengimplementasikan jaringan saraf berbagi sederhana seperti yang ditunjukkan di bawah ini menggunakan Keras? Perhatikan bahwa semua …


1
Hashing Trick - apa yang sebenarnya terjadi
Ketika algoritme ML, misalnya Vowpal Wabbit atau beberapa mesin faktorisasi memenangkan persaingan tingkat klik ( Kaggle ), menyebutkan bahwa fitur 'hash', apa artinya sebenarnya bagi model? Katakanlah ada variabel yang mewakili ID dari internet add, yang mengambil nilai seperti '236BG231'. Kemudian saya mengerti bahwa fitur ini di-hash ke integer acak. …

3
Klasifikasi teks tidak terstruktur
Saya akan mengklasifikasikan dokumen teks tidak terstruktur, yaitu situs web dengan struktur yang tidak diketahui. Jumlah kelas yang saya klasifikasikan terbatas (pada titik ini, saya yakin tidak ada lebih dari tiga). Adakah yang menyarankan agar saya bisa mulai? Apakah pendekatan "kantong kata" layak dilakukan di sini? Kemudian, saya bisa menambahkan …

2
Data sentimen untuk Emoji
Untuk bereksperimen, kami ingin menggunakan Emoji yang tertanam di banyak Tweet sebagai data dasar / pelatihan untuk analisis senitmen kuantitatif sederhana. Tweet biasanya terlalu tidak terstruktur untuk NLP untuk bekerja dengan baik. Bagaimanapun, ada 722 Emoji di Unicode 6.0, dan mungkin 250 Emoji lain akan ditambahkan di Unicode 7.0. Apakah …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.