Pertanyaan yang diberi tag «machine-learning»

Metode dan prinsip membangun "sistem komputer yang secara otomatis meningkatkan dengan pengalaman."

4
Langkah awal apa yang harus saya gunakan untuk memahami kumpulan data besar, dan alat apa yang harus saya gunakan?
Peringatan: Saya seorang pemula yang lengkap dalam hal pembelajaran mesin, tetapi ingin sekali belajar. Saya memiliki dataset besar dan saya mencoba menemukan pola di dalamnya. Mungkin ada / mungkin tidak ada korelasi di seluruh data, baik dengan variabel yang diketahui, atau variabel yang terkandung dalam data tetapi yang belum saya …

3
Statistik + Ilmu Komputer = Ilmu Data? [Tutup]
Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Data Science Stack Exchange. Ditutup 5 tahun yang lalu . saya ingin menjadi ilmuwan data . Saya mempelajari statistik terapan (ilmu aktuaria), jadi saya memiliki latar belakang statistik …

1
Prediksi dengan fitur non-atom
Saya ingin menggunakan data non-atom, sebagai fitur untuk prediksi. Misalkan saya punya Meja dengan fitur-fitur ini: - Column 1: Categorical - House - Column 2: Numerical - 23.22 - Column 3: A Vector - [ 12, 22, 32 ] - Column 4: A Tree - [ [ 2323, 2323 ],[2323, …

3
Menangani set fitur yang terus meningkat
Saya sedang mengerjakan sistem deteksi penipuan. Di bidang ini, penipuan baru muncul secara teratur, sehingga fitur baru harus ditambahkan ke model secara berkelanjutan. Saya bertanya-tanya apa cara terbaik untuk menanganinya (dari perspektif proses pengembangan)? Hanya menambahkan fitur baru ke dalam vektor fitur dan melatih ulang penggolong tampaknya menjadi pendekatan yang …


3
Bagaimana cara menyandikan kelas dengan 24.000 kategori?
Saat ini saya sedang mengerjakan model regresi logistik untuk genomik. Salah satu bidang input yang ingin saya sertakan sebagai kovariat adalah genes. Ada sekitar 24.000 gen yang dikenal. Ada banyak fitur dengan tingkat variabilitas dalam biologi komputasi ini dan diperlukan ratusan ribu sampel. Jika saya LabelEncoder()gen 24K itu dan kemudian …


4
Apakah PCA dianggap sebagai algoritma pembelajaran mesin
Saya telah memahami bahwa analisis komponen utama adalah teknik reduksi dimensionalitas yaitu dengan memberikan 10 fitur input, ini akan menghasilkan sejumlah kecil fitur independen yang merupakan transformasi ortogonal dan linear dari fitur asli. Apakah PCAdengan sendirinya dianggap sebagai algoritma pembelajaran atau merupakan langkah pra-pemrosesan data.

3
Dapatkah koordinat GPS (lintang dan bujur) digunakan sebagai fitur dalam model linier?
Saya memiliki kumpulan data yang berisi, di antara banyak fitur, koordinat GPS (lintang dan bujur). Saya ingin menggunakan set data ini untuk mengeksplorasi masalah seperti: (1) menghitung ETA untuk mendorong antara titik awal dan akhir; dan (2) memperkirakan jumlah kejahatan untuk suatu titik tertentu. Saya ingin menggunakan model regresi linier. …


2
Apa matriks fitur di word2vec?
Saya seorang pemula dalam jaringan saraf dan saat ini saya sedang mengeksplorasi model word2vec. Namun saya mengalami kesulitan untuk memahami apa sebenarnya fitur matriks. Saya bisa mengerti bahwa matriks pertama adalah vektor pengodean satu-panas untuk kata tertentu, tetapi apa yang ditandakan oleh matriks kedua? Lebih khusus lagi, apa arti dari …


2
Bagaimana cara melakukan Regresi Logistik dengan sejumlah besar fitur?
Saya memiliki dataset dengan 330 sampel dan 27 fitur untuk setiap sampel, dengan masalah kelas biner untuk Regresi Logistik. Menurut "aturan jika sepuluh" saya membutuhkan setidaknya 10 peristiwa untuk setiap fitur untuk dimasukkan. Padahal, saya memiliki dataset yang tidak seimbang, dengan 20% kelas positif dan 80% kelas negatif. Itu memberi …

3
Prediksi waktu panggilan terbaik
Saya memiliki set data termasuk satu set pelanggan di berbagai kota di California, waktu panggilan untuk setiap pelanggan, dan status panggilan (Benar jika pelanggan menjawab panggilan dan Salah jika pelanggan tidak menjawab). Saya harus menemukan waktu yang tepat untuk menelepon pelanggan di masa depan sehingga kemungkinan menjawab panggilan tinggi. Jadi, …

1
CARA: Inisialisasi berat jaringan Neural Deep
Mengingat tugas belajar yang sulit (misalnya dimensi tinggi, kompleksitas data yang melekat) Deep Neural Networks menjadi sulit untuk dilatih. Untuk meringankan banyak masalah, orang mungkin: Normalisasi && data kualitas pilihan sendiri pilih algoritma pelatihan yang berbeda (misalnya RMSprop alih-alih Gradient Descent) pilih fungsi Biaya gradien yang lebih curam (mis. Cross …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.