Pertanyaan yang diberi tag «data-mining»

Penambangan data menggunakan metode dari kecerdasan buatan dalam konteks basis data untuk menemukan pola yang sebelumnya tidak diketahui. Karena itu, metode biasanya tidak diawasi. Ini terkait erat tetapi tidak identik dengan pembelajaran mesin. Tugas utama dari penambangan data adalah analisis klaster, deteksi outlier dan penambangan aturan asosiasi.

2
Bagaimana cara memprediksi kapan peristiwa berikutnya terjadi, berdasarkan waktu kejadian sebelumnya?
Saya seorang siswa sekolah menengah dan saya sedang mengerjakan proyek pemrograman komputer, tetapi saya tidak memiliki banyak pengalaman dalam statistik dan pemodelan data di luar kursus statistik SMA, jadi saya agak bingung. Pada dasarnya, saya memiliki daftar yang cukup besar (anggap itu cukup besar untuk memenuhi asumsi untuk setiap tes …

7
Bias Data dalam Pembelajaran Mesin
Saya sedang mengerjakan proyek Machine Learning dengan data yang sudah (berat) bias oleh pemilihan data. Mari kita asumsikan Anda memiliki seperangkat aturan kode keras. Bagaimana Anda membangun model pembelajaran mesin untuk menggantinya, ketika semua data yang dapat digunakan adalah data yang sudah disaring oleh aturan-aturan itu? Untuk memperjelas, saya kira …




3
Apa itu pencampuran data?
Istilah ini sering muncul di utas terkait metode . Apakah memadukan metode khusus dalam penambangan data dan pembelajaran statistik? Saya tidak bisa mendapatkan hasil yang relevan dari google. Tampaknya pencampuran adalah mencampur hasil dari banyak model dan menghasilkan hasil yang lebih baik. Apakah ada sumber daya yang membantu saya mengetahui …

10
Survei alat perangkat lunak penambangan data
Meskipun saya dilatih sebagai seorang insinyur, saya menemukan bahwa saya menjadi lebih tertarik pada data mining. Saat ini saya sedang mencoba untuk menyelidiki bidang ini lebih lanjut. Secara khusus, saya ingin memahami berbagai kategori alat perangkat lunak yang ada dan alat mana yang menonjol di setiap kategori dan mengapa. (Perhatikan …

4
Arti fitur laten?
Saya mencoba memahami model faktorisasi matriks untuk sistem yang merekomendasikan dan saya selalu membaca 'fitur laten', tetapi apa artinya itu? Saya tahu apa artinya fitur untuk dataset pelatihan tapi saya tidak bisa memahami ide fitur laten. Setiap makalah tentang topik yang saya temukan terlalu dangkal. Edit: jika Anda setidaknya bisa …

1
Perbedaan antara regresi logistik dan mesin vektor dukungan?
Saya tahu bahwa regresi logistik menemukan hyperplane yang memisahkan sampel pelatihan. Saya juga tahu bahwa mesin Dukungan vektor menemukan hyperplane dengan margin maksimum. Pertanyaan saya: apakah perbedaan kemudian antara regresi logistik (LR) dan mesin vektor dukungan (SVM) adalah bahwa LR menemukan hyperplane yang memisahkan sampel pelatihan sementara SVM menemukan hyperplane …

3
Mengapa kita menggunakan k-means daripada algoritma lainnya?
Saya meneliti tentang k-means dan ini adalah apa yang saya dapatkan: k-means adalah salah satu algoritma paling sederhana yang menggunakan metode pembelajaran tanpa pengawasan untuk memecahkan masalah pengelompokan yang diketahui. Ini bekerja sangat baik dengan kumpulan data besar. Namun, ada juga kekurangan K-Means yaitu: Sensitivitas yang kuat terhadap pencilan dan …

2
Kinerja model dalam pemodelan kuantil
Saya menggunakan regresi kuantil (misalnya melalui gbmatau quantregdalam R) - tidak berfokus pada median melainkan kuantil atas (misalnya ke-75). Berasal dari latar belakang pemodelan prediktif, saya ingin mengukur seberapa baik model tersebut cocok pada set uji dan dapat menggambarkan ini kepada pengguna bisnis. Pertanyaan saya adalah bagaimana? Dalam pengaturan tipikal …




2
Matematika di balik pohon klasifikasi dan regresi
Adakah yang bisa membantu menjelaskan beberapa matematika di balik klasifikasi dalam CART? Saya ingin memahami bagaimana dua tahap utama terjadi. Sebagai contoh, saya melatih classifier CART pada dataset dan menggunakan dataset pengujian untuk menandai kinerja prediktifnya tetapi: Bagaimana akar awal pohon dipilih? Mengapa dan bagaimana masing-masing cabang dibentuk? Dataset saya …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.