Pertanyaan yang diberi tag «data-mining»

Penambangan data menggunakan metode dari kecerdasan buatan dalam konteks basis data untuk menemukan pola yang sebelumnya tidak diketahui. Karena itu, metode biasanya tidak diawasi. Ini terkait erat tetapi tidak identik dengan pembelajaran mesin. Tugas utama dari penambangan data adalah analisis klaster, deteksi outlier dan penambangan aturan asosiasi.

5
Bagaimana memahami kelemahan K-means
K-means adalah metode yang banyak digunakan dalam analisis cluster. Dalam pemahaman saya, metode ini TIDAK memerlukan asumsi APAPUN, yaitu, beri saya dataset dan jumlah cluster yang ditentukan sebelumnya, k, dan saya hanya menerapkan algoritma ini yang meminimalkan jumlah kesalahan kuadrat (SSE), dalam cluster cluster kuadrat kesalahan. Jadi k-means pada dasarnya …


4
Kappa Cohen dalam bahasa Inggris sederhana
Saya membaca buku data mining dan disebutkan statistik Kappa sebagai sarana untuk mengevaluasi kinerja prediksi pengklasifikasi. Namun, saya tidak bisa mengerti ini. Saya juga memeriksa Wikipedia tetapi tidak membantu juga: https://en.wikipedia.org/wiki/Cohen's_kappa . Bagaimana kappa Cohen membantu dalam mengevaluasi kinerja prediksi pengklasifikasi? Apa isinya? Saya mengerti bahwa 100% kappa berarti bahwa …

9
Memperoleh pengetahuan dari hutan acak
Hutan acak dianggap kotak hitam, tetapi baru-baru ini saya berpikir pengetahuan apa yang bisa diperoleh dari hutan acak? Hal yang paling jelas adalah pentingnya variabel, dalam varian paling sederhana dapat dilakukan hanya dengan menghitung jumlah kemunculan suatu variabel. Hal kedua yang saya pikirkan adalah interaksi. Saya berpikir bahwa jika jumlah …

11
Memiliki pekerjaan dalam penambangan data tanpa gelar PhD
Saya sudah sangat tertarik dalam penambangan data dan pembelajaran mesin untuk sementara waktu, sebagian karena saya mengambil jurusan di sekolah itu, tetapi juga karena saya benar-benar jauh lebih bersemangat mencoba menyelesaikan masalah yang memerlukan sedikit pemikiran lebih dari sekadar pemrograman pengetahuan dan yang solusinya dapat memiliki berbagai bentuk. Saya tidak …


8
Keterampilan yang sulit ditemukan di pembelajar mesin?
Tampaknya penambangan data dan pembelajaran mesin menjadi sangat populer sehingga sekarang hampir setiap siswa CS tahu tentang pengklasifikasian, pengelompokan, statistik NLP ... dll. Jadi, menemukan penambang data bukanlah hal yang sulit saat ini. Pertanyaan saya adalah: Apa keterampilan yang bisa dipelajari oleh penambang data yang akan membuatnya berbeda dari yang …

8
Hasilkan variabel acak dengan korelasi yang ditentukan dengan variabel yang ada
Untuk studi simulasi saya harus membuat variabel acak yang menunjukkan korelasi (populasi) prefined ke variabel .YYY Saya melihat ke dalam Rpaket copuladan CDVineyang dapat menghasilkan distribusi multivarian acak dengan struktur ketergantungan yang diberikan. Namun, tidak mungkin untuk memperbaiki salah satu variabel yang dihasilkan ke variabel yang ada. Setiap ide dan …



8
Apakah pengambilan sampel relevan pada saat 'data besar'?
Atau lebih tepatnya "apakah itu"? Big Data menjadikan statistik dan pengetahuan yang relevan menjadi lebih penting tetapi tampaknya tidak mendukung Teori Sampling. Saya telah melihat hype ini di sekitar 'Big Data' dan saya bertanya-tanya bahwa "mengapa" saya ingin menganalisis semuanya ? Apakah tidak ada alasan untuk "Teori Pengambilan Sampel" untuk …





Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.