Pertanyaan yang diberi tag «data-mining»

Penambangan data menggunakan metode dari kecerdasan buatan dalam konteks basis data untuk menemukan pola yang sebelumnya tidak diketahui. Karena itu, metode biasanya tidak diawasi. Ini terkait erat tetapi tidak identik dengan pembelajaran mesin. Tugas utama dari penambangan data adalah analisis klaster, deteksi outlier dan penambangan aturan asosiasi.


5
Angkat ukuran dalam penambangan data
Saya mencari di banyak situs web untuk mengetahui apa yang sebenarnya akan dilakukan lift? Hasil yang saya temukan semua tentang menggunakannya dalam aplikasi tidak dengan sendirinya. Saya tahu tentang fungsi dukungan dan kepercayaan diri. Dari Wikipedia, dalam penggalian data, lift adalah ukuran kinerja model dalam memprediksi atau mengklasifikasikan kasus, mengukur …

5
Berpikirlah seperti bayesian, periksa seperti yang sering: Apa artinya itu?
Saya sedang melihat beberapa slide kuliah tentang kursus ilmu data yang dapat ditemukan di sini: https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf Sayangnya, saya tidak dapat melihat video untuk ceramah ini dan pada satu titik di slide, presenter memiliki teks berikut: Beberapa Prinsip Utama Berpikir seperti orang Bayesian, periksa seperti seorang Frequentist (rekonsiliasi) Adakah yang tahu …

3
Mengapa ada perbedaan antara menghitung interval kepercayaan 95% regresi logistik secara manual, dan menggunakan fungsi confint () di R?
Dear everyone - Saya telah memperhatikan sesuatu yang aneh yang tidak dapat saya jelaskan, bukan? Singkatnya: pendekatan manual untuk menghitung interval kepercayaan dalam model regresi logistik, dan fungsi R confint()memberikan hasil yang berbeda. Saya telah melalui regresi logistik Terapan Hosmer & Lemeshow (edisi ke-2). Dalam bab ke-3 ada contoh menghitung …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 



1
Apakah ada pelajaran statistik dari episode "Kode Alkitab"
Meskipun pertanyaan ini agak subyektif, saya harap ini memenuhi syarat sebagai pertanyaan subyektif yang baik menurut pedoman faq . Ini didasarkan pada pertanyaan yang Olle Häggström tanyakan kepada saya setahun yang lalu dan meskipun saya memiliki beberapa pemikiran tentang hal itu saya tidak memiliki jawaban yang pasti dan saya akan …

8
Mata pelajaran matematika apa yang akan Anda sarankan untuk persiapan penambangan data dan pembelajaran mesin?
Saya mencoba menyusun kurikulum matematika mandiri untuk mempersiapkan pembelajaran penambangan data dan pembelajaran mesin. Ini dimotivasi dengan memulai kelas pembelajaran mesin Andrew Ng di Coursera dan merasa bahwa sebelum melanjutkan saya perlu meningkatkan keterampilan matematika saya. Saya lulus dari perguruan tinggi beberapa saat yang lalu sehingga aljabar dan statistik saya …

2
Mengapa nilai-p menyesatkan setelah melakukan seleksi bertahap?
Mari kita pertimbangkan misalnya model regresi linier. Saya mendengar bahwa, dalam penambangan data, setelah melakukan seleksi bertahap berdasarkan kriteria AIC, adalah keliru untuk melihat nilai-p untuk menguji hipotesis nol bahwa setiap koefisien regresi yang benar adalah nol. Saya mendengar bahwa orang harus mempertimbangkan semua variabel yang tersisa dalam model memiliki …

1
Perbedaan antara algoritma k-means standar dan spheris
Saya ingin memahami, apa perbedaan implementasi utama antara algoritma klaster standar dan k-means. Dalam setiap langkah, k-means menghitung jarak antara vektor elemen dan centroid cluster, dan menugaskan kembali dokumen ke cluster ini, yang centroid adalah yang terdekat. Kemudian, semua centroid dihitung ulang. Dalam k-means bola, semua vektor dinormalisasi, dan ukuran …



3
LSA vs PCA (pengelompokan dokumen)
Saya menyelidiki berbagai teknik yang digunakan dalam pengelompokan dokumen dan saya ingin menghapus beberapa keraguan tentang PCA (analisis komponen utama) dan LSA (analisis semantik laten). Hal pertama - apa perbedaan di antara mereka? Saya tahu bahwa di PCA, dekomposisi SVD diterapkan ke matriks term-kovarians, sedangkan di LSA itu adalah matriks …

3
Apa ukuran untuk akurasi data multilabel?
Pertimbangkan skenario di mana Anda disediakan dengan Matriks FamousLabel dan PredictedLabel. Saya ingin mengukur kebaikan matriks PredictedLabel terhadap Matriks KnowLabel. Tetapi tantangannya di sini adalah bahwa DiketahuiLabel Matriks memiliki beberapa baris hanya satu 1 dan beberapa baris lainnya memiliki banyak 1 (contoh tersebut adalah multi label). Contoh Matriks FamousLabel diberikan …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.