Pertanyaan yang diberi tag «data-mining»


4
Apa sebenarnya perbedaan antara pembelajaran terawasi dan tidak terawasi?
Saya mencoba memahami metode pengelompokan. Apa yang saya pikir saya mengerti: Dalam pembelajaran terawasi, data kategori / label yang ditetapkan diketahui sebelum perhitungan. Jadi, label, kelas atau kategori sedang digunakan untuk "mempelajari" parameter yang benar-benar signifikan untuk cluster tersebut. Dalam pembelajaran tanpa pengawasan, kumpulan data ditugaskan ke segmen, tanpa diketahui …

2
Mengidentifikasi acara yang terkait dengan tanggal dalam paragraf
Apakah ada pendekatan algoritmik untuk mengidentifikasi bahwa tanggal yang diberikan dalam paragraf berkorelasi dengan peristiwa (frasa) tertentu dalam paragraf? Contoh, pertimbangkan paragraf berikut: Pada Juni 1970, pemimpin besar itu mengambil sumpah. Tetapi baru setelah Mei 1972, setelah kematian Menteri Negara, dia mengambil alih tampuk kekuasaan negara. Sementara ia menikmati dukungan …

5
Ilmu Data vs Riset Operasi
Pertanyaan umum, seperti judulnya, adalah: Apa perbedaan antara DS dan OR / optimisasi. Pada level konseptual, saya memahami bahwa DS mencoba mengekstraksi pengetahuan dari data yang tersedia dan kebanyakan menggunakan teknik Statistik, Pembelajaran Mesin. Di sisi lain, OR menggunakan data untuk membuat keputusan berdasarkan data, misalnya dengan mengoptimalkan beberapa fungsi …

4
Hubungan dan perbedaan antara pengambilan informasi dan ekstraksi informasi?
Dari Wikipedia Pengambilan informasi adalah kegiatan memperoleh sumber daya informasi yang relevan dengan kebutuhan informasi dari kumpulan sumber daya informasi. Pencarian dapat didasarkan pada metadata atau pengindeksan teks lengkap. Dari Wikipedia Information Extraction (IE) adalah tugas mengekstraksi informasi terstruktur secara otomatis dari dokumen yang dapat dibaca mesin yang tidak terstruktur …

1
Inferring type refinement
Di tempat kerja saya ditugaskan untuk menyimpulkan beberapa jenis informasi tentang bahasa yang dinamis. Saya menulis ulang urutan pernyataan menjadi letekspresi bersarang , seperti: return x; Z => x var x; Z => let x = undefined in Z x = y; Z => let x = y in Z …
11 programming-languages  logic  type-theory  type-inference  machine-learning  data-mining  clustering  order-theory  reference-request  information-theory  entropy  algorithms  algorithm-analysis  space-complexity  lower-bounds  formal-languages  computability  formal-grammars  context-free  parsing  complexity-theory  time-complexity  terminology  turing-machines  nondeterminism  programming-languages  semantics  operational-semantics  complexity-theory  time-complexity  complexity-theory  reference-request  turing-machines  machine-models  simulation  graphs  probability-theory  data-structures  terminology  distributed-systems  hash-tables  history  terminology  programming-languages  meta-programming  terminology  formal-grammars  compilers  algorithms  search-algorithms  formal-languages  regular-languages  complexity-theory  satisfiability  sat-solvers  factoring  algorithms  randomized-algorithms  streaming-algorithm  in-place  algorithms  numerical-analysis  regular-languages  automata  finite-automata  regular-expressions  algorithms  data-structures  efficiency  coding-theory  algorithms  graph-theory  reference-request  education  books  formal-languages  context-free  proof-techniques  algorithms  graph-theory  greedy-algorithms  matroids  complexity-theory  graph-theory  np-complete  intuition  complexity-theory  np-complete  traveling-salesman  algorithms  graphs  probabilistic-algorithms  weighted-graphs  data-structures  time-complexity  priority-queues  computability  turing-machines  automata  pushdown-automata  algorithms  graphs  binary-trees  algorithms  algorithm-analysis  spanning-trees  terminology  asymptotics  landau-notation  algorithms  graph-theory  network-flow  terminology  computability  undecidability  rice-theorem  algorithms  data-structures  computational-geometry 

5
Frekuensi Kata dengan Memesan dalam Kompleksitas O (n)
Selama wawancara untuk posisi pengembang Java, saya ditanya hal berikut: Tulis fungsi yang membutuhkan dua params: String yang mewakili dokumen teks dan bilangan bulat yang menyediakan jumlah item untuk dikembalikan. Menerapkan fungsi sedemikian rupa sehingga mengembalikan daftar String yang dipesan berdasarkan frekuensi kata, kata yang paling sering muncul terlebih dahulu. …

1
Mencari algoritma peringkat yang mendukung entri yang lebih baru
Saya sedang mengerjakan sistem peringkat yang akan menentukan peringkat entri berdasarkan suara yang telah diberikan selama periode waktu tertentu. Saya mencari algoritma yang akan menghitung skor yang agak seperti rata-rata, namun saya ingin agar skor yang lebih baru lebih disukai daripada yang lebih tua. Saya sedang memikirkan sesuatu di sepanjang …

2
Apa sajakah cara efisien untuk menemukan perbedaan antara dua corpus besar teks yang memiliki konten serupa, tetapi berbeda urutan?
Saya memiliki dua file besar yang berisi paragraf teks bahasa Inggris: Teks pertama panjangnya sekitar 200 halaman dan memiliki sekitar 10 paragraf per halaman (setiap paragraf panjangnya 5 kalimat). Teks kedua berisi paragraf dan teks yang hampir sama persis dengan paragraf pertama. Panjangnya juga 200 halaman dengan 10 paragraf per …

1
Input string dalam Pembelajaran Mesin
Beberapa algoritma pembelajaran mesin yang populer seperti Regresi Logistik atau Neural networks memerlukan inputnya untuk numerik. Yang saya tertarik adalah bagaimana Anda membuat algoritma ini bekerja pada input non-numerik (seperti string pendek). Sebagai contoh, katakanlah kita sedang membangun sistem klasifikasi email (spam / bukan spam), di mana salah satu fitur …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.