Ilmu Data

T&J untuk profesional sains Data, spesialis Pembelajaran Mesin, dan mereka yang tertarik untuk belajar lebih banyak tentang bidang ini


1
Mengapa ReLU lebih baik daripada fungsi aktivasi lainnya
Di sini jawabannya mengacu pada gradien menghilang dan meledak yang telah di- sigmoidfungsi aktivasi tetapi, saya kira, Relumemiliki kelemahan dan itu adalah nilai yang diharapkan. tidak ada batasan untuk output Reludan nilai yang diharapkan tidak nol. Saya ingat waktu sebelum popularitas Reluyang tanhadalah yang paling populer di antara mesin ahli …

3
Apa arti notasi mAP @ [. 5: .95]?
Untuk deteksi, cara umum untuk menentukan apakah satu proposal objek benar adalah Persimpangan atas Union (IoU, IU). Ini mengambil himpunan dari objek piksel yang diusulkan dan set piksel objek benar dan menghitung:BSEBUAHSEBUAHABBB sayao U( A , B ) = A ∩ BA ∪ BsayaHaiU(SEBUAH,B)=SEBUAH∩BSEBUAH∪BIoU(A, B) = \frac{A \cap B}{A \cup …


3
Bagging vs Dropout di Deep Neural Networks
Bagging adalah generasi dari beberapa prediktor yang berfungsi sebagai peramal sebagai satu prediktor tunggal. Dropout adalah teknik yang mengajarkan ke jaringan saraf untuk rata-rata semua subnetwork yang mungkin. Melihat kompetisi Kaggle yang paling penting, tampaknya kedua teknik ini sering digunakan bersama. Saya tidak bisa melihat perbedaan teoretis selain implementasi yang …


1
Algoritma untuk pengelompokan teks
Saya memiliki masalah mengelompokkan kalimat dalam jumlah besar ke dalam kelompok dengan artinya. Ini mirip dengan masalah ketika Anda memiliki banyak kalimat dan ingin mengelompokkannya berdasarkan artinya. Algoritma apa yang disarankan untuk melakukan ini? Saya tidak tahu jumlah cluster di muka (dan karena semakin banyak data yang datang, cluster juga …


2
Bagaimana seharusnya etika diterapkan dalam ilmu data
Ada kehebohan baru-baru ini dengan facebook bereksperimen pada pengguna mereka untuk melihat apakah mereka dapat mengubah emosi pengguna dan sekarang okcupid . Sementara saya bukan ilmuwan data profesional, saya membaca tentang etika sains data dari buku Cathy O'Neill 'Doing Data Science' dan ingin tahu apakah ini adalah sesuatu yang diajarkan …

6
Apa yang Anda gunakan untuk menghasilkan dasbor di R?
Saya perlu membuat laporan dasbor analitik web berkala (harian, bulanan). Mereka akan statis dan tidak memerlukan interaksi, jadi bayangkan file PDF sebagai output target. Laporan akan mencampur tabel dan grafik (terutama grafik grafik mini dan grafik bullet yang dibuat dengan ggplot2). Pikirkan dasbor gaya Stephen Few / Perceptual Edge, seperti: …
17 r  visualization 

4
Lapisan output ekstra dalam jaringan saraf (Desimal ke biner)
Saya sedang mengerjakan pertanyaan dari buku online: http://neuralnetworksanddeeplearning.com/chap1.html Saya bisa mengerti bahwa jika lapisan output tambahan adalah 5 neuron output, saya mungkin bisa menetapkan bias pada 0,5 dan berat masing-masing 0,5 untuk lapisan sebelumnya. Tetapi pertanyaannya sekarang meminta lapisan baru dari empat neuron keluaran - yang lebih dari cukup untuk …

7
Memvisualisasikan grafik dengan sejuta simpul
Apa alat terbaik yang digunakan untuk memvisualisasikan (menggambar simpul dan tepi) grafik dengan 10.00000 simpul? Ada sekitar 50.000 tepi dalam grafik. Dan saya dapat menghitung lokasi masing-masing simpul dan tepi. Saya sedang berpikir tentang menulis sebuah program untuk menghasilkan svg. Ada saran lain?

2
Gunakan liblinear pada data besar untuk analisis semantik
Saya menggunakan Libsvm untuk melatih data dan memprediksi klasifikasi pada masalah analisis semantik . Tetapi memiliki masalah kinerja pada data skala besar, karena analisis semantik menyangkut masalah n-dimensi . Tahun lalu, Liblinear dirilis, dan itu dapat menyelesaikan hambatan kinerja. Tetapi biaya memori terlalu banyak . Apakah MapReduce satu-satunya cara untuk …

4
Pengelompokan berdasarkan skor kesamaan
Asumsikan bahwa kita memiliki satu set elemen E dan kesamaan ( tidak jarak ) fungsi sim (ei, ej) antara dua elemen ei, ej ∈ E . Bagaimana kita (secara efisien) mengelompokkan elemen-elemen E , menggunakan sim ? k -berarti, misalnya, membutuhkan k yang diberikan , Canopy Clustering membutuhkan dua nilai …

5
Mendeteksi kucing secara visual melalui deteksi anomali
Saya memiliki proyek hobi yang saya renungkan sebagai komitmen untuk meningkatkan pengalaman belajar mesin saya yang sejauh ini terbatas. Saya telah mengambil dan menyelesaikan MOOC Coursera tentang topik tersebut. Pertanyaan saya berkaitan dengan kelayakan proyek. Tugasnya adalah sebagai berikut: Kucing tetangga kadang-kadang mengunjungi kebun saya, yang saya tidak suka karena …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.