Ilmu Data

T&J untuk profesional sains Data, spesialis Pembelajaran Mesin, dan mereka yang tertarik untuk belajar lebih banyak tentang bidang ini

11
Ilmu Data dalam C (atau C ++)
Saya seorang Rprogrammer bahasa. Saya juga berada dalam kelompok orang yang dianggap sebagai Ilmuwan Data tetapi berasal dari disiplin akademis selain CS. Ini berfungsi dengan baik dalam peran saya sebagai Data Scientist, namun, dengan memulai karir saya Rdan hanya memiliki pengetahuan dasar tentang bahasa scripting / web lain, saya merasa …


3
Kapan menggunakan apa - Machine Learning [ditutup]
Baru-baru ini di kelas Pembelajaran Mesin dari profesor Oriol Pujol di UPC / Barcelona ia menggambarkan algoritma, prinsip dan konsep yang paling umum digunakan untuk berbagai tugas terkait pembelajaran mesin. Di sini saya membaginya dengan Anda dan bertanya: apakah ada kerangka kerja komprehensif yang mencocokkan tugas dengan pendekatan atau metode …

3
Apakah batch_size di Keras memiliki efek pada kualitas hasil?
Saya akan melatih jaringan LSTM besar dengan 2-3 juta artikel dan saya berjuang dengan Kesalahan Memori (saya menggunakan AWS EC2 g2x2large). Saya menemukan bahwa salah satu solusinya adalah dengan mengurangi batch_size. Namun, saya tidak yakin apakah parameter ini hanya terkait dengan masalah efisiensi memori atau apakah akan mempengaruhi hasil saya. …


3
Apa perbedaan antara “equivariant to translation” dan “invariant to translation”
Saya mengalami kesulitan memahami perbedaan antara equivariant ke terjemahan dan invariant to translation . Dalam buku Deep Learning . MIT Press, 2016 (I. Goodfellow, A. Courville, dan Y. Bengio), dapat ditemukan di jaringan konvolusional: [...] bentuk tertentu dari berbagi parameter menyebabkan layer memiliki properti yang disebut equivariance to translation [...] …

11
Apakah para ilmuwan data menggunakan Excel?
Saya akan menganggap diri saya sebagai ilmuwan data pekerja harian. Seperti kebanyakan (saya pikir), saya membuat bagan pertama saya dan melakukan agregasi pertama saya di sekolah menengah dan perguruan tinggi, menggunakan Excel. Ketika saya melewati masa kuliah, sekolah pascasarjana dan ~ 7 tahun pengalaman kerja, saya dengan cepat mengambil apa …
37 tools  career  excel 

2
Bagaimana menafsirkan output dari XGBoost pentingnya?
Saya menjalankan model xgboost. Saya tidak tahu persis bagaimana menafsirkan output dari xgb.importance. Apa arti dari Penguatan, Penutupan, dan Frekuensi dan bagaimana kita menafsirkannya? Juga, apa arti Split, RealCover, dan RealCover%? Saya punya beberapa parameter tambahan di sini Apakah ada parameter lain yang dapat memberi tahu saya lebih lanjut tentang …


3
Perhitungan dan Visualisasi Matriks Korelasi dengan Pandas
Saya memiliki kerangka data panda dengan beberapa entri, dan saya ingin menghitung korelasi antara pendapatan beberapa jenis toko. Ada sejumlah toko dengan data pendapatan, klasifikasi area aktivitas (teater, toko pakaian, makanan ...) dan data lainnya. Saya mencoba membuat bingkai data baru dan menyisipkan kolom dengan pendapatan semua jenis toko yang …


13
Apa pendapat Anda tentang sertifikasi Ilmu Data?
Saya sekarang telah melihat dua program sertifikasi sains data - yang John Hopkins tersedia di Coursera dan yang Cloudera . Saya yakin ada orang lain di luar sana. Rangkaian kelas John Hopkins difokuskan pada R sebagai toolset, tetapi mencakup berbagai topik: Pemrograman R membersihkan dan mendapatkan data Analisis data Penelitian …
35 education 


6
Penjelasan kerugian lintas-entropi
Misalkan saya membuat NN untuk klasifikasi. Lapisan terakhir adalah lapisan padat dengan aktivasi softmax. Saya memiliki lima kelas yang berbeda untuk diklasifikasi. Misalkan untuk contoh pelatihan tunggal, true labeladalah [1 0 0 0 0]saat prediksi [0.1 0.5 0.1 0.1 0.2]. Bagaimana saya menghitung kerugian lintas entropi untuk contoh ini?

1
Perbedaan antara `Dense` dan` TimeDistributedDense` dari `Keras`
Saya masih bingung tentang perbedaan antara Densedan TimeDistributedDensedari Kerasmeskipun sudah ada beberapa pertanyaan serupa ditanyakan di sini dan di sini . Orang banyak berdiskusi tetapi tidak ada kesimpulan yang disepakati bersama. Dan meskipun, di sini , @fchollet menyatakan bahwa: TimeDistributedDenseberlaku operasi yang sama Dense(terhubung penuh) untuk setiap catatan waktu tensor …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.