Ilmu Data

T&J untuk profesional sains Data, spesialis Pembelajaran Mesin, dan mereka yang tertarik untuk belajar lebih banyak tentang bidang ini



5
Mengapa fungsi biaya menggunakan kesalahan kuadrat?
Saya baru memulai dengan beberapa pembelajaran mesin, dan sampai sekarang saya telah berurusan dengan regresi linier atas satu variabel. Saya telah belajar bahwa ada hipotesis, yaitu: hθ(x)=θ0+θ1xhθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1x Untuk mengetahui nilai yang baik untuk parameter dan kami ingin meminimalkan perbedaan antara hasil yang dihitung dan hasil aktual dari data pengujian kami. …

1
Perbedaan antara isna () dan isnull () dalam panda
Saya telah menggunakan panda untuk beberapa waktu. Tapi, saya tidak mengerti apa perbedaan antara isna()dan isnull()dalam panda. Dan, yang lebih penting, yang mana yang akan digunakan untuk mengidentifikasi nilai yang hilang dalam kerangka data. Apa perbedaan mendasar yang mendasari bagaimana suatu nilai terdeteksi sebagai salah satu naatau null?

11
Mengapa orang lebih suka Pandas daripada SQL?
Saya sudah menggunakan SQL sejak 1996, jadi saya mungkin bias. Saya telah menggunakan MySQL dan SQLite 3 secara ekstensif, tetapi juga menggunakan Microsoft SQL Server dan Oracle. Sebagian besar operasi yang saya lihat dilakukan dengan Panda dapat dilakukan dengan lebih mudah dengan SQL. Ini termasuk memfilter dataset, memilih kolom tertentu …
69 pandas  sql 


8
Ilmuwan data vs insinyur pembelajaran mesin
Apa perbedaan, jika ada, antara "ilmuwan data" dan "insinyur pembelajaran mesin"? Selama setahun terakhir atau lebih "insinyur pembelajaran mesin" telah mulai muncul banyak dalam posting pekerjaan. Ini terutama terlihat di San Francisco, yang bisa dibilang dari mana istilah "ilmuwan data" berasal. Pada satu titik "ilmuwan data" menyalip "ahli statistik", dan …

5
Prediksi deret waktu menggunakan ARIMA vs LSTM
Masalah yang saya hadapi adalah memprediksi nilai deret waktu. Saya melihat satu seri waktu pada satu waktu dan berdasarkan misalnya 15% dari data input, saya ingin memprediksi nilai-nilai masa depannya. Sejauh ini saya telah menemukan dua model: LSTM (memori jangka pendek; kelas jaringan saraf berulang) ARIMA Saya sudah mencoba keduanya …

3
Keuntungan dari AUC vs akurasi standar
Saya mulai melihat ke area di bawah kurva (AUC) dan saya sedikit bingung tentang kegunaannya. Ketika pertama kali menjelaskan kepada saya, AUC tampaknya menjadi ukuran kinerja yang hebat tetapi dalam penelitian saya, saya telah menemukan bahwa beberapa mengklaim keunggulannya sebagian besar marjinal karena yang terbaik untuk menangkap model 'beruntung' dengan …

6
string sebagai fitur di pohon keputusan / hutan acak
Saya melakukan beberapa masalah pada aplikasi pohon keputusan / hutan acak. Saya mencoba menyesuaikan masalah yang memiliki angka dan juga string (seperti nama negara) sebagai fitur. Sekarang perpustakaan, scikit-learn hanya mengambil angka sebagai parameter, tapi saya ingin menyuntikkan string dan mereka membawa banyak pengetahuan. Bagaimana saya menangani skenario seperti itu? …

1
Bagaimana cara mendapatkan korelasi antara dua variabel kategori dan variabel kategori dan variabel kontinu?
Saya sedang membangun model regresi dan saya perlu menghitung di bawah ini untuk memeriksa korelasi Korelasi antara 2 variabel kategori multi level Korelasi antara variabel kategori Multi level dan variabel kontinu VIF (variance inflation factor) untuk variabel kategori multi level Saya percaya salah menggunakan koefisien korelasi Pearson untuk skenario di …

2
Melatih RNN dengan contoh dengan panjang berbeda di Keras
Saya mencoba untuk mulai belajar tentang RNNs dan saya menggunakan Keras. Saya memahami premis dasar lapisan vanilla RNN dan LSTM, tetapi saya mengalami kesulitan memahami poin teknis tertentu untuk pelatihan. Dalam dokumentasi keras , dikatakan input ke layer RNN harus berbentuk (batch_size, timesteps, input_dim). Ini menunjukkan bahwa semua contoh pelatihan …
63 python  keras  rnn  training 

3
Backprop Melalui Lapisan Max-Pooling?
Ini adalah pertanyaan konseptual kecil yang telah mengganggu saya untuk sementara waktu: Bagaimana kita dapat kembali-menyebar melalui lapisan max-pooling dalam jaringan saraf? Saya menemukan max-pooling layers saat membaca tutorial ini untuk library nn Torch 7. Pustaka mengabstraksi perhitungan gradien dan meneruskan untuk setiap lapisan jaringan yang dalam. Saya tidak mengerti …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.