Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data


7
Referensi jaringan saraf (buku teks, kursus online) untuk pemula
Saya ingin belajar Neural Networks. Saya seorang Ahli Bahasa Komputasi. Saya tahu pendekatan pembelajaran mesin statistik dan dapat kode dalam Python. Saya ingin memulai dengan konsep-konsepnya, dan mengetahui satu atau dua model populer yang mungkin berguna dari perspektif Linguistik Komputasi. Saya melihat-lihat web untuk referensi dan menemukan beberapa buku dan …

3
Apakah CDF lebih mendasar daripada PDF?
Stat prof saya pada dasarnya mengatakan, jika diberikan salah satu dari tiga berikut, Anda dapat menemukan dua lainnya: Fungsi distribusi kumulatif Fungsi Menghasilkan Saat Fungsi Kerapatan Probabilitas Tetapi profesor ekonometrik saya mengatakan CDF lebih mendasar daripada PDF karena ada contoh di mana Anda dapat memiliki CDF tetapi PDF tidak didefinisikan. …
43 probability  pdf  cdf  mgf 

13
Dapatkah pembelajaran mesin memecahkan kode hash SHA256?
Saya memiliki hash SHA256 64 karakter. Saya berharap untuk melatih model yang dapat memprediksi jika plaintext yang digunakan untuk menghasilkan hash dimulai dengan 1 atau tidak. Terlepas dari apakah ini "Kemungkinan", algoritma apa yang akan menjadi pendekatan terbaik? Pikiran awal saya: Hasilkan sampel besar hash yang dimulai dengan 1 dan …


3
Lapisan softmax dalam jaringan saraf
Saya mencoba menambahkan lapisan softmax ke jaringan saraf yang dilatih dengan backpropagation, jadi saya mencoba menghitung gradiennya. Output softmax adalah mana adalah nomor neuron output.hj= ezj∑ ezsayahj=ezj∑ezsayah_j = \frac{e^{z_j}}{\sum{e^{z_i}}}jjj Jika saya mendapatkannya maka saya mendapatkannya ∂hj∂zj= hj( 1 - jamj)∂hj∂zj=hj(1-hj)\frac{\partial{h_j}}{\partial{z_j}}=h_j(1-h_j) Mirip dengan regresi logistik. Namun ini salah karena pemeriksaan gradien …

2
Asumsi hutan acak
Saya agak baru ke hutan acak jadi saya masih berjuang dengan beberapa konsep dasar. Dalam regresi linier, kami mengasumsikan pengamatan independen, varians konstan ... Apa asumsi / hipotesis dasar yang kita buat, ketika kita menggunakan hutan acak? Apa perbedaan utama antara hutan acak dan bayaran naif dalam hal asumsi model?


6
Fitur untuk klasifikasi deret waktu
Saya mempertimbangkan masalah klasifikasi (multi-kelas) berdasarkan seri waktu dari panjang variabel , yaitu, untuk menemukan fungsi melalui representasi global dari seri waktu oleh serangkaian fitur yang dipilih dari ukuran tetap independen dari , dan kemudian gunakan metode klasifikasi standar pada set fitur ini. Saya tidak tertarik dengan perkiraan, yaitu memprediksif …

4
Bagaimana cara membandingkan dua seri waktu secara statistik?
Saya memiliki dua seri waktu, ditunjukkan dalam plot di bawah ini: Plotnya menunjukkan detail lengkap dari kedua seri waktu tersebut, tetapi saya dapat dengan mudah menguranginya menjadi hanya pengamatan kebetulan jika diperlukan. Pertanyaan saya adalah: Metode statistik apa yang dapat saya gunakan untuk menilai perbedaan antara rangkaian waktu? Saya tahu …
43 r  time-series 

4
Kompendium teknik cross-validasi
Saya bertanya-tanya apakah ada yang tahu tentang ringkasan teknik validasi silang dengan diskusi tentang perbedaan antara mereka dan panduan tentang kapan harus menggunakan masing-masing. Wikipedia memiliki daftar teknik yang paling umum, tetapi saya ingin tahu apakah ada teknik lain, dan jika ada taksonomi untuk mereka. Sebagai contoh, saya hanya bertemu …

9
Dataset kecil (nyata) untuk memberikan contoh di kelas?
Ketika mengajar kelas tingkat pengantar, para guru yang saya kenal cenderung untuk menciptakan sejumlah angka dan sebuah cerita untuk memberikan contoh metode yang mereka ajarkan. Yang saya inginkan adalah menceritakan kisah nyata dengan angka nyata. Namun, kisah-kisah ini perlu dihubungkan dengan dataset yang sangat kecil, yang memungkinkan perhitungan manual. Setiap …

3
Meninjau statistik dalam makalah
Bagi sebagian dari kita, kertas wasit adalah bagian dari pekerjaan. Ketika meringkas makalah metodologi statistik, saya pikir saran dari bidang studi lain cukup berguna, yaitu ilmu komputer dan Matematika . Pertanyaan ini menyangkut meninjau makalah statistik yang lebih terapan. Maksud saya, makalah ini diserahkan ke jurnal non-statistik / matematika dan …
43 journals  referee 


4
Apa perbedaan dalam perbedaan?
Perbedaan dalam perbedaan telah lama populer sebagai alat non-eksperimental, terutama dalam bidang ekonomi. Adakah yang bisa tolong berikan jawaban yang jelas dan non-teknis untuk pertanyaan berikut tentang perbedaan-dalam-perbedaan. Apa yang dimaksud dengan penaksir perbedaan-dalam-perbedaan? Mengapa penaksir perbedaan-dalam-perbedaan digunakan? Bisakah kita benar-benar mempercayai estimasi perbedaan-dalam-perbedaan?

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.