Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data


4
Mengapa fungsi sigmoid bukan yang lain?
Mengapa fungsi sigmoid standar de-facto, , begitu populer di jaringan saraf dan regresi logistik (tidak dalam)?11 + e- x11+e-x\frac{1}{1+e^{-x}} Mengapa kita tidak menggunakan banyak fungsi turunan lainnya, dengan waktu perhitungan yang lebih cepat atau peluruhan yang lebih lambat (sehingga gradien menghilang lebih sedikit). Beberapa contoh ada di Wikipedia tentang fungsi …

6
Kapan menggunakan simulasi?
Jadi ini pertanyaan yang sangat sederhana dan bodoh. Namun, ketika saya masih di sekolah, saya sangat sedikit memperhatikan seluruh konsep simulasi di kelas dan itu membuat saya sedikit takut dengan proses itu. Bisakah Anda menjelaskan proses simulasi dalam istilah awam? (bisa untuk menghasilkan data, koefisien regresi, dll) Apa sajakah situasi …
40 simulation 


4
Ingat dan presisi dalam klasifikasi
Saya membaca beberapa definisi mengingat dan presisi, meskipun setiap kali dalam konteks pengambilan informasi. Saya bertanya-tanya apakah seseorang dapat menjelaskan ini sedikit lebih banyak dalam konteks klasifikasi dan mungkin menggambarkan beberapa contoh. Katakanlah misalnya saya memiliki classifier biner yang memberi saya presisi 60% dan recall 95%, apakah ini classifier yang …

5
Bagaimana cara mendapatkan solusi regresi ridge?
Saya mengalami beberapa masalah dengan derivasi solusi untuk regresi ridge. Saya tahu solusi regresi tanpa ketentuan regularisasi: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. Tetapi setelah menambahkan istilah L2 ke fungsi biaya, mengapa solusinya menjadiλ∥β∥22λ‖β‖22\lambda\|\beta\|_2^2 β=(XTX+λI)−1XTy.β=(XTX+λI)−1XTy.\beta = (X^TX + \lambda I)^{-1}X^Ty.

3
Bagaimana cara mempresentasikan hasil Lasso menggunakan glmnet?
Saya ingin mencari prediktor untuk variabel dependen kontinu dari 30 variabel independen. Saya menggunakan regresi Lasso seperti yang diterapkan dalam paket glmnet di R. Berikut adalah beberapa kode dummy: # generate a dummy dataset with 30 predictors (10 useful & 20 useless) y=rnorm(100) x1=matrix(rnorm(100*20),100,20) x2=matrix(y+rnorm(100*10),100,10) x=cbind(x1,x2) # use crossvalidation to …


3
Pertimbangkan jumlah distribusi seragam pada , atau . Mengapa puncak dalam PDF menghilang untuk ?
Saya sudah lama bertanya-tanya tentang yang ini; Saya merasa sedikit aneh betapa tiba-tiba itu terjadi. Pada dasarnya, mengapa kita hanya perlu tiga seragam untuk untuk memuluskan seperti itu? Dan mengapa smoothing-out terjadi begitu cepat?ZnZnZ_n Z2Z2Z_2 : Z3Z3Z_3 : (gambar dicuri tanpa malu-malu dari blog John D. Cook: http://www.johndcook.com/blog/2009/02/12/sums-of-uniform-random-values/ ) Mengapa …






5
Clustering Warping Waktu dinamis
Apa yang akan menjadi pendekatan untuk menggunakan Dynamic Time Warping (DTW) untuk melakukan clustering time series? Saya telah membaca tentang DTW sebagai cara untuk menemukan kesamaan antara dua seri waktu, sementara mereka dapat digeser waktu. Bisakah saya menggunakan metode ini sebagai ukuran kesamaan untuk algoritma pengelompokan seperti k-means?

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.