Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data

4
Bagaimana fungsi aktivasi bujursangkar menyelesaikan masalah gradien hilang dalam jaringan saraf?
Saya menemukan unit linear diperbaiki (ReLU) dipuji di beberapa tempat sebagai solusi untuk masalah gradien menghilang untuk jaringan saraf. Artinya, seseorang menggunakan maks (0, x) sebagai fungsi aktivasi. Ketika aktivasi positif, jelas bahwa ini lebih baik daripada, katakanlah, fungsi aktivasi sigmoid, karena derivasiasinya selalu 1 bukannya nilai kecil sewenang-wenang untuk …


7
Apakah seorang Bayesian mengakui bahwa ada satu nilai parameter tetap?
Dalam analisis data Bayesian, parameter diperlakukan sebagai variabel acak. Ini berasal dari konseptualisasi subjektif subjektif Bayesian. Tetapi apakah Bayesian secara teori mengakui bahwa ada satu nilai parameter tetap yang benar di 'dunia nyata?' Sepertinya jawaban yang jelas adalah 'ya', karena kemudian mencoba memperkirakan parameternya hampir tidak masuk akal. Kutipan akademik …



5
Hubungan antara
Katakanlah saya memiliki dua array 1 dimensi, dan sebuah 2 . Masing-masing berisi 100 poin data. a 1 adalah data aktual, dan sebuah 2 adalah model prediksi. Dalam hal ini, nilai R 2 adalah: R 2 = 1 - S S r e sa1a1a_1a2a2a_2a1a1a_1a2a2a_2R2R2R^2 Sementara itu, ini akan sama dengan …

2
Ukuran variabel penting dalam hutan acak
Saya telah bermain-main dengan hutan acak untuk regresi dan saya mengalami kesulitan mencari tahu apa arti dua ukuran penting itu, dan bagaimana mereka harus ditafsirkan. The importance()Fungsi memberikan dua nilai untuk setiap variabel: %IncMSEdan IncNodePurity. Apakah ada interpretasi sederhana untuk 2 nilai ini? Untuk IncNodePuritykhususnya, ini hanya jumlah peningkatan RSS …

6
Backpropagation dengan Softmax / Cross Entropy
Saya mencoba memahami bagaimana backpropagation bekerja untuk lapisan output softmax / cross-entropy. Fungsi kesalahan lintas entropi adalah E(t,o)=−∑jtjlogojE(t,o)=−∑jtjlog⁡ojE(t,o)=-\sum_j t_j \log o_j dengan ttt dan ooo sebagai target dan output pada neuron jjj , masing-masing. Jumlahnya adalah di atas setiap neuron di lapisan output. ojojo_j itu sendiri merupakan hasil dari fungsi …

2
Model regresi logistik tidak konvergen
Saya punya beberapa data tentang penerbangan maskapai (dalam kerangka data yang disebut flights) dan saya ingin melihat apakah waktu penerbangan berpengaruh pada probabilitas kedatangan yang tertunda secara signifikan (artinya 10 menit atau lebih). Saya pikir saya akan menggunakan regresi logistik, dengan waktu penerbangan sebagai prediktor dan apakah setiap penerbangan secara …
40 r  logistic  separation 

3
Bagaimana menafsirkan nilai F dan p dalam ANOVA?
Saya baru mengenal statistik dan saat ini saya berurusan dengan ANOVA. Saya melakukan tes ANOVA di R menggunakan aov(dependendVar ~ IndependendVar) Saya mendapatkan - antara lain - nilai-F dan nilai-p. Hipotesis nol saya ( ) adalah bahwa semua rata-rata grup sama.H0H0H_0 Ada banyak informasi yang tersedia tentang bagaimana F dihitung …


3
Hubungan empiris antara mean, median dan mode
Untuk distribusi unimodal yang cukup miring, kami memiliki hubungan empiris berikut antara rata-rata, median dan mode: Bagaimana hubungan ini berasal?(Mean - Mode) ∼ 3(Berarti - Median)(Mean - Mode)∼3(Berarti - Median) \text{(Mean - Mode)}\sim 3\,\text{(Mean - Median)} Apakah Karl Pearson merencanakan ribuan hubungan ini sebelum membentuk kesimpulan ini, atau adakah garis …

7
Normalisasi dan standardisasi data dalam jaringan saraf
Saya mencoba untuk memprediksi hasil dari sistem yang kompleks menggunakan jaringan saraf (JST). Nilai hasil (tergantung) berkisar antara 0 dan 10.000. Variabel input yang berbeda memiliki rentang yang berbeda. Semua variabel memiliki distribusi normal. Saya mempertimbangkan berbagai opsi untuk mengukur data sebelum pelatihan. Salah satu opsi adalah menskalakan variabel input …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.