Statistik dan Big Data

4

Bagaimana fungsi aktivasi bujursangkar menyelesaikan masalah gradien hilang dalam jaringan saraf?

Saya menemukan unit linear diperbaiki (ReLU) dipuji di beberapa tempat sebagai solusi untuk masalah gradien menghilang untuk jaringan saraf. Artinya, seseorang menggunakan maks (0, x) sebagai fungsi aktivasi. Ketika aktivasi positif, jelas bahwa ini lebih baik daripada, katakanlah, fungsi aktivasi sigmoid, karena derivasiasinya selalu 1 bukannya nilai kecil sewenang-wenang untuk …

40 machine-learning neural-networks deep-learning gradient-descent

6

Aturan praktis untuk jumlah sampel bootstrap

Saya ingin tahu apakah seseorang mengetahui aturan umum mengenai jumlah sampel bootstrap yang harus digunakan, berdasarkan karakteristik data (jumlah pengamatan, dll.) Dan / atau variabel yang dimasukkan?

40 bootstrap inference monte-carlo

7

Apakah seorang Bayesian mengakui bahwa ada satu nilai parameter tetap?

Dalam analisis data Bayesian, parameter diperlakukan sebagai variabel acak. Ini berasal dari konseptualisasi subjektif subjektif Bayesian. Tetapi apakah Bayesian secara teori mengakui bahwa ada satu nilai parameter tetap yang benar di 'dunia nyata?' Sepertinya jawaban yang jelas adalah 'ya', karena kemudian mencoba memperkirakan parameternya hampir tidak masuk akal. Kutipan akademik …

40 probability bayesian parameterization

2

Bagaimana cara menarik kesimpulan yang valid dari "data besar"?

"Data besar" ada di mana-mana di media. Semua orang mengatakan bahwa "big data" adalah hal besar untuk 2012, misalnya jajak pendapat KDNuggets tentang topik hangat untuk 2012 . Namun, saya memiliki keprihatinan yang mendalam di sini. Dengan data besar, semua orang tampaknya senang hanya untuk mengeluarkan apa pun . Tetapi …

40 data-mining dataset large-data validation

5

Interval kepercayaan untuk median

Saya harus menemukan 95% CI pada median dan persentil lainnya. Saya tidak tahu bagaimana mendekati ini. Saya terutama menggunakan R sebagai alat pemrograman.

40 r confidence-interval median

5

Hubungan antara

Katakanlah saya memiliki dua array 1 dimensi, dan sebuah 2 . Masing-masing berisi 100 poin data. a 1 adalah data aktual, dan sebuah 2 adalah model prediksi. Dalam hal ini, nilai R 2 adalah: R 2 = 1 - S S r e sa1a1a_1a2a2a_2a1a1a_1a2a2a_2R2R2R^2 Sementara itu, ini akan sama dengan …

40 correlation r-squared

2

Ukuran variabel penting dalam hutan acak

Saya telah bermain-main dengan hutan acak untuk regresi dan saya mengalami kesulitan mencari tahu apa arti dua ukuran penting itu, dan bagaimana mereka harus ditafsirkan. The importance()Fungsi memberikan dua nilai untuk setiap variabel: %IncMSEdan IncNodePurity. Apakah ada interpretasi sederhana untuk 2 nilai ini? Untuk IncNodePuritykhususnya, ini hanya jumlah peningkatan RSS …

40 r machine-learning random-forest importance

6

Backpropagation dengan Softmax / Cross Entropy

Saya mencoba memahami bagaimana backpropagation bekerja untuk lapisan output softmax / cross-entropy. Fungsi kesalahan lintas entropi adalah E(t,o)=−∑jtjlogojE(t,o)=−∑jtjlog⁡ojE(t,o)=-\sum_j t_j \log o_j dengan ttt dan ooo sebagai target dan output pada neuron jjj , masing-masing. Jumlahnya adalah di atas setiap neuron di lapisan output. ojojo_j itu sendiri merupakan hasil dari fungsi …

40 backpropagation derivative softmax cross-entropy

2

Model regresi logistik tidak konvergen

Saya punya beberapa data tentang penerbangan maskapai (dalam kerangka data yang disebut flights) dan saya ingin melihat apakah waktu penerbangan berpengaruh pada probabilitas kedatangan yang tertunda secara signifikan (artinya 10 menit atau lebih). Saya pikir saya akan menggunakan regresi logistik, dengan waktu penerbangan sebagai prediktor dan apakah setiap penerbangan secara …

40 r logistic separation

3

Bagaimana menafsirkan nilai F dan p dalam ANOVA?

Saya baru mengenal statistik dan saat ini saya berurusan dengan ANOVA. Saya melakukan tes ANOVA di R menggunakan aov(dependendVar ~ IndependendVar) Saya mendapatkan - antara lain - nilai-F dan nilai-p. Hipotesis nol saya ( ) adalah bahwa semua rata-rata grup sama.H0H0H_0 Ada banyak informasi yang tersedia tentang bagaimana F dihitung …

40 r anova interpretation

3

Efek penekanan dalam regresi: definisi dan penjelasan / penggambaran visual

Apa yang dimaksud dengan variabel penekan dalam regresi berganda dan apa yang mungkin menjadi cara untuk menampilkan efek penindasan secara visual (mekanismenya atau bukti dalam hasilnya)? Saya ingin mengundang semua orang yang memiliki pemikiran, untuk berbagi.

40 multiple-regression data-visualization geometry suppressor

3

Hubungan empiris antara mean, median dan mode

Untuk distribusi unimodal yang cukup miring, kami memiliki hubungan empiris berikut antara rata-rata, median dan mode: Bagaimana hubungan ini berasal?(Mean - Mode) ∼ 3(Berarti - Median)(Mean - Mode)∼3(Berarti - Median) \text{(Mean - Mode)}\sim 3\,\text{(Mean - Median)} Apakah Karl Pearson merencanakan ribuan hubungan ini sebelum membentuk kesimpulan ini, atau adakah garis …

40 distributions mathematical-statistics descriptive-statistics history

7

Normalisasi dan standardisasi data dalam jaringan saraf

Saya mencoba untuk memprediksi hasil dari sistem yang kompleks menggunakan jaringan saraf (JST). Nilai hasil (tergantung) berkisar antara 0 dan 10.000. Variabel input yang berbeda memiliki rentang yang berbeda. Semua variabel memiliki distribusi normal. Saya mempertimbangkan berbagai opsi untuk mengukur data sebelum pelatihan. Salah satu opsi adalah menskalakan variabel input …

40 machine-learning neural-networks multidimensional-scaling

3

Perbedaan antara Hutan Acak dan Pohon Yang Sangat Acak

Saya mengerti bahwa Hutan Acak dan Pohon Acak Sangat berbeda dalam arti bahwa pemisahan pohon di Hutan Acak bersifat deterministik sedangkan mereka acak dalam kasus Pohon Acak Sangat Acak (lebih tepatnya, pembelahan berikutnya adalah pemecahan terbaik di antara pemisahan seragam acak dalam variabel yang dipilih untuk pohon saat ini). Tetapi …

40 machine-learning correlation references random-forest

1

Bagaimana cara memusatkan data menyingkirkan intersepsi dalam regresi dan PCA?

Saya terus membaca tentang contoh di mana kami memusatkan data (misalnya, dengan regularisasi atau PCA) untuk menghapus intersep (seperti yang disebutkan dalam pertanyaan ini ). Saya tahu itu sederhana, tetapi saya mengalami kesulitan memahami hal ini secara intuitif. Bisakah seseorang memberikan intuisi atau referensi yang bisa saya baca?

40 regression pca centering