Statistik dan Big Data

2

ImageNet: berapa tingkat kesalahan top-1 dan top-5?

Dalam makalah klasifikasi ImageNet tingkat kesalahan top-1 dan top-5 adalah unit penting untuk mengukur keberhasilan beberapa solusi, tetapi apa tingkat kesalahan itu? Dalam Klasifikasi ImageNet dengan Jaringan Neural Konvolusional Dalam oleh Krizhevsky et al. setiap solusi berdasarkan pada satu CNN (halaman 7) tidak memiliki tingkat kesalahan top-5 sedangkan yang dengan …

38 classification neural-networks error measurement-error image-processing

3

Apakah PCA berfungsi untuk tipe data boolean (binary)?

Saya ingin mengurangi dimensi sistem orde tinggi dan menangkap sebagian besar kovarian pada bidang 2 dimensi atau 1 dimensi yang lebih disukai. Saya mengerti ini bisa dilakukan melalui analisis komponen utama, dan saya telah menggunakan PCA dalam banyak skenario. Namun, saya belum pernah menggunakannya dengan tipe data boolean, dan saya …

38 pca data-visualization binary-data dimensionality-reduction correspondence-analysis

2

Apakah tidak biasa bagi MEAN mengungguli ARIMA?

Saya baru-baru ini menerapkan serangkaian metode peramalan (MEAN, RWF, ETS, ARIMA dan MLP) dan menemukan bahwa MEAN ternyata bekerja dengan sangat baik. (BERARTI: di mana semua prediksi masa depan diprediksi sama dengan rata-rata aritmatika dari nilai-nilai yang diamati.) MEAN bahkan mengungguli ARIMA pada tiga seri yang saya gunakan. Yang ingin …

38 forecasting arima

3

Pedoman untuk memilih hyperparameters di Deep Learning

Saya mencari makalah yang dapat membantu dalam memberikan pedoman tentang bagaimana memilih hyperparameter arsitektur yang mendalam, seperti auto-encoders stacked atau jaringan deep trust. Ada banyak hiperparameter dan saya sangat bingung bagaimana memilihnya. Juga menggunakan validasi silang bukan pilihan karena pelatihan benar-benar membutuhkan banyak waktu!

38 machine-learning deep-learning deep-belief-networks hyperparameter

3

Bagaimana cara pendekatan saddlepoint bekerja?

Bagaimana cara pendekatan saddlepoint bekerja? Masalah apa yang cocok untuk itu? (Jangan ragu untuk menggunakan contoh atau contoh tertentu dengan cara ilustrasi) Apakah ada kekurangan, kesulitan, hal-hal yang harus diperhatikan, atau perangkap untuk yang tidak waspada?

38 distributions mathematical-statistics mgf saddlepoint-approximation partial-moments

1

dihitung secara manual tidak cocok dengan randomForest () untuk menguji data baru

Saya tahu ini adalah Rpertanyaan yang cukup spesifik , tetapi saya mungkin berpikir tentang perbedaan proporsi yang dijelaskan, , salah. Ini dia.R2R2R^2 Saya mencoba menggunakan Rpaket randomForest. Saya memiliki beberapa data pelatihan dan data pengujian. Ketika saya cocok dengan model hutan acak, randomForestfungsi ini memungkinkan Anda untuk memasukkan data pengujian …

38 r correlation predictive-models random-forest r-squared

3

Pembelajaran online vs offline?

Apa perbedaan antara pembelajaran offline dan online ? Apakah ini hanya masalah mempelajari seluruh dataset (offline) vs belajar secara bertahap (satu contoh pada satu waktu)? Apa contoh algoritma yang digunakan di keduanya?

38 machine-learning online

3

Terapkan embeddings kata ke seluruh dokumen, untuk mendapatkan vektor fitur

Bagaimana cara saya menggunakan kata embedding untuk memetakan dokumen ke vektor fitur, cocok untuk digunakan dengan pembelajaran yang diawasi? Sebuah embedding kata memetakan setiap kata ke vektor , dimana adalah beberapa nomor yang tidak terlalu besar (misalnya, 500). Kata embeddings yang populer termasuk word2vec dan Glove .wwwv∈Rdv∈Rdv \in \mathbb{R}^dddd Saya …

38 classification natural-language supervised-learning word2vec word-embeddings

2

Tes A / B: uji-z vs uji-t vs uji kuadrat vs fisher

Saya mencoba memahami alasannya dengan memilih pendekatan tes khusus ketika berhadapan dengan tes A / B sederhana - (yaitu dua variasi / grup dengan binary respone (dikonversi atau tidak). Sebagai contoh saya akan menggunakan data di bawah ini Version Visits Conversions A 2069 188 B 1826 220 Jawaban teratas di …

38 statistical-significance chi-squared p-value fishers-exact z-statistic

4

Apa yang dimaksud dengan invarian terjemahan dalam visi komputer dan jaringan saraf convolutional?

Saya tidak memiliki latar belakang visi komputer, namun ketika saya membaca beberapa pemrosesan gambar dan jaringan saraf terkait artikel dan makalah, saya terus-menerus menghadapi istilah translation invariance,, atau translation invariant. Atau saya banyak membaca bahwa operasi konvolusi menyediakan translation invariance? !! Apa artinya ini? Saya sendiri selalu menerjemahkannya ke diri …

38 machine-learning conv-neural-network convolution computer-vision

3

Apa perbedaan antara 'epoch', 'batch', dan 'minibatch'?

Sejauh yang saya tahu, ketika mengadopsi Stochastic Gradient Descent sebagai algoritma pembelajaran, seseorang menggunakan 'epoch' untuk dataset lengkap, dan 'batch' untuk data yang digunakan dalam langkah pembaruan tunggal, sementara yang lain menggunakan 'batch' dan 'minibatch' masing-masing, dan yang lain menggunakan 'zaman' dan 'minibatch'. Ini membawa banyak kebingungan saat berdiskusi. Jadi, …

38 machine-learning

1

PCA dan analisis Korespondensi dalam hubungannya dengan Biplot

Biplot sering digunakan untuk menampilkan hasil analisis komponen utama (dan teknik terkait). Ini adalah scatterplot ganda atau overlay yang menunjukkan pemuatan komponen dan skor komponen secara bersamaan. Saya diberitahu oleh @amoeba hari ini bahwa dia telah memberikan jawaban yang berangkat dari komentar saya ke pertanyaan yang menanyakan tentang bagaimana koordinat …

38 pca multivariate-analysis svd correspondence-analysis biplot

3

Nomor acak-Set.seed (N) dalam R [duplikat]

Pertanyaan ini sudah ada jawabannya di sini: Apa sebenarnya benih dalam generator angka acak? 3 jawaban Saya menyadari bahwa seseorang menggunakan set.seed()R untuk pembuatan angka pseudo-acak. Saya juga menyadari bahwa menggunakan nomor yang sama, seperti set.seed(123)memastikan Anda dapat mereproduksi hasil. Tapi yang tidak saya dapatkan adalah apa arti nilai-nilai itu …

38 r random-generation

2

Interpretasi output R untuk regresi binomial

Saya cukup baru dalam hal ini dengan tes data binomial, tetapi perlu melakukan satu dan sekarang saya tidak yakin bagaimana menafsirkan hasilnya. Variabel y, variabel respons, adalah binomial dan faktor penjelasnya adalah kontinu. Inilah yang saya dapatkan ketika merangkum hasilnya: glm(formula = leaves.presence ~ Area, family = binomial, data = …

38 r regression logistic binomial interpretation

3

Turunkan Varians koefisien regresi dalam regresi linier sederhana

Dalam regresi linier sederhana, kita memiliki y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + u , di mana u∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2) . Saya menurunkan estimator: β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , manax¯x¯\bar{x} dany¯y¯\bar{y} adalah alat sampelxxxdanyyy. Sekarang saya ingin mencari varians …

38 regression mathematical-statistics variance linear-model regression-coefficients