Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data

5
Apa yang harus saya lakukan ketika jaringan saraf saya tidak belajar?
Saya melatih jaringan saraf tetapi kehilangan pelatihan tidak berkurang. Bagaimana saya bisa memperbaikinya? Saya tidak bertanya tentang overfitting atau regularisasi. Saya bertanya tentang bagaimana menyelesaikan masalah di mana kinerja jaringan saya tidak membaik pada set pelatihan . Pertanyaan ini sengaja diajukan secara umum sehingga pertanyaan lain tentang cara melatih jaringan …

6
Dapatkah analisis komponen utama diterapkan pada kumpulan data yang berisi campuran variabel kontinu dan kategorikal?
Saya memiliki dataset yang memiliki data kontinu dan kategorikal. Saya menganalisis dengan menggunakan PCA dan saya bertanya-tanya apakah boleh memasukkan variabel kategori sebagai bagian dari analisis. Pemahaman saya adalah bahwa PCA hanya dapat diterapkan pada variabel kontinu. Apakah itu benar? Jika tidak dapat digunakan untuk data kategorikal, alternatif apa yang …

7
Apa penjelasan intuitif yang ada untuk teorema limit pusat?
Dalam beberapa konteks yang berbeda kami menggunakan teorema batas pusat untuk membenarkan metode statistik apa pun yang ingin kami adopsi (misalnya, perkiraan distribusi binomial dengan distribusi normal). Saya memahami detail teknis mengapa teorema itu benar tetapi baru saja saya sadar bahwa saya tidak benar-benar memahami intuisi di balik teorema limit …



5
Bagaimana tepatnya satu "kontrol untuk variabel lain"?
Inilah artikel yang memotivasi pertanyaan ini: Apakah ketidaksabaran membuat kita gemuk? Saya menyukai artikel ini, dan itu dengan baik menunjukkan konsep "mengendalikan variabel-variabel lain" (IQ, karier, pendapatan, usia, dll) untuk mengisolasi hubungan yang sebenarnya antara hanya 2 variabel yang dipertanyakan. Bisakah Anda menjelaskan kepada saya bagaimana Anda sebenarnya mengontrol variabel …



8
Apakah Facebook akan segera berakhir?
Baru-baru ini , makalah ini telah menerima banyak perhatian (misalnya dari WSJ ). Pada dasarnya, penulis menyimpulkan bahwa Facebook akan kehilangan 80% anggotanya pada 2017. Mereka mendasarkan klaim mereka pada ekstrapolasi model SIR , model kompartemen yang sering digunakan dalam epidemiologi. Data mereka diambil dari pencarian Google untuk "Facebook", dan …

4
Pilihan K dalam validasi silang K-fold
Saya telah menggunakan KKK ganda lintas validasi beberapa kali sekarang untuk mengevaluasi kinerja beberapa algoritma belajar, tapi aku selalu bingung bagaimana aku harus memilih nilai .KKK Saya sering melihat dan menggunakan nilai K= 10K=10K = 10 , tetapi ini tampaknya benar-benar sewenang-wenang bagi saya, dan sekarang saya hanya menggunakan 101010 …

15
Penjelasan intuitif untuk membagi dengan
Saya ditanya hari ini di kelas mengapa Anda membagi jumlah kesalahan kuadrat dengan n−1n−1n-1 bukan dengan nnn , saat menghitung standar deviasi. Saya bilang saya tidak akan menjawabnya di kelas (karena saya tidak ingin masuk ke estimator yang tidak bias), tetapi kemudian saya bertanya-tanya - apakah ada penjelasan intuitif untuk …

7
Apa pengaruh C dalam SVM dengan kernel linear?
Saat ini saya menggunakan SVM dengan kernel linear untuk mengklasifikasikan data saya. Tidak ada kesalahan pada set pelatihan. Saya mencoba beberapa nilai untuk parameter ( ). Ini tidak mengubah kesalahan pada set tes.10 - 5 , … , 10 2CCC10−5,…,10210−5,…,10210^{-5}, \dots, 10^2 Sekarang saya bertanya-tanya: apakah ini kesalahan yang disebabkan …



2
Bagaimana cara menentukan distribusi mana yang paling cocok dengan data saya?
Saya memiliki dataset dan ingin mengetahui distribusi mana yang paling cocok dengan data saya. Saya menggunakan fitdistr()fungsi untuk memperkirakan parameter yang diperlukan untuk menggambarkan distribusi yang diasumsikan (yaitu Weibull, Cauchy, Normal). Dengan menggunakan parameter-parameter tersebut, saya dapat melakukan Tes Kolmogorov-Smirnov untuk memperkirakan apakah data sampel saya berasal dari distribusi yang …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.