Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data

27
Paradox Kecantikan Tidur
Situasi Beberapa peneliti ingin membuat Anda tertidur. Bergantung pada lemparan rahasia koin yang adil, mereka akan membangunkan Anda sebentar (Kepala) atau dua kali (Ekor) sebentar. Setelah setiap bangun, mereka akan membuat Anda kembali tidur dengan obat yang membuat Anda melupakan kebangkitan itu. Ketika Anda terbangun, sampai sejauh mana Anda harus …

8
Mengapa metode Newton tidak banyak digunakan dalam pembelajaran mesin?
Ini adalah sesuatu yang telah mengganggu saya untuk sementara waktu, dan saya tidak dapat menemukan jawaban yang memuaskan secara online, jadi begini: Setelah meninjau satu set ceramah tentang optimasi cembung, metode Newton tampaknya menjadi algoritma yang jauh lebih unggul daripada gradient descent untuk menemukan solusi optimal secara global, karena metode …

4
Kappa Cohen dalam bahasa Inggris sederhana
Saya membaca buku data mining dan disebutkan statistik Kappa sebagai sarana untuk mengevaluasi kinerja prediksi pengklasifikasi. Namun, saya tidak bisa mengerti ini. Saya juga memeriksa Wikipedia tetapi tidak membantu juga: https://en.wikipedia.org/wiki/Cohen's_kappa . Bagaimana kappa Cohen membantu dalam mengevaluasi kinerja prediksi pengklasifikasi? Apa isinya? Saya mengerti bahwa 100% kappa berarti bahwa …



9
Penjelasan dari bawah ke atas tentang jarak Mahalanobis?
Saya sedang mempelajari pengenalan pola dan statistik dan hampir setiap buku yang saya buka tentang subjek saya menabrak konsep jarak Mahalanobis . Buku-buku memberikan semacam penjelasan intuitif, tetapi masih belum cukup baik bagi saya untuk benar-benar mengerti apa yang sedang terjadi. Jika seseorang bertanya kepada saya, "Berapa jarak Mahalanobis?" Saya …

9
Memperoleh pengetahuan dari hutan acak
Hutan acak dianggap kotak hitam, tetapi baru-baru ini saya berpikir pengetahuan apa yang bisa diperoleh dari hutan acak? Hal yang paling jelas adalah pentingnya variabel, dalam varian paling sederhana dapat dilakukan hanya dengan menghitung jumlah kemunculan suatu variabel. Hal kedua yang saya pikirkan adalah interaksi. Saya berpikir bahwa jika jumlah …



6
Korelasi dengan variabel kategori tidak teratur
Saya memiliki dataframe dengan banyak pengamatan dan banyak variabel. Beberapa dari mereka adalah kategoris (tidak teratur) dan yang lainnya numerik. Saya mencari hubungan antara variabel-variabel ini. Saya sudah bisa menghitung korelasi untuk variabel numerik (korelasi Spearman) tetapi: Saya tidak tahu bagaimana mengukur korelasi antara variabel kategori tidak teratur. Saya tidak …



3
Mengapa kita membutuhkan sigma-aljabar untuk mendefinisikan ruang probabilitas?
Kami memiliki eksperimen acak dengan hasil berbeda yang membentuk ruang sampel yang kami perhatikan dengan minat pada pola tertentu, yang disebut eventsSigma-algebras (atau sigma-bidang) terdiri dari peristiwa di mana ukuran probabilitas dapat ditugaskan. Properti tertentu terpenuhi, termasuk dimasukkannya set nol dan seluruh ruang sampel, dan aljabar yang menggambarkan serikat pekerja …

21
Pada setiap langkah dari proses tak terbatas yang terbatas, masukkan 10 bola ke dalam guci dan lepaskan satu bola secara acak. Berapa banyak bola yang tersisa?
Pertanyaannya (sedikit dimodifikasi) adalah sebagai berikut dan jika Anda belum pernah menemukannya sebelum Anda dapat memeriksanya dalam contoh 6a, bab 2, dari Sheldon Ross ' Kursus Pertama dalam Kemungkinan : Misalkan kita memiliki guci besar tak terhingga dan koleksi bola tanpa batas berlabel nomor 1, nomor 2, nomor 3, dan …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.