Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data



2
Gradient Boosting Tree vs Random Forest
Penguatan pohon gradien seperti yang diusulkan oleh Friedman menggunakan pohon keputusan sebagai pelajar dasar. Saya bertanya-tanya apakah kita harus membuat pohon keputusan dasar serumit mungkin (dewasa) atau lebih sederhana? Apakah ada penjelasan untuk pilihannya? Random Forest adalah metode ensemble lain yang menggunakan pohon keputusan sebagai pelajar dasar. Berdasarkan pemahaman saya, …

8
Mendeteksi wajah tertentu dalam database gambar wajah
Saya sedang mengerjakan proyek kecil yang melibatkan wajah pengguna twitter melalui foto profil mereka. Masalah yang saya temui adalah bahwa setelah saya memfilter semua kecuali gambar yang merupakan foto potret yang jelas, sebagian kecil tapi signifikan pengguna twitter menggunakan gambar Justin Bieber sebagai gambar profil mereka. Untuk memfilternya, bagaimana saya …


6
Bagaimana Anda menjelaskan perbedaan antara korelasi dan kovarian?
Menindaklanjuti pertanyaan ini, Bagaimana Anda menjelaskan kovarians kepada seseorang yang hanya mengerti maksudnya? , yang membahas masalah menjelaskan kovarians kepada orang awam, mengemukakan pertanyaan serupa di benak saya. Bagaimana orang menjelaskan kepada orang baru tentang perbedaan antara kovarians dan korelasi ? Tampaknya keduanya merujuk pada perubahan dalam satu variabel yang …




4
Apa aturan .632+ dalam bootstrap?
Di sini @gung membuat referensi ke aturan .632+. Pencarian Google cepat tidak menghasilkan jawaban yang mudah dimengerti tentang apa arti aturan ini dan untuk tujuan apa aturan itu digunakan. Apakah seseorang tolong jelaskan aturan .632+?
107 bootstrap 

6
Apakah ada interpretasi intuitif dari
Untuk matriks data diberikan (dengan variabel dalam kolom dan titik data dalam baris), sepertinya A T A memainkan peran penting dalam statistik. Sebagai contoh, ini adalah bagian penting dari solusi analitik kuadrat terkecil biasa. Atau, untuk PCA, vektor eigennya adalah komponen utama data.AAAATAATAA^TA Saya mengerti bagaimana menghitung , tapi saya …



7
Mengapa akurasi bukan ukuran terbaik untuk menilai model klasifikasi?
Ini adalah pertanyaan umum yang ditanyakan secara tidak langsung beberapa kali di sini, tetapi tidak memiliki jawaban otoritatif tunggal. Alangkah baiknya memiliki jawaban terperinci untuk ini sebagai referensi. Akurasi , proporsi klasifikasi yang benar di antara semua klasifikasi, adalah ukuran yang sangat sederhana dan sangat "intuitif", namun itu mungkin ukuran …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.