Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data

1
Notasi subskrip dalam harapan
Apa arti sebenarnya dari notasi subskrip dalam harapan bersyarat dalam kerangka teori ukuran? Subskrip ini tidak muncul dalam definisi ekspektasi bersyarat, tetapi kita dapat melihat misalnya di halaman wikipedia ini . (Perhatikan bahwa itu tidak selalu terjadi, halaman yang sama beberapa bulan yang lalu).EX[f(X)]EX[f(X)]\mathbb{E}_X[f(X)] Apa yang seharusnya misalnya arti dengan …

3
Kapan harus menggunakan persamaan estimasi umum vs model efek campuran?
Saya cukup senang menggunakan model efek campuran untuk sementara waktu sekarang dengan data longitudinal. Saya berharap saya dapat menyesuaikan hubungan AR dengan Lmer (saya pikir saya benar bahwa saya tidak bisa melakukan ini?) Tapi saya tidak berpikir itu sangat penting sehingga saya tidak terlalu khawatir. Saya baru saja menemukan persamaan …
63 mixed-model  gee 


3
Referensi yang berisi argumen terhadap pengujian signifikansi hipotesis nol?
Dalam beberapa tahun terakhir saya telah membaca sejumlah makalah yang menentang penggunaan pengujian signifikansi nol hipotesis dalam sains, tetapi tidak berpikir untuk membuat daftar persisten. Seorang kolega baru-baru ini meminta saya daftar seperti itu, jadi saya pikir saya akan meminta semua orang di sini untuk membantu membangunnya. Untuk memulai, inilah …

10
Taleb dan Black Swan
Buku Taleb "The Black Swan" adalah buku terlaris New York Times ketika diterbitkan beberapa tahun yang lalu. Buku ini sekarang dalam edisi kedua. Setelah bertemu dengan ahli statistik di JSM (konferensi statistik tahunan), Taleb sedikit mengurangi kritiknya terhadap statistik. Tetapi tujuan buku ini adalah bahwa statistik tidak terlalu berguna karena …

8
Apakah PCA diikuti oleh rotasi (seperti varimax) masih PCA?
Saya telah mencoba mereproduksi beberapa penelitian (menggunakan PCA) dari SPSS di R. Dalam pengalaman saya, principal() fungsi dari paket psychadalah satu-satunya fungsi yang mendekati (atau jika ingatan saya benar, mati) untuk mencocokkan output. Untuk mencocokkan hasil yang sama seperti di SPSS, saya harus menggunakan parameter principal(..., rotate = "varimax"). Saya …





3
Apa perbedaan antara jaringan saraf dan jaringan kepercayaan yang mendalam?
Saya mendapat kesan bahwa ketika orang mengacu pada jaringan 'keyakinan mendalam' bahwa ini pada dasarnya adalah jaringan saraf tetapi sangat besar. Apakah ini benar atau apakah jaringan kepercayaan yang mendalam juga menyiratkan bahwa algoritma itu sendiri berbeda (yaitu, tidak ada umpan balik neural net tetapi mungkin sesuatu dengan loop umpan …

6
Mengapa algoritme k-means hanya menggunakan metrik jarak Euclidean?
Apakah ada tujuan khusus dalam hal efisiensi atau fungsionalitas mengapa algoritma k-means tidak menggunakan misalnya cosine (dis) kesamaan sebagai metrik jarak, tetapi hanya dapat menggunakan norma Euclidean? Secara umum, akankah metode K-means patuh dan benar ketika jarak selain Euclidean dipertimbangkan atau digunakan? [Tambahan oleh @ttnphns. Pertanyaannya adalah dua kali lipat. …

4
Asumsi tentang estimasi bootstrap ketidakpastian
Saya menghargai kegunaan bootstrap dalam memperoleh estimasi ketidakpastian, tetapi satu hal yang selalu mengganggu saya adalah distribusi yang sesuai dengan estimasi tersebut adalah distribusi yang ditentukan oleh sampel. Secara umum, sepertinya ide yang buruk untuk percaya bahwa frekuensi sampel kami terlihat persis seperti distribusi yang mendasarinya, jadi mengapa itu masuk …

3
Bagaimana cara sebenarnya memplot pohon contoh dari randomForest :: getTree ()? [Tutup]
Siapa pun mendapat saran pustaka atau kode tentang cara sebenarnya merencanakan beberapa pohon sampel dari: getTree(rfobj, k, labelVar=TRUE) (Ya saya tahu Anda tidak seharusnya melakukan ini secara operasional, RF adalah kotak hitam, dll. Saya ingin secara visual kewarasan-periksa pohon untuk melihat apakah ada variabel yang berperilaku berlawanan, perlu penyesuaian / …

3
Apa arti residu dalam regresi logistik?
Dalam menjawab pertanyaan ini John Christie menyarankan agar kecocokan model regresi logistik harus dinilai dengan mengevaluasi residu. Saya akrab dengan cara menafsirkan residu dalam OLS, mereka berada dalam skala yang sama dengan DV dan sangat jelas perbedaan antara y dan y yang diprediksi oleh model. Namun untuk regresi logistik, di …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.